SQL中的partition分区功能使用_F11 - 专业站长和开发者的学习网站

本站首页收藏本站

广告位联系

APP正在开发中...

返回顶部

分享到

SQL中的partition分区功能使用

MsSql 来源：互联网作者：佚名发布时间：2024-12-14 21:40:01 人浏览

摘要

需求来源今天甲方这边要查看一个机车的周时数据（就是一个机车从到我的管辖范围内，到出我的管辖内所用的时间），那这个它会跑很多次，我们要查询这一天的周时数据，锚定一个点比如

需求来源

今天甲方这边要查看一个机车的周时数据（就是一个机车从到我的管辖范围内，到出我的管辖内所用的时间），那这个它会跑很多次，我们要查询这一天的周时数据，锚定一个点比如出管辖区的时间，那么根据查询到今天所有这个时间范围内出去的车信息，然后去数据表里找这个机车进来的数据且时最新的一条就行了。

实现思路

分两次查询的第一次查询出来所有的当天出管辖区的机车信息，第二个查询是根据第一个查询小小的改动，把时间范围去掉就好，然后根据机车信息进行组取时间每个机车时间最新的数据就好。直接使用group by，但是这个并不能取出其它的信息所以就pass掉了。GPTl了一下给的方案是使用partition这个功能。

实施

就不看项目数据了就看一下我写的小demo的结果吧。我有一个student表，这个表里有10个班的学生，每个班的学生有20个，我现在要取出每个班的学生id最大的这个记录，就可以使用这个partition了。

1	select * from (SELECT *, ROW_NUMBER() over (partition by classes_id order by id desc) as rn FROM `student`) a where rn=1

解释一下这个啊。

这条 SQL 语句使用了窗口函数 ROW_NUMBER() 来为每个 classes_id 组中的行编号，并在外部查询中只选择每个 classes_id 组中的最新一行（根据 id 倒序排序）。以下是对这条 SQL 语句的详细解释：

SQL 语句结构

SELECT *

FROM (

SELECT *,

ROW_NUMBER() OVER (PARTITION BY classes_id ORDER BY id DESC) AS rn

FROM `student`

) a

WHERE rn = 1;

内部查询（子查询）

SELECT *,

ROW_NUMBER() OVER (PARTITION BY classes_id ORDER BY id DESC) AS rn

FROM `student`

SELECT *：

选择 student 表中的所有列。

ROW_NUMBER() OVER (PARTITION BY classes_id ORDER BY id DESC) AS rn：

ROW_NUMBER() 是一个窗口函数，它为结果集中的每一行分配唯一的行号。
- OVER 子句定义了窗口的分区和排序规则： PARTITION BY classes_id：将结果集按 classes_id 列进行分组。对于每个 classes_id，将重新开始编号。
- ORDER BY id DESC：在每个 classes_id 分区中，按照 id 列的降序排序。
AS rn：将生成的行号列命名为 rn。

这部分查询为每个 classes_id 组中的行编号，编号从1开始，按照 id 倒序排列。因此，rn 为1的行是每个 classes_id 组中 id 最大的行。

外部查询

SELECT *

FROM (

SELECT *,

ROW_NUMBER() OVER (PARTITION BY classes_id ORDER BY id DESC) AS rn

FROM `student`

) a

WHERE rn = 1;

FROM (...) a：

将内部查询的结果作为一个临时表 a。

WHERE rn = 1：

筛选出临时表 a 中 rn 等于 1 的行，即每个 classes_id 组中 id 最大的行。结果

整个查询的作用是：

对 student 表进行分组（按 classes_id）。
在每个 classes_id 组中，按 id 倒序排列，并为每行分配一个行号 rn。
选择每个 classes_id 组中 rn 等于 1 的行（即每个 classes_id 组中 id 最大的行）。

partition的升级使用

partition不仅仅可以在日常查询中使用，还可以在表的数据结构上进行优化，比如在建表的时候创建分区或者后期添加分区，这个分区操作是在物理上的操作，可以看我下面这张表的结构，有一部分注释说明就是分区的设置，

对表进行分区可以提升查询性能和数据管理的效率。由于 ENGINE=MyISAM 不支持分区，我们需要将表的存储引擎更改为 InnoDB，因为 InnoDB 支持分区。

假设我们要根据 id 列进行范围分区，将数据划分为四个分区：

p0：包含 id 小于 10000的数据。
p1：包含 id 小于 20000的数据。
p2：包含 id 小于 50000的数据。
p3：包含其余的数据。

PARTITION BY RANGE (id) (

PARTITION p0 VALUES LESS THAN (10000),

PARTITION p1 VALUES LESS THAN (20000),

PARTITION p2 VALUES LESS THAN (50000),

PARTITION p3 VALUES LESS THAN MAXVALUE

);

解释

PARTITION BY RANGE (id): 根据 id 列进行范围分区。
PARTITION p0 VALUES LESS THAN (10000): 第一个分区，包含 id 小于 10000的数据。
PARTITION p1 VALUES LESS THAN (20000): 第二个分区，包含 id 小于 20000的数据。
PARTITION p2 VALUES LESS THAN (50000): 第三个分区，包含 id 小于 50000的数据。
PARTITION p3 VALUES LESS THAN MAXVALUE: 第四个分区，包含 id 大于等于 50000的数据。

这样，表 products 就被划分为四个分区，每个分区包含一定范围的 id 值的数据。

验证一下看看分区

上面说了创建分区了，但是怎么才能确定我们的查询sql使用到了分区呢？使用explain来查看执行的sql有没有在分区的范围呢，
下面是使用了explain查看执行的sql有没有用到分区，partition的值为p0对应了上面设置的分区。

分区的一些操作

创建分区后，数据库管理系统会自动处理分区的数据存储和检索，用户在日常操作中并不需要特殊处理分区。不过，你可以通过一些特定的查询和操作来利用分区的优势。以下是一些常见的用法示例：

1. 普通查询

普通的查询不需要特别处理分区，数据库管理系统会自动根据分区优化查询：

1	SELECT * FROM student WHERE id < 50;

2. 分区表上的查询优化

当你的查询条件包含分区键时，数据库会自动选择相关的分区进行查询，从而提高查询性能。例如：

1	SELECT * FROM student WHERE id BETWEEN 50 AND 100;

3. 插入数据

插入数据时，数据库会根据分区键自动将数据插入到相应的分区：

1	INSERT INTO student (name, classes_id) VALUES ('Alice', 1);

4. 删除分区中的数据

可以通过分区键删除特定分区中的数据：

1	DELETE FROM student WHERE id < 50;

5. 分区维护操作

你可以进行一些特定的分区维护操作，例如合并分区、拆分分区、删除分区等：

添加新的分区

ALTER TABLE student ADD PARTITION (

PARTITION p4 VALUES LESS THAN (200)

);

删除分区

1	ALTER TABLE student DROP PARTITION p0;

重组分区

可以将多个分区合并为一个分区：

ALTER TABLE student REORGANIZE PARTITION p1, p2 INTO (

PARTITION p1_2 VALUES LESS THAN (150)

);

6. 检查分区信息

你可以使用 SHOW 语句查看表的分区信息：

1	SHOW CREATE TABLE student;

总结

综合示例展示了如何创建分区表、插入数据以及进行查询和维护操作：

-- 创建分区表

CREATE TABLE `student` (

`id` int NOT NULL AUTO_INCREMENT,

`name` varchar(255) DEFAULT NULL,

`classes_id` int DEFAULT NULL,

PRIMARY KEY (`id`),

KEY `FK4l5dnicegnvpmu0pv6vdvrmb6` (`classes_id`)

) ENGINE=InnoDB AUTO_INCREMENT=201 DEFAULT CHARSET=utf8mb3

PARTITION BY RANGE (id) (

PARTITION p0 VALUES LESS THAN (50),

PARTITION p1 VALUES LESS THAN (100),

PARTITION p2 VALUES LESS THAN (150),

PARTITION p3 VALUES LESS THAN MAXVALUE

);

-- 插入数据

INSERT INTO student (name, classes_id) VALUES ('Alice', 1);

INSERT INTO student (name, classes_id) VALUES ('Bob', 2);

-- 查询数据

SELECT * FROM student WHERE id < 50;

-- 删除分区中的数据

DELETE FROM student WHERE id < 50;

-- 添加新分区

ALTER TABLE student ADD PARTITION (

PARTITION p4 VALUES LESS THAN (200)

);

-- 删除分区

ALTER TABLE student DROP PARTITION p0;

-- 检查分区信息

SHOW CREATE TABLE student;

目前先整理这么多，以后有深入学习使用了再继续！！！

您可能感兴趣的文章 :

原文链接 :

Tag : sql(108)分区(4)

怎么安装SQL Server 2016及SQL Server Management Studio安装

一、安装SQL Server 2016 1.准备SQL Server 2016的安装包 SQL Server 2016可在官网上进行下载； 2.解压安装包将下载的SQL Server2016的安装包解压，找到
SQL中的partition分区功能使用

需求来源今天甲方这边要查看一个机车的周时数据（就是一个机车从到我的管辖范围内，到出我的管辖内所用的时间），那这个它会跑很多
SQL Server使用Windows身份验证与JDBC连接数据库的操

什么是 Windows 身份验证 Windows 身份验证（也称为集成安全性）是 SQL Server 提供的一种身份验证方式，它允许 SQL Server 使用 Windows 用户账户来
SQL Server使用T-SQL创建数据库的操作

功能和特性上： SQL server的管理工具（SQL Server Management Studio）功能强大，适合企业级应用。支持更多的数据类型，如 XML、JSON、地理空间数据
sql中的regexp与like区别实现介绍

1、REGEXP 用途：高级字符串匹配，使用正则表达式。特点：灵活性强，能进行复杂模式匹配（如开头、结尾、字符集等）。基本语法： 1
SQLServer日志收缩的两种方法

在日常运维中，有时会遇到The transaction log for database xxxx is full due to ACTIVE_TRANSACTION.这样的报错信息。此错误消息表明：数据库的事务日志文
Sql Server查询卡顿的排查方法

本篇为理论知识的分析以及对症下药，前阵子发生过Bug，后通过迁移服务器以及数据库最终才解决问题，但是细想当时可能是因为碎片或者
sql server安装及使用全流程

一、安装SQL Server 1.到微软官网下载SQL Server Developer版本，现在的最新版本是SQL Server 2019 Developer。微软官网传送门：点击此处直达 2.下载完成
SQL Povit函数使用及实例

PIVOT函数常用于数据的行转列，同时也可以用此函数实现类似于Excel中的数据透视表的效果。 PIVOT函数 PIVOT 函数的基本语法如下： 1 2 3 4 5
Navicat连接SQL server出现：[IM002] [Microsoft][ODBC 驱动

问题解决方法一找到Navicat的安装路径，然后找到sqlncli_x64.msi文件并安装，安装成功后重启Navicat重新进行连接，看是否成功。解决方法二