MySQL分区表中分区键必须是主键一部分的原因是什么(mysql,开发技术)

MySQL分区表中分区键必须是主键一部分的原因是什么

导读：本文共6987.5字符，通常情况下阅读需要23分钟。同时您也可以点击右侧朗读，来听本文内容。按键盘←（左） →（右）方向键可以翻页。

摘要：前言：分区是一种表的设计模式，通俗地讲表分区是将一大表，根据条件分割成若干个小表。但是对于应用程序来讲，分区的表和没有分区的表是一样的。换句话来讲，分区对于应用是透明的，只是数据库对于数据的重新整理随着业务的不断发展，数据库中的数据会越来越多，相应地，单表的数据量也会越到越大，大到一个临界值，单表的查询性能就会下降。这个临界值，并不能一概而论，它与硬件能力、具体... ...

音频解说

ThesefeaturesarenotcurrentlyimplementedinMySQLPartitioning,butarehighonourlistofpriorities.-QueriesinvolvingaggregatefunctionssuchasSUM()andCOUNT()caneasilybeparallelized.AsimpleexampleofsuchaquerymightbeSELECTsalesperson_id,COUNT(orders)asorder_totalFROMsalesGROUPBYsalesperson_id;.By“parallelized,”wemeanthatthequerycanberunsimultaneouslyoneachpartition,andthefinalresultobtainedmerelybysummingtheresultsobtainedforallpartitions.-Achievinggreaterquerythroughputinvirtueofspreadingdataseeksovermultipledisks.

MySQL 8.0 中分区表的变化

在 MySQL 5.7 中，对于分区表，有个很重大的更新，即 InnoDB 存储引擎原生支持了分区，无需再通过 ha_partition 接口来实现。

所以，在 MySQL 5.7 中，如果要创建基于 MyISAM 存储引擎的分区表，会提示 warning 。

Thepartitionengine,usedbytable'sbtest.t_range',isdeprecatedandwillberemovedinafuturerelease.Pleaseusenativepartitioninginstead.

而在 MySQL 8.0 中，则更为彻底，server 层移除了 ha_partition 接口代码。

如果要使用分区表，只能使用支持原生分区的存储引擎。在 MySQL 8.0 中，就只有 InnoDB。

这就意味着，在 MySQL 8.0 中，如果要创建 MyISAM 分区表，基本上就不可能了。

这也从另外一个角度说明了为什么生产上不建议使用 MyISAM 表。

mysql>CREATETABLEt_range(->idINT,->nameVARCHAR(10)->)ENGINE=MyISAM->PARTITIONBYRANGE(id)(->PARTITIONp0VALUESLESSTHAN(5),->PARTITIONp1VALUESLESSTHAN(10)->);ERROR1178(42000):Thestorageengineforthetabledoesn'tsupportnativepartitioning

为什么分区键必须是主键的一部分？

在使用分区表时，大家常常会碰到下面这个报错。

mysql>CREATETABLEopr(->opr_noINT,->opr_dateDATETIME,->descriptionVARCHAR(30),->PRIMARYKEY(opr_no)->)->PARTITIONBYRANGECOLUMNS(opr_date)(->PARTITIONp0VALUESLESSTHAN('20210101'),->PARTITIONp1VALUESLESSTHAN('20210102'),->PARTITIONp2VALUESLESSTHANMAXVALUE->);ERROR1503(HY000):APRIMARYKEYmustincludeallcolumnsinthetable'spartitioningfunction(prefixedcolumnsarenotconsidered).

即分区键必须是主键的一部分。

上面的 opr 是一张操作流水表。其中，opr_no 是操作流水号，一般都会被设置为主键，opr_date 是操作时间。基于操作时间来进行分区，是一个常见的分区场景。

为了突破这个限制，可将opr_date 作为主键的一部分。

mysql>CREATETABLEopr(->opr_noINT,->opr_dateDATETIME,->descriptionVARCHAR(30),->PRIMARYKEY(opr_no,opr_date)->)->PARTITIONBYRANGECOLUMNS(opr_date)(->PARTITIONp0VALUESLESSTHAN('20210101'),->PARTITIONp1VALUESLESSTHAN('20210102'),->PARTITIONp2VALUESLESSTHANMAXVALUE->);QueryOK,0rowsaffected(0.04sec)

但是这么创建，又会带来一个新的问题，即对于同一个 opr_no ，可插入到不同分区中。

mysql>CREATETABLEopr(->opr_noINT,->opr_dateDATETIME,->descriptionVARCHAR(30),->PRIMARYKEY(opr_no,opr_date)->)->PARTITIONBYRANGECOLUMNS(opr_date)(->PARTITIONp0VALUESLESSTHAN('20210101'),->PARTITIONp1VALUESLESSTHAN('20210102'),->PARTITIONp2VALUESLESSTHANMAXVALUE->);QueryOK,0rowsaffected(0.04sec)mysql>insertintooprvalues(1,'2020-12-3100:00:01','abc');QueryOK,1rowaffected(0.00sec)mysql>insertintooprvalues(1,'2021-01-0100:00:01','abc');QueryOK,1rowaffected(0.00sec)mysql>select*fromoprpartition(p0);+--------+---------------------+-------------+|opr_no|opr_date|description|+--------+---------------------+-------------+|1|2020-12-3100:00:01|abc|+--------+---------------------+-------------+1rowinset(0.00sec)mysql>select*fromoprpartition(p1);+--------+---------------------+-------------+|opr_no|opr_date|description|+--------+---------------------+-------------+|1|2021-01-0100:00:01|abc|+--------+---------------------+-------------+1rowinset(0.00sec)

这实际上违背了业务对于 opr_no 的唯一性要求。

既然这样，有的童鞋会建议给opr_no 添加个唯一索引，But，现实是残酷的。

mysql>createuniqueindexuk_opr_noonopr(opr_no);ERROR1503(HY000):AUNIQUEINDEXmustincludeallcolumnsinthetable'spartitioningfunction(prefixedcolumnsarenotconsidered)

即便是添加唯一索引，分区键也必须包含在唯一索引中。

总而言之，对于 MySQL 分区表，无法从数据库层面保证非分区列在表级别的唯一性，只能确保其在分区内的唯一性。

这也是 MySQL 分区表所为人诟病的地方之一。

但实际上，这个锅让 MySQL 背并不合适，对于 Oracle 索引组织表（ InnoDB 即是索引组织表），同样也有这个限制。

Oracle 官方文档（ http://docs.oracle.com/cd/E11882_01/server.112/e40540/schemaob.htm#CNCPT1514），在谈到索引组织表（Index-Organized Table，简称 IOT）的特性时，就明确提到了 “分区键必须是主键的一部分”。

NotethefollowingcharacteristicsofpartitionedIOTs:-Partitioncolumnsmustbeasubsetofprimarykeycolumns.-Secondaryindexescanbepartitionedlocallyandglobally.-OVERFLOWdatasegmentsarealwaysequipartitionedwiththetablepartitions.

下面，我们看看刚开始的建表 SQL ，在 Oracle 中的执行效果。

SQL>CREATETABLEopr_oracle(opr_noNUMBER,opr_dateDATE,descriptionVARCHAR2(30),PRIMARYKEY(opr_no))ORGANIZATIONINDEXPARTITIONBYRANGE(opr_date)(PARTITIONp0VALUESLESSTHAN(TO_DATE('20170713','yyyymmdd')),PARTITIONp1VALUESLESSTHAN(TO_DATE('20170714','yyyymmdd')),PARTITIONp2VALUESLESSTHAN(MAXVALUE));PARTITIONBYRANGE(opr_date)(*ERRORatline8:ORA-25199:partitioningkeyofaindex-organizedtablemustbeasubsetoftheprimarykey

同样报错。

注意：这里指定了 ORGANIZATION INDEX ，创建的是索引组织表。

看来，分区键必须是主键的一部分并不是 MySQL 的限制，而是索引组织表的限制。

之所以对索引组织表有这样的限制，个人认为，还是基于性能考虑。

假设分区键和主键是两个不同的列，在进行插入操作时，虽然也指定了分区键，但还是需要扫描所有分区才能判断插入的主键值是否违反了唯一性约束。这样的话，效率会比较低下，违背了分区表的初衷。

而对于堆表则没有这样的限制。

在堆表中，主键和表中的数据是分开存储的，在判断插入的主键值是否违反唯一性约束时，只需利用到主键索引。

但与 MySQL 不一样的是，Oracle 实现了全局索引，所以针对上面的，同一个 opr_no，允许插入到不同分区中的问题，可通过全局唯一索引来规避。

SQL>CREATETABLEopr_oracle(opr_noNUMBER,opr_dateDATE,descriptionVARCHAR2(30),PRIMARYKEY(opr_no,opr_date))ORGANIZATIONINDEXPARTITIONBYRANGE(opr_date)(PARTITIONp0VALUESLESSTHAN(TO_DATE('20170713','yyyymmdd')),PARTITIONp1VALUESLESSTHAN(TO_DATE('20170714','yyyymmdd')),PARTITIONp2VALUESLESSTHAN(MAXVALUE));Tablecreated.SQL>createuniqueindexuk_opr_noonopr_oracle(opr_no);Indexcreated.SQL>insertintoopr_oraclevalues(1,to_date('2020-12-3100:00:01','yyyy-mm-ddhh34:mi:ss'),'abc');1rowcreated.SQL>insertintoopr_oraclevalues(1,to_date('2020-12-3100:00:01','yyyy-mm-ddhh34:mi:ss'),'abc');insertintoopr_oraclevalues(1,to_date('2020-12-3100:00:01','yyyy-mm-ddhh34:mi:ss'),'abc')*ERRORatline1:ORA-00001:uniqueconstraint(SCOTT.SYS_IOT_TOP_87350)violated

但 MySQL 却无能为力，之所以会这样，是因为 MySQL 分区表只实现了本地分区索引（Local Partitioned Index），而没有实现 Oracle 中的全局索引（Global Index）。

本地分区索引 VS 全局索引

本地分区索引和全局索引的原理图如下所示：

MySQL分区表中分区键必须是主键一部分的原因是什么

结合原理图，我们来看看两种索引之间的区别：

本地分区索引同时也是分区索引，分区索引和表分区之间是一一对应的。

而全局索引，既可以是分区的，也可以是不分区的。
如果是全局分区索引，一个分区索引可对应多个表分区，同样，一个表分区也可对应多个分区索引。

对本地分区索引的管理操作只会影响到单个分区，不会影响到其它分区。

而对全局分区索引的管理操作会造成整个索引的失效，当然，这一点可通过 UPDATE INDEXES 子句加以规避。

本地分区索引只能保证分区内的唯一性，无法保证表级别的唯一性，但全局分区可以。
在 Oracle 中，无论是索引组织表还是堆表，如果要创建本地唯一索引，同样也要求分区键必须是唯一键的一部分。

SQL>createuniqueindexuk_opr_no_localonopr_oracle(opr_no)local;createuniqueindexuk_opr_no_localonopr_oracle(opr_no)local*ERRORatline1:ORA-14039:partitioningcolumnsmustformasubsetofkeycolumnsofaUNIQUEindex

 </div> <div class="zixun-tj-product adv-bottom"></div> </div> </div> <div class="prve-next-news">

本文：MySQL分区表中分区键必须是主键一部分的原因是什么的详细内容，希望对您有所帮助，信息来源于网络。

MySQL分区表中分区键必须是主键一部分的原因是什么(mysql,开发技术)

目录

水平拆分 VS 垂直拆分

分区表

MySQL 8.0 中分区表的变化

为什么分区键必须是主键的一部分？

本地分区索引 VS 全局索引

8 人围观 / 0 条评论 ↓快速评论↓

搜索

最新文章

猜你喜欢

特价优惠

标签

流量统计