MySQL Table：修订间差异

2023年11月20日 (一) 14:34的最新版本

普通表

create table test_seq (
   ky               int auto_increment,
   val              varchar(50),
   ver              json,
   primary key(ky)
)
ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE= utf8mb4_0900_ai_ci
auto_increment = 10000000

CREATE INDEX i_test_seq_val ON test_seq(val);

排序规则

utf8mb4_0900_ai_ci
utf8mb4_unicode_ci
utf8mb4_general_ci

当设置表的默认字符集为 utf8mb4 字符集但未明确指定排序规则时：

在 MySQL 5.7 版本中，默认排序规则为 utf8mb4_general_ci
在 MySQL 8.0 版本中，默认排序规则为 utf8mb4_0900_ai_ci

utf8mb4_general_ci 一个遗留的校对规则，不支持扩展，它仅能够在字符之间进行逐个比较，这意味着 utf8mb4_general_ci 校对规则进行的比较和排序的时候速度很快。但没有实现 Unicode 排序规则，在遇到某些特殊语言或者字符集，排序结果可能不一致。

utf8mb4_unicode_ci 是基于标准的 Unicode 来排序和比较，能够在各种语言之间精确排序。如对于德语和法语。

将 MySQL 8.0 版本的表导入到 MySQL 5.7 或以下版本时，可能会存在字符集无法识别的问题

[Err] 1273 - Unknown collation: 'utf8mb4_0900_ai_ci'

自增主键

auto_increment 为自增主键（该列必须设为主键），一般使用 int（小于 42 亿）。不支持 decimal(10) 这种字段格式
auto_increment 也可以使用 double 这种浮点数格式，自增 +1，但可以指定插入 10.1 这种（表中最大自增为 10.1 时，下一个系统自增是 11）

insert into test_seq(val, ver) values
 ('mysql', '{"v1":"10", "v2":"11"}'),
 ('db2', '{"v1":"8", "v3":"9"}')

JSON

SELECT   ky,
         val,
         ver ->> '$.v1'   v1,
         ver ->> '$.v2'   v2,
         ver ->> '$.v3'   v3
FROM     test_seq

"->" 带引号，"->>"无引号
无字段则值返回空

分区表

alter table test_seq partition by hash(ky) partitions 64;

最多支持 1024 个分区，同时总数量受库参数打开文件数量限制。

临时表

CREATE TEMPORARY TABLE

表结构、数据均存放在内存中
临时表在连接使用期间存在，断开时，MySQL 将自动删除表并释放所用的空间
不能用 rename 来重命名一个临时表，可以用 alter table 代替

数据库存储引擎

InnoDB 支持事务，MyISAM 不支持。对于 InnoDB 每一条 SQL 语句都默认封装成事务进行提交，这样就会影响速度，优化速度的方式是将多条 SQL 语句放在 begin 和 commit 之间，组成一个事务。InnoDB 支持外键，而 MyISAM 不支持
将查询要求比较多的表选择 MyISAM 存储
用于查询的表，也可以考虑选择 MEMORY 存储引擎

索引

InnoDB 中 B+ 树的数据结构中存储的都是实际的数据，这种索引有被称为聚集索引
MyISAM 中 B+ 树的数据结构存储的内容是实际数据的地址值，它的索引和实际数据是分开的，只不过使用索引指向了实际数据。这种索引的模式被称为非聚集索引

InnoDB

读写数据时是硬盘寻址，要减少这个硬盘寻址读取的次数，一般是按页读取数据，并可使用内存缓存。InnoDB 将一个表的数据划分成了若干页（pages），这些页通过 B-Tree 索引联系起来。每一页大小默认为 16384 Bytes （innodb_page_size）。这个 B-Tree 索引就是聚簇索引（Clustered Index），如果表有主键，那么主键索引就是这个聚簇索引。

InnoDB 对于变长字段，一般倾向于将他们存储在其他地方。至于怎么存储，这个还和 InnoDB 行格式（InnoDB Row Format）有关。行格式一共有四种：Compact、Redundant、Dynamic 和 Compressed。

COMPACT 和更老一点的 REDUNDANT 行格式中，对于占用空间较大的列，在该记录行存储该列的一部分数据（前 768 个字节），把剩余的数据存储在溢出页，用 20 个字节存储存储溢出数据的地址。
DYNAMIC 和 COMPRESSED 行格式把溢出列的所有数据都存储在溢出页当中，用 20 个字节去记录这些溢出数据的地址
COMPRESSED 比 DYNAMIC会多做一步：采用压缩算法对页面进行压缩

MyISAM

内存表

ENGINE=MEMORY

表结构保存在磁盘上，数据存放在内存中（重启会只有结构）。MEMORY 快大概 20％。

内存表的数据存放在内存中，而内部临时表（如查询时产生的）一般放在内存中，但当内部临时表较大时，会自动转化为磁盘存储。内存表不会自动转换。

数据使用 hash 的方式存储，故只支持 = 或 <>
max_heap_table_size 默认为 16777216，单张表行数超过则报错
对于 varchar 等变长类型，使用最大的长度
可以有非唯一键
不能包含 BLOB 或者 TEXT
支持 AUTO_INCREMENT
不支持事务，表锁
可能会插入延迟，使读取优先

@@ 第5行： / 第5行： @@
      ver              json,
      primary key(ky)
-  ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci
+  )
+ ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE= utf8mb4_0900_ai_ci
   auto_increment = 10000000
@@ 第11行： / 第12行： @@
 ==== 排序规则 ====
 * utf8mb4_0900_ai_ci
 * utf8mb4_unicode_ci
@@ 第17行： / 第17行： @@
 当设置表的默认字符集为 utf8mb4 字符集但未明确指定排序规则时：
 * 在 MySQL 5.7 版本中，默认排序规则为 utf8mb4_general_ci
 * 在 MySQL 8.0 版本中，默认排序规则为 utf8mb4_0900_ai_ci
@@ 第30行： / 第29行： @@
 ==== 自增主键 ====
-* auto_increment 为自增主键（该序必须设为主键），一般使用 int（小于 42 亿）。不支持 decimal(10) 这种字段格式
+* auto_increment 为自增主键（该列必须设为主键），一般使用 int（小于 42 亿）。不支持 decimal(10) 这种字段格式
-* auto_increment 也可以使用 double 这种浮点数格式，自增 +1，但可以指定插入 10.1 这种（下一个自增是 11）
+* auto_increment 也可以使用 double 这种浮点数格式，自增 +1，但可以指定插入 10.1 这种（表中最大自增为 10.1 时，下一个系统自增是 11）
-* 一般排序规则默认为：utf8_unicode_ci，ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 默认值是库带过来的
   insert into test_seq(val, ver) values
@@ 第50行： / 第48行： @@
 === 分区表 ===
+ alter table test_seq partition by hash(ky) partitions 64;
 最多支持 1024 个分区，同时总数量受库参数打开文件数量限制。
@@ 第59行： / 第58行： @@
 * 不能用 rename 来重命名一个临时表，可以用 alter table 代替
-=== 内存表 ===
+=== 数据库存储引擎 ===
+* InnoDB 支持事务，MyISAM 不支持。对于 InnoDB 每一条 SQL 语句都默认封装成事务进行提交，这样就会影响速度，优化速度的方式是将多条 SQL 语句放在 begin 和 commit 之间，组成一个事务。InnoDB 支持外键，而 MyISAM 不支持
+* 将查询要求比较多的表选择 MyISAM 存储
+* 用于查询的表，也可以考虑选择 MEMORY 存储引擎
+索引
+* InnoDB 中 B+ 树的数据结构中存储的都是实际的数据，这种索引有被称为聚集索引
+* MyISAM 中 B+ 树的数据结构存储的内容是实际数据的地址值，它的索引和实际数据是分开的，只不过使用索引指向了实际数据。这种索引的模式被称为非聚集索引
+==== InnoDB ====
+读写数据时是硬盘寻址，要减少这个硬盘寻址读取的次数，一般是按页读取数据，并可使用内存缓存。InnoDB 将一个表的数据划分成了若干页（pages），这些页通过 B-Tree 索引联系起来。每一页大小默认为 16384 Bytes （innodb_page_size）。这个 B-Tree 索引就是聚簇索引（Clustered Index），如果表有主键，那么主键索引就是这个聚簇索引。
+InnoDB 对于变长字段，一般倾向于将他们存储在其他地方。至于怎么存储，这个还和 InnoDB 行格式（InnoDB Row Format）有关。行格式一共有四种：Compact、Redundant、Dynamic 和 Compressed。
+* COMPACT 和更老一点的 REDUNDANT 行格式中，对于占用空间较大的列，在该记录行存储该列的一部分数据（前 768 个字节），把剩余的数据存储在溢出页，用 20 个字节存储存储溢出数据的地址。
+* DYNAMIC 和 COMPRESSED 行格式把溢出列的所有数据都存储在溢出页当中，用 20 个字节去记录这些溢出数据的地址
+* COMPRESSED 比 DYNAMIC会多做一步：采用压缩算法对页面进行压缩
+==== MyISAM ====
+==== 内存表 ====
 ENGINE='''MEMORY'''
@@ 第74行： / 第95行： @@
 * 不支持事务，表锁
 * 可能会插入延迟，使读取优先
+[[分类:Develop]]
+[[分类:DB]]
+[[分类:MySQL]]

MySQL Table：修订间差异

2023年11月20日 (一) 14:34的最新版本

目录

普通表

排序规则

自增主键

JSON

分区表

临时表

数据库存储引擎

InnoDB

MyISAM

内存表

导航菜单

MySQL Table：修订间差异

2023年11月20日 (一) 14:34的最新版本

普通表

排序规则

自增主键

JSON

分区表

临时表

数据库存储引擎

InnoDB

MyISAM

内存表

导航菜单

搜索