字符集是一套符号和编码,校验规则是字符集内用来比较字符的一些规则,也就是字符集的排序规则。MySQL可以使用多种字符集和检验规则来组织字符。

MySQL服务器支持多种字符集,在同一台服务器、同一个数据库甚至是同一个表的不同字段都可以使用不同的字符集。

每种字符集都可能有多种校验规则,并且都有一个默认的校验规则。每个校验规则只针对某个字符集,与其他字符集没有关系。

在MySQL中,字符集的概念和编码方案被看作同义词,一个字符集是一个转换表和一个编码方案的组合。

我们怎么查看我们的数据库支持的字符集呢?

show character set;

查看字符集的校验规则:

show collation;

然后就会哒哒哒地出一堆东西出来,就是你服务器支持的字符集校验规则了。

怎么查看当前数据库的字符集呢?输下面这个命令就好了

show variables like 'character%'\G

然后就会弹出下面这样一堆东西(具体的字符集可能和我这的不一样)

*************************** 1. row ***************************
Variable_name: character_set_client
        Value: gbk
*************************** 2. row ***************************
Variable_name: character_set_connection
        Value: gbk
*************************** 3. row ***************************
Variable_name: character_set_database
        Value: utf8
*************************** 4. row ***************************
Variable_name: character_set_filesystem
        Value: binary
*************************** 5. row ***************************
Variable_name: character_set_results
        Value: gbk
*************************** 6. row ***************************
Variable_name: character_set_server
        Value: utf8mb4
*************************** 7. row ***************************
Variable_name: character_set_system
        Value: utf8
*************************** 8. row ***************************
Variable_name: character_sets_dir
        Value: E:\programFiles\mysql-8.0.21-winx64\share\charsets\
8 rows in set, 1 warning (0.01 sec)

来解释一下这些variable_name的意思

character_set_client:客户端请求数据的字符集

character_set_connection:客户机/服务器连接的字符集

character_set_database:默认数据库的字符集。无论默认数据库如何改变,都是这个字符集;如果没有默认字符集,那就使用character_set_server指定的字符集。这个变量最好不要人为定义。

character_set_filesystem: 把os上的文件名转化成此字符集。也就是说,把character_set_client转换为character_set_filesystem,默认的binary不做任何转换。

character_set_results:结果集,返回给客户端的字符集

character_set_server:数据库服务器的默认字符集

character_set_system: 系统字符集,这个值总是utf8,不需要设置。这个字符集用于数据库对象(如表和列)的名字,也用于存储在目录表中的函数的名字。

怎么查看当前数据库的校验规则呢?

show variables like 'collation%'\G

然后就会返回当前数据库的校验规则

*************************** 1. row ***************************
Variable_name: collation_connection
        Value: gbk_chinese_ci
*************************** 2. row ***************************
Variable_name: collation_database
        Value: utf8_general_ci
*************************** 3. row ***************************
Variable_name: collation_server
        Value: utf8mb4_0900_ai_ci
3 rows in set, 1 warning (0.00 sec)

设置字符集

为数据库指定字符集

在创建数据库的时候,如果不指定字符集,那么默认的字符集就是latin1

我们可以在创建数据库的时候,指定字符集:

 create database lyxt charset=utf8;

当然,也可以修改已经创建好的数据库的字符集

alter database dbname character set utf8;

为数据库指定校验规则

在创建数据库的时候指定校验规则:

create database lyxt default charset utf8 collate utf8_romanian_ci;

修改已经存在的数据库的校验规则:

alter database lyxt collate utf8_romanian_ci;

在创建数据表的时候,为数据表分配字符集

create table table_charset(
    -> c1 varchar(10),
    -> c2 varchar(10)
    -> )engine=innodb default charset=utf8;

为表指定校验规则

 create table table_collate(
    -> c1 varchar(10),
    -> c2 varchar(10)
    -> )engine=innodb default charset utf8 collate utf8_romanian_ci;

为列分配字符集

create table column_charset(
    -> c1 char(10) character set utf8 not null,
    -> c2 char(10) char set utf8,
    -> c3 varchar(10) charset utf8,
    -> c4 varchar(10)
    -> )engine=innodb;

为列分配校验规则

 create table column_collate(
    -> c1 varchar(10) charset utf8 collate utf8_romanian_ci not null,
    -> c2 varchar(10) charset utf8 collate utf8_spanish_ci
    -> )engine=innodb;

你也可能喜欢

发表评论