字符集
字符集的重點知識
我們只需要了解:
1.??? 常用字符集
2.??? 數(shù)據(jù)庫中我們用什么字符集
英文字符集:
ASCII
ASCII 碼使用指定的7 位或8 位二進制數(shù)組合來表示128 或256 種可能的字符。標(biāo)準(zhǔn)ASCII 碼也叫基礎(chǔ)ASCII碼,使用7 位二進制數(shù)來表示所有的大寫和小寫字母,數(shù)字0 到9、標(biāo)點符號, 以及在美式英語中使用的特殊控制字符。
其中:
0~31及127(共33個)是控制字符或通信專用字符(其余為可顯示字符),如控制符:LF(換行)、CR(回車)、FF(換頁)、DEL(刪除)、BS(退格)、BEL(響鈴)等;通信專用字符:SOH(文頭)、EOT(文尾)、ACK(確認)等;ASCII值為8、9、10 和13 分別轉(zhuǎn)換為退格、制表、換行和回車字符。它們并沒有特定的圖形顯示,但會依不同的應(yīng)用程序,而對文本顯示有不同的影響。
32~126(共95個)是字符(32是空格),其中48~57為0到9十個阿拉伯?dāng)?shù)字。
65~90為26個大寫英文字母,97~122號為26個小寫英文字母,其余為一些標(biāo)點符號、運算符號等。
GBK
GBK 向下與 GB 2312 編碼兼容。是中華人民共和國定義的漢字計算機編碼規(guī)范。早期版本為GB2312。
Unicode
Unicode(統(tǒng)一碼、萬國碼、單一碼)Unicode是國際組織制定的可以容納世界上所有文字和符號的字符編碼方案。以滿足跨語言、跨平臺進行文本轉(zhuǎn)換、處理的要求。
UTF-8
是一種針對Unicode的可變長度字符編碼,也是萬國碼。因為UNICODE比ASCII占用大一倍的空間,而對ASCII來說高字節(jié)的0對他毫無用處。為了解決這個問題,就出現(xiàn)了一些中間格式的字符集,他們被稱為通用轉(zhuǎn)換格式,即UTF(Universal Transformation Format)
實際工作中要使用的編碼
在中文中常用的字符集分為utf-8和GBK。
實際使用的如下:
觀察(圖一)的特點你會發(fā)現(xiàn),MySQL字符集由三個部份組成:
1.字符集?
2.語言
3.類型
最后的bin是指二進制字符集,后面的ci是指存儲排序時不區(qū)分字符的大小寫。
注意:
mysql在寫utf-8的時候?qū)懙氖莡tf8。不加中間的中橫線。
(圖一)
1.關(guān)于MySQL字符集
MySQL的字符集支持(Character Set Support)有兩個方面:?
?字符集(Character set)和排序方式(Collation)。
MySQL對于字符集的支持細化到四個層次: 服務(wù)器(server),數(shù)據(jù)庫(database),數(shù)據(jù)表(table)和連接(connection)。
MySQL對于字符集的指定可以細化到一個數(shù)據(jù)庫,一張表,一列,應(yīng)該用什么字符集。
2.查看MySQL字符集
2.1.查看字符集的設(shè)置
mysql> show variables like 'character_set_%';
2.2.查看字符集排序設(shè)置
mysql> show variables like 'collation_%';
3.修改MySQL字符集
3.1修改服務(wù)器級別字符集
a.臨時修改
mysql>SET GLOBAL character_set_server=utf8;
b.永久修改
?打開/etc/mysql/my.cnf,在[mysqld]后添加character-set-server=utf8
3.2修改數(shù)據(jù)庫級?
a. 臨時更改
mysql>SET GLOBAL character_set_database=utf8;
b. 永久更改
改了服務(wù)器級就可以了
3.3修改表級?
mysql>ALTER TABLE table_name DEFAULT CHARSET utf8;
更改了后永久生效
3.4修改列級修改示例
mysql>ALTER TABLE `products` CHANGE `products_model` VARCHAR( 20 ) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL; 更改了后永久生效
3.5更改連接字符集
?a. 臨時更改:mysql> SET?GLOBAL character_set_client;
b. 永久更改:打開/etc/mysql/my.cnf,在[client]后添加default-character-set=utf8
?