免费a级毛片18以上还看精品,欧美激情a∨在线视频播放

相關(guān)推薦

談?wù)刾hp中的unicode和utf8編碼

　　本文給大家深入討論了unicode和utf8這兩種編碼的關(guān)系，理解好了會發(fā)現(xiàn)網(wǎng)上一些舊的東西，是嚴(yán)重多余兼過期的，因為從utf-8流行開始到現(xiàn)在，早已經(jīng)由原來六字節(jié)可變編碼到實際完全居于unicode(UCS-2)的穩(wěn)定階段。

　　重新認(rèn)識unicode和utf8編碼

　　直到今天，準(zhǔn)確的說是剛才，我才知道UTF-8編碼和Unicode編碼是不一樣的，是有區(qū)別的囧

　　他們之間是有一定的聯(lián)系的，看看他們的區(qū)別：

　　UTF-8的長度是不一定的，有可能是1、2、3字節(jié)

　　Unicode長度一定，2個字節(jié)（USC-2）

　　UTF-8可以和Unicode互相轉(zhuǎn)換

　　unicode和utf8的關(guān)系

　　Unicode(16進(jìn)制)

　　UTF-8(二進(jìn)制)

　　0000 - 007F 0xxxxxxx

　　0080 - 07FF 110xxxxx 10xxxxxx

　　0800 - FFFF 1110xxxx 10xxxxxx 10xxxxxx

　　上面的表格有2個意思，第一個顯而易見就是說Unicode和UTF-8字符范圍的對應(yīng)，還有一個可以看出Unicode怎么和UTF-8互相轉(zhuǎn)換：

　　先說UTF-8到Unicode的轉(zhuǎn)換

　　UTF-8編碼的二進(jìn)制和上面的3種格式進(jìn)行匹配，匹配到之后去掉固定位（表格中的非x位置），然后從右到左每8位一組，不夠8位左邊不領(lǐng)，湊夠2個字節(jié)16 bits，這16 bits所表示的就是UTF-8對應(yīng)的Unicode編碼，看看下面幾個例子：

　　上面圖片中的文字編碼格式為UTF-8，可以用WinHex看到其16進(jìn)制表示

　　復(fù)制代碼代碼如下:

　　字符 => UTF-8 => UTF-8二進(jìn)制=> 去掉固定位置湊夠16位的二進(jìn)制 => 16進(jìn)制

　　漢 => E6B189 => 11100110 10110001 10001001 => 01101100 01001001 => 6C49

　　字 => E5AD97 => 11100101 10101101 10010111 => 01011011 01010111 => 5B57

　　#下面是在chrome命令行下面運(yùn)行的結(jié)果

　　'\u6C49'

　　"漢"

　　'\u5B57'

　　"字"

　　#到這里的話，從UTF-8轉(zhuǎn)換到Unicode已經(jīng)是一件非常容易的事了，看看轉(zhuǎn)換的偽代碼

　　讀取一個字節(jié)，11100110