久久无码中文字幕_日韩精品无码一本二本三_久久精品呦女暗网_欧美一级夜夜爽_久久精品国产99久久99久久久

08
2017/07

UTF8 與 UTF8 +BOM 區(qū)別

發(fā)布時(shí)間:2017-07-08 18:51:01
發(fā)布者:pengyifeng
瀏覽量:
0

在最近的一個(gè)項(xiàng)目中遇到了一個(gè)奇怪的事情,代碼中沒有,可是一打開網(wǎng)頁(yè)就多出了一行代碼:

blob.png

這一行代碼導(dǎo)致div之間存在縫隙,

blob.png

網(wǎng)上找了很久原因,發(fā)現(xiàn)原來(lái)是因?yàn)榫幋a的原因?qū)е碌?在保存代碼的時(shí)候保存成UTF+BOM格式,所導(dǎo)致的原因,為什么加上BOM就會(huì)這樣呢?

UTF-8 編碼的文件可以分為no BOM 和 BOM兩種格式。

何謂BOM? "EF BB BF" 這三個(gè)字節(jié)就叫BOM,BOM的全稱叫做"Byte Order Mard".在utf-8文件中常用BOM來(lái)表明這個(gè)文件是UTF-8文件,而BOM的本意實(shí)在utf16中用來(lái)表示高低字節(jié)序列的。在字節(jié)流之前有BOM表示采用低字節(jié)序列(低字節(jié)在前面),而utf8不用考慮字節(jié)序列,所以其實(shí)有無(wú)BOM都可以。UTF-8以字節(jié)為編碼單元,沒有字節(jié)序的問(wèn)題。UTF-16以兩個(gè)字節(jié)為編碼單元,在解釋一個(gè)UTF-16文本前,首先要弄清楚每個(gè)編碼單元的字節(jié)序。

在 UCS編碼中有一個(gè)叫做"ZERO WIDTH NO-BREAK SPACE"的字符,它的編碼是FEFF。而FFFE在UCS中是不存在的字符,所以不應(yīng)該出現(xiàn)在實(shí)際傳輸中。UCS規(guī)范建議我們?cè)趥鬏斪止?jié)流前,先傳輸 字符"ZERO WIDTH NO-BREAK SPACE"。 這樣如果接收者收到FEFF,就表明這個(gè)字節(jié)流是Big-Endian的;如果收到FFFE,就表明這個(gè)字節(jié)流是Little-Endian的。因此字 符"ZERO WIDTH NO-BREAK SPACE"又被稱作BOM。

UTF-8不需要BOM來(lái)表明字節(jié)順序,但可以用BOM 來(lái)表明編碼方式。字符"ZERO WIDTH NO-BREAK SPACE"的UTF-8編碼是EF BB BF(讀者可以用我們前面介紹的編碼方法驗(yàn)證一下)。所以如果接收者收到以EF BB BF開頭的字節(jié)流,就知道這是UTF-8編碼了。



返回列表