在最近的一個(gè)項(xiàng)目中遇到了一個(gè)奇怪的事情,代碼中沒有,可是一打開網(wǎng)頁(yè)就多出了一行代碼:
這一行代碼導(dǎo)致div之間存在縫隙,
網(wǎng)上找了很久原因,發(fā)現(xiàn)原來(lái)是因?yàn)榫幋a的原因?qū)е碌?在保存代碼的時(shí)候保存成UTF+BOM格式,所導(dǎo)致的原因,為什么加上BOM就會(huì)這樣呢?
UTF-8 編碼的文件可以分為no BOM 和 BOM兩種格式。
何謂BOM? "EF BB BF" 這三個(gè)字節(jié)就叫BOM,BOM的全稱叫做"Byte Order Mard".在utf-8文件中常用BOM來(lái)表明這個(gè)文件是UTF-8文件,而BOM的本意實(shí)在utf16中用來(lái)表示高低字節(jié)序列的。在字節(jié)流之前有BOM表示采用低字節(jié)序列(低字節(jié)在前面),而utf8不用考慮字節(jié)序列,所以其實(shí)有無(wú)BOM都可以。UTF-8以字節(jié)為編碼單元,沒有字節(jié)序的問(wèn)題。UTF-16以兩個(gè)字節(jié)為編碼單元,在解釋一個(gè)UTF-16文本前,首先要弄清楚每個(gè)編碼單元的字節(jié)序。
在 UCS編碼中有一個(gè)叫做"ZERO WIDTH NO-BREAK SPACE"的字符,它的編碼是FEFF。而FFFE在UCS中是不存在的字符,所以不應(yīng)該出現(xiàn)在實(shí)際傳輸中。UCS規(guī)范建議我們?cè)趥鬏斪止?jié)流前,先傳輸 字符"ZERO WIDTH NO-BREAK SPACE"。 這樣如果接收者收到FEFF,就表明這個(gè)字節(jié)流是Big-Endian的;如果收到FFFE,就表明這個(gè)字節(jié)流是Little-Endian的。因此字 符"ZERO WIDTH NO-BREAK SPACE"又被稱作BOM。
UTF-8不需要BOM來(lái)表明字節(jié)順序,但可以用BOM 來(lái)表明編碼方式。字符"ZERO WIDTH NO-BREAK SPACE"的UTF-8編碼是EF BB BF(讀者可以用我們前面介紹的編碼方法驗(yàn)證一下)。所以如果接收者收到以EF BB BF開頭的字節(jié)流,就知道這是UTF-8編碼了。