IE不能主动识别UTF-8编码作者:HAWEBS.NET 2010-07-29 22:39 之前在动态页面静态化的过程中,IE打开页面后不显示内容,但html代码数据已经下载下来了,将其"字符编码"手动改"utf-8"才可以显示。在windows操作系统上使用IE作为浏览器时。常常会发生这样的问题:在浏览使用UTF-8编码的网页时,浏览器无法自动侦测(即没有设定“自动选择”编码格式时)该页面所用的编码。即使网页已经声明过编码格式: <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> 由此造成某些含有中文UTF-8编码的页面产生空白输出。 如果使用的是Mozilla、Mozilla Firefox、Sarafi的浏览器这不会造成这个问题。 这是由于IE解析网页编码时以HTML内的标签优先,而后才是HTTP header内的讯息;而mozilla系列的浏览器则刚刚相反。 由于UTF-8为3个字节表示一个汉子,而普通的GB2312或BIG5是两个。页面输出时,由于上述原因,使浏览器解析、输出<title></title>的内容时,如果在</title>前有奇数个全角字符时,IE把UTF-8当作两个字节解析时出现半个汉字的情况,这时该半个汉字会和</title>的<结合成一个乱码字,导致IE无法读完<title>部分,使整个页面为空百输出。而这个时候如果察看源文件的话,会发现实际上整个页面全部已经输出了。 因此最简单的解决办法是再网页文件的<head></head>标签中一定要把字符定义 <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> 放在<title></title>之前。 meta是用来在HTML文档中模拟HTTP协议的响应头报文。 在meta标签中写和在HTTP头里写是一样的,这也是为了解决用普通 HTML写网页的人无法自行定义HTTP头的问题。 但是,meta是一个html标签,所以必须进入到html解析的步骤才能生效,而生效后,浏览器会退 回几步,重新设置好HTTP头从头再开始解码、解析html。所以meta中写的内容会覆盖HTTP头里的内容,无论哪个浏览器都是这样的。 出现空白页必须的3项条件: 1.title标签里的内容为中文其他双字节字符; 2.指定网页编码的 meta 信息在 title 标签的下方; 3.另存或转换 utf-8 编码时没有包括 unicode 签名。 版权所有 © 2010 淡远资讯中心 保留所有权利。
HA WEBSYSTEMS - 开放源代码软件与信息技术服务供应商,相关软件基于GNU/GPL许可协议。 |


