前面一篇日记学习了XMLHTTP的基本用法,用responseText其获得网页的内容如有Unicode字符的时候,则会显示乱码,
咋处理呢?这个时候还有另一个对象responseBody,看下它的运行结果:
这个结果……更不像话,原因是因为responseBody存储的是字节,如果用vbsEdit来调试VBS版的XMLHTTP的话,则可以在DEBUG界面看到responseBody中存储的一个个字节形字数据,问题就出在这里了,在VBS中,可以用midb,ascb等手段将字节正确地解码,方式如下:
Set xml=CreateObject("msxml2.xmlhttp")
xml.open "get",url,False
xml.send
If xml.readyState=4 And xml.status=200 Then
'WScript.Echo lenb(xml.responseBody)
For i=1 To lenb(xml.responseBody)
curCode=ascb(midb(xml.responseBody,i,1))
If curCode<&h80 Then
filContent=filContent & Chr(curCode)
Else
nextCode=ascb(midb(xml.responseBody,i+1,1))
filContent=filContent & Chr(CLng(curCode)*&H100+CInt(nextCode))
:i=i+1
End If
Next
End If
可是这里的lenb、midb、ascb什么的函数,在javascript中貌似没有相应的方法啊,网上查了很多资料,对此都是一个回答:无法解决。目前使用的方法,都是折中的处理办法,比如引用adodb.stream来进行字节转码:
function BytesToBstr(body,Cset){
var objstream;
objstream = new ActiveXObject("adodb.stream");
objstream.Type = 1; //处理字节流
objstream.Mode =3; //读写模式
objstream.open(); //打开对象
objstream.write(body); //载入处理流
objstream.Position = 0; //指针指向开始
objstream.Type = 2; //转换字符流处理
objstream.Charset = Cset; //设置字符集
var str=objstream.ReadText(); //读取字符
objstream.close(); //关闭对向
return str; //返回字符串
}
或者同一个网页中即使用vbscript函数,又使用javascript函数,将解码工作交给vbscript去做,然后javascript调用结果,没办法,谁叫javascript没有lenb,midb,ascb等牛叉的函数呢。 根据网上的一些例子改编的利用execScript混合vbscript片断的javascript解决办法。
function getHTTPPage(sUrl){
var Http;
var Http=new ActiveXObject("MSXML2.XMLHTTP")
Http.open("GET",sUrl,false);
Http.send();
if(Http.readyState!= 4){
return false;
}
return gb2utf8(Http.responseBody);
}
function gb2utf8(data){
gb2utf8_data = data;
execScript("gb2utf8_data = MidB(gb2utf8_data, 1)", "VBScript");
var t=escape(gb2utf8_data).replace(/%u/g,"");
t=t.replace(/(.{2})(.{2})/g,"%$2%$1");&nsp;
t=t.replace(/%([A-Z].)%(.{2})/g,function(str){execScript("codeStr=chr("+eval(str.replace(/%(.{2})%(.{2})/g,"0x$1$2"))+")","VBScript");return codeStr});
return unescape(t);
}
看到这,忽然想想有没有javascript不利用外部工具来模拟vbscript的lenb,midb,ascb的实现呢,网上搜下关键字好象有人在提,先记录到这,如果能成,在把其间的两句execScript去掉,真正实现javascript解决这个问题。
咋处理呢?这个时候还有另一个对象responseBody,看下它的运行结果:
这个结果……更不像话,原因是因为responseBody存储的是字节,如果用vbsEdit来调试VBS版的XMLHTTP的话,则可以在DEBUG界面看到responseBody中存储的一个个字节形字数据,问题就出在这里了,在VBS中,可以用midb,ascb等手段将字节正确地解码,方式如下:
Set xml=CreateObject("msxml2.xmlhttp")
xml.open "get",url,False
xml.send
If xml.readyState=4 And xml.status=200 Then
'WScript.Echo lenb(xml.responseBody)
For i=1 To lenb(xml.responseBody)
curCode=ascb(midb(xml.responseBody,i,1))
If curCode<&h80 Then
filContent=filContent & Chr(curCode)
Else
nextCode=ascb(midb(xml.responseBody,i+1,1))
filContent=filContent & Chr(CLng(curCode)*&H100+CInt(nextCode))
:i=i+1
End If
Next
End If
可是这里的lenb、midb、ascb什么的函数,在javascript中貌似没有相应的方法啊,网上查了很多资料,对此都是一个回答:无法解决。目前使用的方法,都是折中的处理办法,比如引用adodb.stream来进行字节转码:
function BytesToBstr(body,Cset){
var objstream;
objstream = new ActiveXObject("adodb.stream");
objstream.Type = 1; //处理字节流
objstream.Mode =3; //读写模式
objstream.open(); //打开对象
objstream.write(body); //载入处理流
objstream.Position = 0; //指针指向开始
objstream.Type = 2; //转换字符流处理
objstream.Charset = Cset; //设置字符集
var str=objstream.ReadText(); //读取字符
objstream.close(); //关闭对向
return str; //返回字符串
}
或者同一个网页中即使用vbscript函数,又使用javascript函数,将解码工作交给vbscript去做,然后javascript调用结果,没办法,谁叫javascript没有lenb,midb,ascb等牛叉的函数呢。 根据网上的一些例子改编的利用execScript混合vbscript片断的javascript解决办法。
function getHTTPPage(sUrl){
var Http;
var Http=new ActiveXObject("MSXML2.XMLHTTP")
Http.open("GET",sUrl,false);
Http.send();
if(Http.readyState!= 4){
return false;
}
return gb2utf8(Http.responseBody);
}
function gb2utf8(data){
gb2utf8_data = data;
execScript("gb2utf8_data = MidB(gb2utf8_data, 1)", "VBScript");
var t=escape(gb2utf8_data).replace(/%u/g,"");
t=t.replace(/(.{2})(.{2})/g,"%$2%$1");&nsp;
t=t.replace(/%([A-Z].)%(.{2})/g,function(str){execScript("codeStr=chr("+eval(str.replace(/%(.{2})%(.{2})/g,"0x$1$2"))+")","VBScript");return codeStr});
return unescape(t);
}
看到这,忽然想想有没有javascript不利用外部工具来模拟vbscript的lenb,midb,ascb的实现呢,网上搜下关键字好象有人在提,先记录到这,如果能成,在把其间的两句execScript去掉,真正实现javascript解决这个问题。