python中http返回乱码问题解决
2011-01-31 03:49codeif.com
比如我们用下面的网址访问人人网首页(utf-8编码)
import urllib
filehandle = urllib.urlopen("http://www.renren.com")
print(filehandle.read())
访问时出现乱码,改为如下就可以了
import urllib
filehandle = urllib.urlopen("http://www.renren.com")
print(filehandle.read().decode('utf-8'))
但是即使这样设置了可能汉字部分出现了像“\xef\xbb\xbf ”这样的乱码这可能没自动处理bom?可以试下utf-8-sig:
import urllib
print urllib.urlopen('http://www.codeif.com').read().decode('utf-8-sig')
