酷符网动态语言 > 正文

python中http返回乱码问题解决

2011-01-31 03:49codeif.com

比如我们用下面的网址访问人人网首页(utf-8编码)

import urllib
filehandle = urllib.urlopen("http://www.renren.com")
print(filehandle.read())

访问时出现乱码,改为如下就可以了

import urllib
filehandle = urllib.urlopen("http://www.renren.com")
print(filehandle.read().decode('utf-8'))

但是即使这样设置了可能汉字部分出现了像“\xef\xbb\xbf ”这样的乱码这可能没自动处理bom?可以试下utf-8-sig:

import urllib
print urllib.urlopen('http://www.codeif.com').read().decode('utf-8-sig')

相关文章

新浪微博 | 淘段子 | 我的博客 | 淘宝店铺 | jnan.org | RSS
Copyright © 2009 - 2011 酷符网