python检查编码方式chardet用法
- 原创
- |
- 浏览:1981
- |
- 更新:
python检查编码方式chardet用法,chardet通常用和urllib一起用来解码返回的网页内容
方法/步骤
使用pip安装chardet包
pip install chardet
打开python开发工具IDLE,新建‘chardetest.py’文件,并写代码如下:
import chardet
a = '你好'
b = 'nihao'
print (chardet.detect(a))
print (chardet.detect(b))
F5运行程序,程序出错,这是因为chardet.detect时检查编码之后bytes格式的编码方式,不能检查str
- 本页面未经授权抓取自百度经验
默认编码方式编码字符串,修改代码如下:
import chardet
a = '你好'
b = 'nihao'
a1=a.encode()
b1=b.encode()
print (chardet.detect(a1))
print (chardet.detect(b1))
F5运行程序,打印出编码方式,注意英文字母还是ascii编码
解码可以使用下面代码
import chardet
a = '你好'
b = 'nihao'
a1=a.encode()
b1=b.encode()
ac=chardet.detect(a1)
print (a1.decode(ac['encoding']))
ac是一个字典类型,就是上一步打印出来的内容
F5运行代码,正确解码成字符串如下图
END
经验内容仅供参考,如果您需解决具体问题(尤其法律、医学等领域),建议您详细咨询相关领域专业人士。
作者声明:本篇经验系本人依照真实经历原创,未经许可,谢绝转载。
展开阅读全部