python检查编码方式chardet用法

  • 原创
  • |
  • 浏览:1981
  • |
  • 更新:

python检查编码方式chardet用法,chardet通常用和urllib一起用来解码返回的网页内容

方法/步骤

  1. 1

    使用pip安装chardet包

    pip install chardet

    python检查编码方式chardet用法
  2. 2

    打开python开发工具IDLE,新建‘chardetest.py’文件,并写代码如下:

    import chardet

     

    a = '你好'

    b = 'nihao'

     

    print (chardet.detect(a))

    print (chardet.detect(b))

    python检查编码方式chardet用法
  3. 3

    F5运行程序,程序出错,这是因为chardet.detect时检查编码之后bytes格式的编码方式,不能检查str

    python检查编码方式chardet用法
  4. 3
    本页面未经授权抓取自百度经验
  5. 4

    默认编码方式编码字符串,修改代码如下:

    import chardet

     

    a = '你好'

    b = 'nihao'

    a1=a.encode()

    b1=b.encode()

    print (chardet.detect(a1))

    print (chardet.detect(b1))

    python检查编码方式chardet用法
  6. 5

    F5运行程序,打印出编码方式,注意英文字母还是ascii编码

    python检查编码方式chardet用法
  7. 6

    解码可以使用下面代码

    import chardet

     

    a = '你好'

    b = 'nihao'

    a1=a.encode()

    b1=b.encode()

    ac=chardet.detect(a1)

    print (a1.decode(ac['encoding']))

    ac是一个字典类型,就是上一步打印出来的内容

    python检查编码方式chardet用法
  8. 7

    F5运行代码,正确解码成字符串如下图

    python检查编码方式chardet用法
    END
经验内容仅供参考,如果您需解决具体问题(尤其法律、医学等领域),建议您详细咨询相关领域专业人士。
作者声明:本篇经验系本人依照真实经历原创,未经许可,谢绝转载。
展开阅读全部