优草派  >   Python

Python中gbk编码怎么转为utf-8编码?一文学会编码格式转换

罗西汉            来源:优草派

在python之中如果要将一种编码格式转为另一种编码格式的话,就需要经过解码再编码这两个过程。下面这篇文章会以gbk编码转为utf-8编码的示例来讲解一下python之中的编码格式转换是怎么进行操作和运转的,感兴趣的小伙伴一起往下看看吧。

Python中gbk编码怎么转为utf-8编码?一文学会编码格式转换

1.首先假设现在有一个字符串是gbk编码,在python之中任意一个版本的默认编码格式都不是gbk,所以只能先创建出来一个字符串变量并将其设置为gkb编码。在这个gbk编码转为utf-8编码的过程之中首先需要将其解码为Unicode编码字符集,示例如下:

str1 = ’这是一个字符串’
# 解码为Unicode
str1 = str1.decode(’gbk’)

之所以要将这个gbk编码的字符串解码成Unicode是因为python默认的编码字符集就是Unicode,编码字符集和编码格式是两种不同的概念。python的编码字符集默认和必须使用的就是Unicode,而编码格式就相当于在这个基础上添加的一个编码方法一样。

2.只有将其先转为Unicode编码之后才能够再将这个字符串对象编码成utf-8的格式,编码的方法是encode(),示例如下:

str1 = str1.encode(’utf-8’)

3.到上面这一步其实就已经是完成了从gbk编码转为utf-8编码的需求了,接下来还要输出字符串变量查看一下结果,示例如下:

print(str1)
’这是一个字符串’

以上就是关于“Python中gbk编码怎么转为utf-8编码?一文学会编码格式转换”的全部内容了,想要了解更多python的实用知识和代码示例可以持续关注这个频道,每次更新都会有很多新的知识技术分享给大家。

【原创声明】凡注明“来源:优草派”的文章,系本站原创,任何单位或个人未经本站书面授权不得转载、链接、转贴或以其他方式复制发表。否则,本站将依法追究其法律责任。