Python中文乱码?输出中文乱码?我公司那批本科生也是!乱码攻略(python3中文,关键词优化)

时间:2024-04-29 10:23:07 作者 : 石家庄SEO 分类 : 关键词优化
  • TAG :

    Python%E4%B8%AD%E6%96%87%E4%B9%B1%E7%A0%81%EF%BC%9F%E8%BE%93%E5%87%BA%E4%B8%AD%E6%96%87%E4%B9%B1%E7%A0%81%EF%BC%9F%E6%88%91%E5%85%AC%E5%8F%B8%E9%82%A3%E6%89%B9%E6%9C%AC%E7%A7%91%E7%94%9F%E4%B9%9F%E6%98%AF%EF%BC%81%E4%B9%B1%E7%A0%81%E6%94%BB%E7%95%A5

乱码这个问题可谓是难倒了许多的小白啊!其实乱码并不难解决,只是你得有个乱码解决的攻略,今天教你这个方法希望以后在也不会碰到这种情况了哈!

1.在Python中使用中文

1.UNICODE (UTF8-16), C854;

2.UTF-8, E59388;

3.GBK, B9FE。

1.1Windows控制台

1.2Windows IDLE(在Shell上运行)

1.3在IDLE上运行代码

1.4Windows Eclipse

在Eclipse中处理中文更加困难,因为在Eclipse中,编写代码和运行代码属于不同的窗口,而且他们可以有不同的默认编码。对于如下代码:

前四个print运行正常,最后两个print都会抛出异常:

可以看出Eclipse控制台的缺省编码方式是GBK;所以不支持UNICODE也在情理之中。如果把文件中的coding修改成GBK,则可以直接打印GBK编码的str对象,比如s。

1.5从文件读取中文

在window下面用记事本编辑文件的时候,如果保存为UNICODE或UTF-8,分别会在文件的开头加上两个字节

“/xFF/xFE”和三个字节“/xEF/xBB/xBF”。在读取的时候就可能会遇到问题,但是不同的环境对这几个多于字符的处理也不一样。

打开unicode格式的文件后,得到的字符串正确。这时候适用utf-16解码,能得到正确的unicdoe对象,可以直接使用。多余的那个填充字符在进行转换时会被过滤掉。

打开ansi格式的文件后,没有填充字符,可以直接使用。

结论:读写使用python生成的文件没有任何问题,但是在处理由notepad生成的文本文件时,如果该文件可能是非ansi编码,需要考虑如何处理填充字符。

1.6在数据库中使用中文

1.7在XML中使用中文

使用xml.dom.minidom和MySQLdb类似,对生成的dom对象调用toxml方法得到的是unicode对象。如果希望输出utf-8文本,有两种方法:

1.使用系统函数

2.自己编码生成

通过阅读这篇文章是否有解决你现在所遇到的难题呢?

本文:Python中文乱码?输出中文乱码?我公司那批本科生也是!乱码攻略的详细内容,希望对您有所帮助,信息来源于网络。
上一篇:Python那些事——如何用Python抽取中文关键词?这里有全套!下一篇:

9 人围观 / 0 条评论 ↓快速评论↓

(必须)

(必须,保密)

阿狸1 阿狸2 阿狸3 阿狸4 阿狸5 阿狸6 阿狸7 阿狸8 阿狸9 阿狸10 阿狸11 阿狸12 阿狸13 阿狸14 阿狸15 阿狸16 阿狸17 阿狸18