如何在Python中正确进行编码?

29 浏览
0 Comments

如何在Python中正确进行编码?

我是python的新手,我正在苦苦挣扎地处理编码问题

我有一个字符串列表,像这样:

keys = ["u'part-00000-6edc0ee4-de74-4f82-9f8c-b4c965896224-c000.csv'", 
        " u'part-00001-6edc0ee4-de74-4f82-9f8c-b4c965896224-c000.csv'"]

我这么做来进行编码

keys = [x.encode('UTF-8') for x in keys]

然而我得到了一个“b”添加的结果,如下所示:

[b"u'part-00000-6edc0ee4-de74-4f82-9f8c-b4c965896224-c000.csv'", 
 b" u'part-00001-6edc0ee4-de74-4f82-9f8c-b4c965896224-c000.csv'"]

我以为只需使用utf-8进行编码就可以了

我做错了什么吗?

admin 更改状态以发布 2023年5月22日
0
0 Comments

你应该首先尝试修复获取原始字符串列表的方法,但如果你无法控制它,你可以使用以下方法:

>>> import ast
>>> [ast.literal_eval(i.strip()) for i in keys]

结果应该是:

[u'part-00000-6edc0ee4-de74-4f82-9f8c-b4c965896224-c000.csv', 
 u'part-00001-6edc0ee4-de74-4f82-9f8c-b4c965896224-c000.csv']

对于Python 2,和

['part-00000-6edc0ee4-de74-4f82-9f8c-b4c965896224-c000.csv', 
 'part-00001-6edc0ee4-de74-4f82-9f8c-b4c965896224-c000.csv']

对于Python 3。

0