python 判断两个中文字符串是否相同

我用python的结巴包得到了分词，是unicode码，然后从文件中又读取了一个中文词语，这两个词是相同的，但是做判断时，他俩不相同。

举报该问题

推荐答案 2014-03-15

都是unicode就可以直接比较。将清除前后的空格。再用type检查他们的确都是unicode。就可以直接比较了。

从文件中直接读出的词语，通常是BYTE形式。是编码好了的。不是unicode。要DECODE一次（python2.x）才可以。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://00.wendadaohang.com/zd/ITDIrnnenDnBBn0IrI.html

第1个回答 2014-03-15

我记得结巴的话你给他的也必须是某种编码的（两年了忘记了）

你可以先用type(string)判断它是哪个编码然后再类型转换

比如

s = f.readline()
s = unicode(s.decode("utf8"), "ignore")

其中decode可能要判断一下是够需要然后再比较。

本回答被提问者采纳

第2个回答 2014-03-15

先处理相同类型的字符串再比较，应该没问题

相似回答

如何用python语言比较两个中文字符串是否相等答：用==来判断例如string a,b if a ==b:print('...')elif a=='...':print('...')else:print('...')

如何用python语言比较两个中文字符串是否相等答：在python里，汉字分字节流和unicode字符串：参考http://www.sqlite.com.cn/MySqlite/11/395.Html 例如“哈”字，假如两个有两个字符str1和str2 str1 = '\xb9\xfe' // 这个字节流表示哈字是使用GBK编码的字节流 str2 = u'\u54c8 // 表示这个字符使用UNICODE-16编码 判断相等：str1...

如何用python语言比较两个中文字符串是否相等答：False 所以直接用变量赋值是可以比较中文字的相同或不同的

python 判断中文字符串是否相等答：if u"星期节次" == tempStr[0]

大家正在搜

python 判断字符串相等 python如何判断字符串相等 python判断回文字符串 python字符串判断 python判断字符串包含 python包含某个字符串 python字符串转数字 python字符串提取数字 python 包含字符串

如何用python语言比较两个中文字符串是否相等

如何用python语言比较两个中文字符串是否相等

如何用python语言比较两个中文字符串是否相等

python 判断列表内容与字符串是否相等（中文编码问题）

如何用python语言比较两个中文字符串是否相等

python 判断字符串是否有中文

“python”中怎么判断字符串相等？

用python 比较两个strings 是否相同，忽略大小写...