我用python的结巴包得到了分词,是unicode码,然后从文件中又读取了一个中文词语,这两个词是相同的,但是做判断时,他俩不相同。
我记得结巴的话你给他的也必须是某种编码的(两年了忘记了)
你可以先用type(string)判断它是哪个编码 然后再类型转换
比如
其中decode可能要判断一下是够需要 然后再比较。