我有一段代码应该告诉我一个单词出现在CSV文件中的次数 . 注意:文件非常大(2年的短信)这是我的代码:
key_word1 = 'Exmple_word1'
key_word2 = 'Example_word2'
counter = 0
with open('PATH_TO_FILE.csv',encoding='UTF-8') as a:
for line in a:
if (key_word1 or key_word2) in line:
counter = counter + 1
print(counter)
有两个词,因为我不知道如何使它不区分大小写 . 为了测试它,我在整个文件中使用了单词中的find函数(仅使用其中一个单词,因为我能够在那里进行非区分大小写的搜索)并且我收到的代码是我的代码计算的两倍多 .
起初我确实使用了 value_counts()
功能但是我收到了相同单词的不同值(搜索 Exmple_word1
出现了32次和56次以及2次等等 . 我有点被困在那里一段时间但它让我思考 . 我用了两个我经常更换的手机上的键盘 - 可能是相同的单词实际上可能有所不同,这可以解释为什么我得到这些结果?
此外,我几乎检查了有关此事的所有来源,我发现不同的方法实际上没有做我想让他们做的事情 . (例如 value_counts()
方法)
如果是这种情况,我该如何解决这个问题?
1 回答
注意代码中的一些错误:
一个强化的例子:
猜你正在寻找的解决方案应该是这样的:
在输入上运行:
将导致: