我'm trying to export one specific column from a multi-gigabyte CSV with pandas to another CSV file using .to_csv. However, the output contains two columns, instead of one. Here'是一个示例输出: Case_Number 3 HZ250496 89 HZ250409 197 HZ250503 673 HZ250424 911 HZ250455 1108 HZ250447
其中Case_Number用于右侧的列,因为Stack Overflow的缩进不能很好地工作 . 上一列是此犯罪数据集的案例ID . 我只想要Case_Number . 我写的生成这个的python代码是:
import pandas
import csv
data = pandas.read_csv("Chicago_Crimes_2012_to_2017.csv", low_memory=False)
case_number = data["Case_Number"]
data.to_csv('Case_Number.csv', columns = ["Case_Number"])
我能做错什么?
1 回答
在read_csv中使用参数
usecols
如果只想使用Case_Number
列,然后在DataFrame.to_csv中使用index=False
以避免index
写入csv
: