首页 文章

除了其他列之外,pandas还会导出以前的列

提问于
浏览
1

我'm trying to export one specific column from a multi-gigabyte CSV with pandas to another CSV file using .to_csv. However, the output contains two columns, instead of one. Here'是一个示例输出: Case_Number 3 HZ250496 89 HZ250409 197 HZ250503 673 HZ250424 911 HZ250455 1108 HZ250447

其中Case_Number用于右侧的列,因为Stack Overflow的缩进不能很好地工作 . 上一列是此犯罪数据集的案例ID . 我只想要Case_Number . 我写的生成这个的python代码是:

import pandas
import csv
data = pandas.read_csv("Chicago_Crimes_2012_to_2017.csv", low_memory=False)
case_number = data["Case_Number"]
data.to_csv('Case_Number.csv', columns = ["Case_Number"])

我能做错什么?

1 回答

  • 1

    read_csv中使用参数 usecols 如果只想使用 Case_Number 列,然后在DataFrame.to_csv中使用 index=False 以避免 index 写入 csv

    import pandas as pd
    
    data = pd.read_csv("Chicago_Crimes_2012_to_2017.csv", 
                       low_memory=False, 
                       usecols=["Case_Number"])
    data.to_csv('Case_Number.csv', index=False)
    

相关问题