首页 文章

从.xls文件读取数据时出现Python错误

提问于
浏览
2

我需要将几个xls文件读入Python . 可以通过Link:data.file找到示例数据文件 . 我试过了:

import pandas as pd
pd.read_excel('data.xls',sheet=1)

但它给出了一条错误消息:

错误*代码页21010 - >编码'unknown_codepage_21010' - > LookupError:未知编码:unknown_codepage_21010回溯(最近一次调用最后一次):文件“”,第1行,在pd.read_excel中('data.xls',sheet = 1 )文件“C:\ Anaconda3 \ lib \ site-packages \ pandas \ io \ excel.py”,第113行,在read_excel中返回ExcelFile(io,engine = engine).parse(sheetname = sheetname, kwds)文件“ C:\ Anaconda3 \ lib \ site-packages \ pandas \ io \ excel.py“,第150行,在init self.book = xlrd.open_workbook(io)文件”C:\ Anaconda3 \ lib \ site-packages \ xlrd__init__中 . py“,第435行,在open_workbook中ragged_rows = ragged_rows,文件”C:\ Anaconda3 \ lib \ site-packages \ xlrd \ book.py“,第116行,在open_workbook_xls中bk.parse_globals()文件”C:\ Anaconda3 \ lib \ site-packages \ xlrd \ book.py“,第1170行,在parse_globals中self.handle_codepage(data)文件”C:\ Anaconda3 \ lib \ site-packages \ xlrd \ book.py“,第794行,在handle_codepage self中 . derive_encoding()文件“C:\ Anaconda3 \ lib \ site-packages \ xlrd \ book.py”,第775行,在derive_encoding _unused = unicode(b'trial) ',self.encoding)文件“C:\ Anaconda3 \ lib \ site-packages \ xlrd \ timemachine.py”,第30行,在unicode = lambda b中,enc:b.decode(enc)LookupError:未知编码:unknown_codepage_21010

有人可以帮忙解决这个问题吗?

PS:我知道如果我在windows excel中打开文件,并重新保存,代码可以工作,但我正在寻找一个没有手动调整的解决方案 .

1 回答

  • 1

    使用ExcelFile类,我成功地将文件读入python . 如果这有帮助,请告诉我!

    import xlrd
        import pandas as pd
    
        xls = pd.ExcelFile(’C:\data.xls’)
        xls.parse(’Index Constituents Data’, index_col=None, na_values=[’NA’])
    

相关问题