我正在使用excel表的目录,并决定使用Panda Dataframes来处理它 . 作为一个例子,我有一个表格的excel电子表格:
Excel sheet I want to parse

每个excel文件都有多个工作表 . 此外,它们包含合并的单元格 . 为了解决这个问题,我编写了以下代码:

import pandas as pd
import os

files=os.listdir(path)
files_xl=[file for file in files if file[-4:]=='xlsx']

df=pd.DataFrame()

for f in files_xl:
    try:
        data=pd.ExcelFile(path+f)
        xl=[data.parse(sheet_name) for sheet_name in data.sheet_names]
        for item in xl:
            item.index=pd.Series(item.index).fillna(method='ffill')
            df.append(item)
    except:
        continue

但是,它(1)返回一个空数据帧,(2)不替换合并单元格产生的NaN .