我的数据框中有一组列,我想用Na计算NaN值 . 例如
mylist = ['col1', 'col2','col3','col4', 'col5'] df[mylist] = df[mylist].fillna(0)
这实际上在我的应用程序中占用了大量时间,我想知道是否有更快的方法来实现这一点 .
基本上,对于任何看这个的人 . 如果您正在构建一个应该运行得非常快的应用程序(例如近实时机器学习预测),则根本不应该使用pandas
所以它通过我的列循环并使用numpy更快
for col in mylist: df[col] = np.nan_to_num(df[col].values)
2 回答
基本上,对于任何看这个的人 . 如果您正在构建一个应该运行得非常快的应用程序(例如近实时机器学习预测),则根本不应该使用pandas
所以它通过我的列循环并使用numpy更快