首页 文章

在大数据中查找缺失值

提问于
浏览
0

我有许多需要分析的表格 . 目前,数据正在被清理,因为它有很多缺失值 . 在某些情况下,只有一个值丢失,而在其他大约200行 .

Question

如何找到应该在行中插入的值?

My Approach

  • 图的简单线性外推 .

  • 查找值的平均值并将其插入所有缺失值 .

  • 如果缺少200个值,则取最后100个值和接下来100个值的平均值 .

虽然我可以想到上述所有方法,但我不确定它的效率或方法如何编写节点来实现这一点 .

1 回答

  • 2

    新的KNIME missing value node提供了许多替换缺失值的方法 . 它可以简单地用平均值替换,或者在前一个和下一个非缺失值之间进行线性插值 .

相关问题