你的数据集有 50 个变量,但是8个变量的缺失值高于 30%。如何解决这个问题?

您可以采用 3 种一般方法:

  • 只是删除它们(不理想)

  • 为缺失值分配唯一的类别,以查看是否有趋势生成此问题

  • 检查目标变量的分布。如果找到了模式,请保留缺少的值,将其分配给新类别,然后删除其他类别

发表评论

后才能评论