你的数据集有 50 个变量,但是8个变量的缺失值高于 30%。如何解决这个问题?
您可以采用 3 种一般方法:
-
只是删除它们(不理想)
-
为缺失值分配唯一的类别,以查看是否有趋势生成此问题
-
检查目标变量的分布。如果找到了模式,请保留缺少的值,将其分配给新类别,然后删除其他类别
您可以采用 3 种一般方法:
只是删除它们(不理想)
为缺失值分配唯一的类别,以查看是否有趋势生成此问题
检查目标变量的分布。如果找到了模式,请保留缺少的值,将其分配给新类别,然后删除其他类别
网站配套小程序