Python机器学习 你的数据集有 50 个变量,但是8个变量的缺失值高于 30%。如何解决这个问题? 您可以采用 3 种一般方法: 只是删除它们(不理想) 为缺失值分配唯一的类别,以查看是否有趋...
Python机器学习 我们知道,独热编码(OneHotEncoder)会增加数据集的维度。但是标签编码(LabelEncoder)不会。为什么? 用独热编码(OneHotEncoder),数据集的维度(也即特征)增加是因为它为分类变量中存...
Python机器学习 给你一个数据集,这个数据集有缺失值,且这些缺失值分布在高中值有1一个标准偏差的的范围内,百分之多少的数据不会受到影响?为什么? 大约有32%的数据将不会受到缺失值的影响。因为,由于数据分布在中位数附近,让我们先假设这是一...