Amelia包
Amelia对缺失值的假设为:
- 缺失值是随机缺失的
- 数据中所有变量都满足多元正态分布(MVN,Multivariate Normal Distribution),可以用均值和协方差来描述数据
- 利用Bootstrap生成多组填补值
可视化缺失值
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
| data(iris) summary(iris)
install.packages("dplyr") library(dplyr)
set.seed(2021) iris.miss <- missForest::prodNA(iris, noNA = 0.1) %>% select(-Species) summary(iris.miss)
install.packages('Amelia') library(Amelia)
Amelia::missmap(iris.miss)
|
Amelia vs MICE
|
Amelia |
MICE |
拟合 |
依赖整体数据服从“多元正态分布”的假设 |
一个变量一个变量分别拟合 |
|
只能处理正态分布或者经转换后近似正态分布的变量 |
可以处理多种类型数据 |
|
不能在数据子集上处理缺失值 |
能在数据子集上处理缺失值 |
参考资料
Thank you for your approval.
支付宝
微信支付
WeChat Bezahlung