Amelia包
Amelia对缺失值的假设为:
- 缺失值是随机缺失的
 
- 数据中所有变量都满足多元正态分布(MVN,Multivariate Normal Distribution),可以用均值和协方差来描述数据
 
- 利用Bootstrap生成多组填补值
 
可视化缺失值
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
   | data(iris) summary(iris)  
 
 
 
 
 
 
 
  install.packages("dplyr") library(dplyr)  
 
  set.seed(2021) iris.miss <- missForest::prodNA(iris, noNA = 0.1) %>%    select(-Species)   summary(iris.miss)
 
 
 
 
 
 
 
 
  install.packages('Amelia') library(Amelia)
  Amelia::missmap(iris.miss)
   | 
 
Amelia vs MICE
 | 
Amelia | 
MICE | 
| 拟合 | 
依赖整体数据服从“多元正态分布”的假设 | 
一个变量一个变量分别拟合 | 
 | 
只能处理正态分布或者经转换后近似正态分布的变量 | 
可以处理多种类型数据 | 
 | 
不能在数据子集上处理缺失值 | 
能在数据子集上处理缺失值 | 
参考资料
     
    
    
    
        
  Thank you for your approval.
  
  
      
      
        
        支付宝
       
      
      
        
        微信支付
       
      
      
        
        WeChat Bezahlung