Learning Bayesian Network Structure from Highly Missing Data without Imputation
Mélanie Piot  1@  
1 : Université de Technologie de Troyes
Laboratoire Informatique et société numérique (LIST3N)

Dans certains domaines, les données produites comportent une proportion importante de données manquantes. Selon leur type, elles peuvent être ignorées ou imputées. Cependant, ignorer les données manquantes peut conduire à un volume insuffisant de données disponibles pour assurer une bonne modélisation, et l'imputation n'est pas toujours souhaitable. Ce travail présente un algorithme d'apprentissage de structure de réseau bayésien qui peut traiter des données catégorielles fortement manquantes sans effectuer d'imputation avant ou pendant l'apprentissage. Le processus d'apprentissage est basé sur un ensemble d'apprentissages bootstrap locaux réalisés sur des sous-ensembles de données complets qui sont ensuite agrégés et optimisés localement. Cette méthode d'apprentissage présente des résultats compétitifs par rapport à d'autres algorithmes d'apprentissage de structure, quel que soit le type de données manquantes.


Personnes connectées : 2 Vie privée
Chargement...