Nettoyer ses données dans un projet Datas

Article paru dans Intelligence artificielle

Datas et qualités des données en IA

Nettoyer ses données est une tâche parfois ingrate, souvent fastidieuse mais toujours nécessaire dans un projet data. La bonne idée décrite dans l'article proposé consiste à appliquer un regroupement par similitude (KMeans, clustering) pour isoler dans un groupe les données aberrantes. Utiliser du machine learning pour préparer des données de machine learning ...délicieusement récursif somme toute.

Retrouvez toute l'actualité sur l'intelligence artificielle en France

A lire aussi