Partitionnement des données : algorithme des k-moyennes

Un tutoriel de Pierre Schwartz

Le 2020-04-23 21:07:20, par khayyam90, Rédacteur

Chers membres du club,

J'ai le plaisir de vous présenter ce tutoriel :

Partitionnement des données : algorithme des k-moyennes

En data-science, le partitionnement de données (clustering) fait partie des techniques d'apprentissage non supervisé permettant de qualifier les données continues d'un dataset d'après la forme de ce dataset.

L'objectif de l'algorithme des k-moyennes (k-means) est de découper notre dataset en k paquets qui se ressemblent. Le résultat du regroupement pourra définir une étiquette associée à chaque élément du dataset. C'est en ça que cette technique est classée dans l'apprentissage non supervisé, par opposition aux techniques où le libellé est fourni au modèle en même temps que les données.

Bonne lecture

Retrouvez Les meilleurs cours et tutoriels pour apprendre l'intelligence artificielle.

Discussion forum

2 commentaires

autran
Rédacteur

Super Tuto,

Je me suis permis de tenter, sur le base de ton explication, une implémentation de cet algorithme en Java ici.
Attention je ne suis qu'un lecteur béotien dans ce domaine.

Cordialement,

Marc

le 28/04/2020 à 16:40
khayyam90
Rédacteur

Très bonne initiative

Envoyé par autran

Super Tuto,

Je me suis permis de tenter, sur le base de ton explication, une implémentation de cet algorithme en Java ici.
Attention je ne suis qu'un lecteur béotien dans ce domaine.

Cordialement,

Marc

le 28/04/2020 à 17:48