Developpez.com - Rubrique IA

Le Club des Développeurs et IT Pro

Partitionnement des données : algorithme des k-moyennes

Un tutoriel de Pierre Schwartz

Le 2020-04-23 21:07:20, par khayyam90, Rédacteur
Chers membres du club,

J'ai le plaisir de vous présenter ce tutoriel :

Partitionnement des données : algorithme des k-moyennes
En data-science, le partitionnement de données (clustering) fait partie des techniques d'apprentissage non supervisé permettant de qualifier les données continues d'un dataset d'après la forme de ce dataset.

L'objectif de l'algorithme des k-moyennes (k-means) est de découper notre dataset en k paquets qui se ressemblent. Le résultat du regroupement pourra définir une étiquette associée à chaque élément du dataset. C'est en ça que cette technique est classée dans l'apprentissage non supervisé, par opposition aux techniques où le libellé est fourni au modèle en même temps que les données.
Bonne lecture

Retrouvez Les meilleurs cours et tutoriels pour apprendre l'intelligence artificielle.
  Discussion forum
2 commentaires
  • autran
    Rédacteur
    Super Tuto,

    Je me suis permis de tenter, sur le base de ton explication, une implémentation de cet algorithme en Java ici.
    Attention je ne suis qu'un lecteur béotien dans ce domaine.

    Cordialement,

    Marc
  • khayyam90
    Rédacteur
    Très bonne initiative

    Envoyé par autran
    Super Tuto,

    Je me suis permis de tenter, sur le base de ton explication, une implémentation de cet algorithme en Java ici.
    Attention je ne suis qu'un lecteur béotien dans ce domaine.

    Cordialement,

    Marc