Data mining – Comment fonctionne -t-il dans la pratique ?

Définition :

Généralement, Data mining ou la découverte de connaissances (knowledge discovery) est le processus d’analyse des Big Data (Big Data : c’est un terme qui décrit l’évolution de tout montant volumineux structuré, semi-structuré et aussi les données non structurées qui peuvent être exploitées pour obtenir des informations.) de différentes perspectives et les résumées en informations utiles .

   Le data mining est l’analyse des données pour retirer des relations (entre les données) qui n’ont pas déjà été découvertes.

Le Data mining dans la pratique :

Data mining - Comment fonctionne -t-il dans la pratique ?

Dans la pratique, le data mining peut être appliqué avec succès dans presque tous les
domaines économiques et scientifiques , on cite par exemple :
-le marketing
-le banking
-la médecine
-les services en ligne
-…etc.

Comment fonctionne le data mining ?

La découverte  des informations à partir de données –Data– prend essentiellement deux formes : la description et la prévision.

L’exploration de données ou du data mining est utilisée pour simplifier et résumer les données d’une manière qu’on peut comprendre, et ensuite permet de déduire des choses sur des cas spécifiques basés sur les modèles que nous avons observés.

les applications spécifiques des méthodes de data mining sont limitées par la puissance de données et de calcul disponible,  et sont accordés aux besoins et objectifs spécifiques.

Néanmoins, il existe plusieurs grands types de détection de motif couramment utilisés. Ces formes générales montrent la puissance du data mining.

  • La détection d’anomalie: détection des valeurs aberrantes ,est l’identification des objets, des événements ou des observations qui ne sont pas conformes à un modèle attendu ou d’autres éléments dans un ensemble de données-dataset.
  • Règles d’ association: Dans le data mining,  les règles d’association sont utiles pour analyser et prévoir le comportement des clients. Ils jouent un rôle très important dans l’analyse du panier d’achat de données, le regroupement de produits, conception de catalogue et l’agencement du magasin.
  • Détection du cluster: le clustering est une technique de data mining utilisée pour placer des éléments de données dans des groupes liés  connaissances préalables de groupe. d’après les techniques utilisées par le Clustering on cite par exemple le  k-moyennes.
  •  La classification: technique utilisée pour prédire l’appartenance au groupe pour les instances de données.
  • Régression : La régression est une technique de data mining (apprentissage automatique) utilisée pour ajuster une équation à un ensemble de données. L’exploration de données peut être utilisée pour construire des modèles prédictifs basés sur de nombreuses variables.

Facebook ou Twitter par exemple, pourraient être intéressés à prédire un futur engagement pour un utilisateur basé sur le comportement du passé.

Facebook Comments
Abdennour M

Abdennour M

writer and developer

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>