CLUTERING NON SUPERVISE PAR APPROCHE DU CHAMP POTENTIEL.

IGHIL , Sami; LAROUM ,Toufik

CLUTERING NON SUPERVISE PAR APPROCHE DU CHAMP POTENTIEL.

Files

IGHIL Sami.pdf (3.28 MB)

Date

2024

Authors

IGHIL , Sami

LAROUM ,Toufik

Publisher

Faculté des Sciences

Abstract

Ce thème s'intéresse à l'un des domaines les plus importants de l'apprentissage automatique et de la fouille de données, à savoir le clustering non supervisé, ce type de clustering vise à découvrir les structures sous-jacentes qui sont dissipées dans les données en utilisant une forme d'intelligence artificielle, de sorte que les données très similaires se retrouvent dans le même groupe, tandis que les groupes qui différent sont aussi distincts que possible. Cela diffère du clustering ou de la classification supervisée où le nombre de groupes est connu à l'avance, ce qui constitue un défi pour un bon clustering. L'un des algorithmes les plus connus dans ce domaine est l'algorithme K-Means, que nous ne pouvons pas omettre en raison de sa popularité et de son utilisation répandue. La plupart des techniques et algorithmes classent les données en groupes s’appuyant sur la similarité entre leurs éléments et le calcul des distances, en se basant sur un large éventail de concepts en mathématiques et en ingénierie. Cela commence par la distance euclidienne, dont le concept est simple, mais l'application est puissante, et se poursuit avec l'émergence de nouvelles mesures de distances dans les domaines des mathématiques et des sciences des données, telles que la distance de Wasserstein, également connue sous le nom de distance de transport optimal aussi sous le nom de métrique de Kantorovich-Rubinstein. Cette mesure offre une méthode pour mesurer la distance entre des distributions de probabilités, elle est largement utilisée dans l'apprentissage automatique et dans le traitement d'images. Le clustering non supervisé ne repose pas uniquement sur les concepts mentionnés ci-dessus, la philosophie du clustering basée sur le calcul des similarités et des distances dépend de la nature des données, ce qui constitue une grande faiblesse. Ce que nous cherchons à réaliser à travers ce thème, c'est l'application d’un nouveau concept, à savoir le concept du champ potentiel, qui est l'un des concepts fondamentaux en physique. Ce concept aide à décrire les interactions à distance entre les objets sans avoir besoin de détailler les forces directement influentes. Il est utilisé dans divers domaines comme l'électricité statique et la gravité, il offre une méthode élégante et mathématiquement précise pour analyser les différentes forces et énergies dans les systèmes. V Après avoir appliqué le concept du champ potentiel, nous avons observé l'interaction, le regroupement et l'attraction intrigants des ensembles de données similaires autour les uns des autres. Le travail et les résultats obtenus ne sont que le début d'une vision différente et une approche nouvelle dans ce domaine fascinant. À titre d'exemple, aussi, nous évoquons comme approche captivante et innovante que nous ne pouvons pas passer sans mentionner la physique quantique et ses applications, qui dépassent la réalité et qui provoqueront une avancée majeure dans ce domaine. En fin de compte, nous espérons que ce travail et les résultats obtenus seront une pierre angulaire pour des projets futurs où le clustering non supervisé sera un problème largement résolu.

URI

http://dspace.univ-skikda.dz:4000/handle/123456789/2793

Collections

Informatique

Full item page