Implémentation de problème de classification en utilisant Naїve Bayes

Bourendous, khawla; Mallem, Khadidja

Implémentation de problème de classification en utilisant Naїve Bayes

dc.contributor.author	Bourendous, khawla
dc.contributor.author	Mallem, Khadidja
dc.date.accessioned	2024-04-24T12:43:06Z
dc.date.available	2024-04-24T12:43:06Z
dc.date.issued	2023
dc.description.abstract	Toute expert des données a besoin d’apprendre les mathématiques du Machine Learning qui aident à sélectionner le bon algorithme. La compréhension des mathématiques nous permet donc de mieux comprendre le fonctionnement du modèle, notamment le choix du bon para- mètredumodèleetlesstratégiesdevalidation.Ilyasixdomainesmathématiquesconstituent la base du Machine Learning : l’algèbre linéaire, géométrie analytique, décomposition ma- triciel, calcul vectoriel, probabilité et distributions et optimisation. Nous nous intéressons ici à l’apprentissage supervisé en consacrant aux problèmes de classiﬁcation naïve bayésienne, Dansunpremiertempsnousaborderonslesprincipauxoutilsd’unréseaubayésienpourpou- voir prendre en charge les problèmes comportant la notion d’incertitude en générale en don- nant des déﬁnitions principales de probabilité sur plusieurs variables et en illustrant avec un exemple simpliﬁé d’un réseau bayésien. Enﬁn nous avons étudié une forme très simpliﬁée de ces réseaux est appelée réseaux bayésiens naïfs qui est basé sur le théorème de Bayes avec une forte indépendance (dite naïve) des hypothèses. Elle met en œuvre un classiﬁeur bayé- siennaïf, ou classiﬁeur naïf deBayes. Nousnous intéressonsensuite aumodèle deRégression Logistique, qui permet de résoudre des problèmes de classiﬁcation binaires. qui consistent à prédire ou classer la valeur d’une variable discrète. Dans ce cas le modèle linéaire ne convient pas, on développe alors une nouvelle fonction, c’est la fonction logistique (sigma) qui a la particularité d’être toujours comprise entre 0 et 1. A partir de cette fonction, il est possible de déﬁnir une frontière de décision. Typiquement, on déﬁnit un seuil à 0.5. Lorsqu’on teste notre modèle sur le Dataset, celui-ci nous donne des erreurs. L’ensemble de ces erreurs, c’est ce qu’on appelle la Fonction Coût. Pour la régression linéaire, la Fonction Coût donnait une courbe convexe (qui présente un unique minima). C’est ce qui fait que l’algorithme de Gra- dient Descent fonctionne. En revanche, utiliser cette fonction pour le modèle Logistique ne donnera pas de courbe convexe (dû à la non-linéarité) et l’algorithme de Gradient Descent se bloquera au premier minima rencontré, sans trouver le minimum global. Il faut donc dé- velopper une nouvelle Fonction Coût spécialement pour la régression logistique. On utilise alors la fonction logarithme pour transformer la fonction sigma en fonction convexe . L’algo- rithmedeGradientDescents’appliqueexactementdelamêmemanièrequepourlarégression linéaire.L’idée centrale du Machine Learning, c’est de laisser la machine trouver quels sont les paramètres de notre modèle qui minimisent la Fonction Coût. Enﬁn, nous avons étudié l’al- gorithme de Naïve Bayes qui permet de résoudre des problèmes de classiﬁcation à plusieurs classes de façon simple et très efﬁcace. et nous avons réalisé le projet classiﬁcation des mala- dies cardiaques en utilisant cet algorithme
dc.identifier.uri	http://dspace.univ-skikda.dz:4000/handle/123456789/1379
dc.language.iso	fr
dc.publisher	Faculté des Sciences
dc.title	Implémentation de problème de classification en utilisant Naїve Bayes
dc.title.alternative	Analyse Numérique Des Equations Aux Dérivées Partielles
dc.type	Mémoire de Master

Files

Original bundle

Now showing 1 - 1 of 1

Name:: M-515-00376-1.pdf
Size:: 5.52 MB
Format:: Adobe Portable Document Format

Download

License bundle

Now showing 1 - 1 of 1

Name:: license.txt
Size:: 1.71 KB
Format:: Item-specific license agreed to upon submission
Description:

Download

Collections

Mathématiques