Vision Transformers pour la Reconnaissance des Emotions à partir des Expressions Faciales

Loading...
Thumbnail Image
Date
2024
Journal Title
Journal ISSN
Volume Title
Publisher
Faculté des Sciences
Abstract
Au cours de la dernière décennie, les systèmes intelligents ont fourni des services pu- bliques, entraînant un changement important dans l’environnement de vie des gens, mais il reste encore de nombreux problèmes à résoudre pour s’assurer qu’ils travaillent ensemble de manière sûre, fiable et efficace. Notre mémoire portait sur la compréhension des émotions, une caractéristique essentielle qui reflète les aspects humains du comportement humain. Nousavonsutilisélemodèlepré-entraînéVisionTransformer(ViT),quiestl’unedesder- nières technologies basées sur la structure du Transformer pour atteindre des performances exceptionnelles dans les tâches de reconnaissance d’image, dépassant de nombreux modèles traditionnels dans ce domaine. ViT a s’appuie sur la division de l’image en petites parties et son traitement à l’aide de la technologie de Transformer pour comprendre le contexte plus en profondeur et améliorer la précision de la prédiction. Nous avons entraîné le modèle plusieurs fois pour obtenir les meilleurs résultats dans la classification des émotions à travers les expressions faciales. Nous avons mené une série d’expériencessur l’ensemblede données ExtendedCohn Kanade(CK+) pourdéterminer les paramètres optimaux pour la structure Vit, où la précision de classification a atteint 100%. Nous avons également évaluer notre système sur un autre jeu de données OAHEGA, où la précision de classification était de 90%. Ces résultats sont très satisfaisants, notamment lorsqu’on les compare à certains travaux récents de la littérature
Description
Keywords
Citation
Collections