Techniques d’Optimisation et d’Apprentissage pour la Recherche de l’Image par le Contenu Visuel

Loading...
Thumbnail Image
Date
2026-01
Journal Title
Journal ISSN
Volume Title
Publisher
Université du 20 Aout 1955-Skikda
Abstract
vec la croissance exponentielle de la taille des bases d’images, la recherche d’image par le contenu (CBIR en Anglais) a gagné une importance croissante dans de nombreux domaines liés à la vision par ordinateur. L’intérêt accru envers CBIR est dû à sa capacité à fournir des outils puissants pour la gestion et la recherche des images à partir de bases d’images volumineuses. CBIR est principalement basée sur l’utilisation du contenu visuel des images, comme la couleur, la texture et la forme pour extraire des caractéristiques discriminantes qui peuvent représenter les images efficacement. En particulier, la couleur et la texture sont largement utilisées dans CBIR à cause de leur capacité de discrimination. Au cours des années, la communauté de recherche en CBIR a investi des efforts énormes pour rendre les systèmes CBIR de plus en plus efficaces et efficients. Ces efforts ont été principalement concentrés sur le comblement de ce que l’on appelle le “fossé sémantique”. Ce dernier est dû à l’écart entre les caractéristiques de bas niveau extraites des images et les concepts sémantiques de haut niveau. La malédiction de la dimensionnalité est un autre problème important qui survient lorsqu’on traite des espaces de caractéristiques de haute dimension. Développer des représentations efficaces des caractéristiques de l’image est aussi un défi considérable en CBIR. Dans ce contexte, les techniques d’optimisation et d’apprentissage se sont révélées être pratiquement efficaces pour résoudre les problèmes liés à la recherche d’image par le contenu. À cet égard, nous présentons dans cette thèse plusieurs méthodes pour résoudre les principaux défis auxquels le CBIR est confronté, tout en profitant des techniques d’optimisation et d’apprentissage. Principalement, (i) Nous développons des représentations discriminantes des caractéristiques reposant sur le contenu de couleur et de texture des images, ainsi que d’autres représentations améliorées par des techniques d’optimisation. Cela vise à extraire des caractéristiques robustes et discriminantes, et ainsi réduire le fossé sémantique. (ii) Nous avons aussi utilisé des méthodes d’apprentissage profond avec des techniques d’optimisation pour réduire les caractéristiques de dimension élevée. Dans les deux cas, des métaheuristiques bien choisies sont utilisées. Spécifiquement, nous proposons deux descripteurs d’image pour extraire des caractéristiques manuelles robustes et efficaces, appelées (a) Orthogonal OCLBP (O-OCLBP) et (b)Résumé xix Orthogonal IOCLBP (O-IOCLBP). Les descripteurs proposés sont respectivement deux versions améliorées des descripteurs de couleur-texture: Opponent Color Local Binary Patterns (OCLBP) et Improved Opponent Color Local Binary Patterns (IOCLBP). Dans les deux méthodes proposées, nous utilisons un mécanisme de couleurs opposées orthogonales au lieu de la topologie circulaire utilisée dans les méthodes OCLBP et IOCLBP. De plus, nous introduisons une autre contribution qui s’appuie sur un mécanisme d’optimisation pour pondérer dynamiquement les motifs des images extraites à travers plusieurs descripteurs de texture, y compris Local Binary Pattern (LBP), Improved LBP (ILBP), Local Ternary Patterns (LTP) et Modified LBP (MLBP). Plus précisément, la méthode proposée, appelée (c) Dynamic Pattern Weighting (DPW) utilise l’algorithme de l’évolution différentielle (Differential Evolution, DE) pour générer un vecteur de poids optimal pour chaque classe de la base d’images pour être utilisé pour la pondération des motifs de l’image. D’autre part, nous proposons trois approches pour réduire la dimension élevée des caractéristiques extraites à partir des images histopathologiques. (d) Nous utilisons une technique d’optimisation basée sur l’algorithme d’optimisation par essaim de particules (Particle Swarm Optimization, PSO) pour réduire la dimension des caractéristiques ILBP extraites de multiples espaces de couleur et combinées dans un vecteur de caractéristiques robuste, mais au prix d’une dimension élevée. (e) Dans un développement ultérieur de cette contribution, nous étendons l’approche précédente par l’utilisation d’une technique d’optimisation basée sur l’algorithme sinus-cosinus (Sine Cosine Algorithm, SCA) pour réduire la dimension d’autres caractéristiques de couleur et texture, à savoir LBPs-Combinés et OCLBPsCombinés. Nous utilisons aussi une base supplémentaire d’images histopathologiques pour une évaluation plus approfondie de la méthode de réduction de dimension. F) Enfin, dans un autre travail, nous appliquons l’apprentissage par transfert sur les réseaux de neurones convolutifs pré-entraînés ResNet18 et GoogLeNet pour extraire des caractéristiques de haut niveau. Par la suite, nous utilisons un mécanisme de réduction de dimensionnalité basé sur SCA pour optimiser ces caractéristiques basées sur l’apprentissage. Dans l’ensemble, toutes les méthodes proposées marquent un progrès significatif dans la résolution des problèmes clés dans CBIR. Soulignons que les résultats obtenus montrent une performance supérieure comparée à celles de certaines méthodes existantes
Description
Keywords
Techniques d’Optimisation
Citation
Collections