maths for image classification, Study notes of Mathematics

maths for image classification

Typology: Study notes

2022/2023

Uploaded on 10/07/2023

amine-bouobida
amine-bouobida 🇲🇦

1 document

1 / 93

Toggle sidebar

This page cannot be seen from the preview

Don't miss anything!

bg1
Royaume du Maroc
Université Chouaib Doukkali
Faculté des Sciences
El Jadida
Département informatique
Science mathématique et informatique BD
Projet de Fin d'Études
Année Universitaire 2023-2024
Présenté et réalisé par Amine Bouobida
Encadré par Hassan Silkan
SOUTENU LE 16/07/2023
Année universitaire : 2023 / 2024
machine learning & Deep learning
pour la Reconnaissance d'Objets 3D
machine learning & Deep learning
pour la Reconnaissance d'Objets 3D
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d

Partial preview of the text

Download maths for image classification and more Study notes Mathematics in PDF only on Docsity!

Royaume du Maroc Université Chouaib Doukkali Faculté des Sciences El Jadida

Département informatique

Science mathématique et informatique BD

Projet de Fin d'Études

Année Universitaire 2023 -20 24

Présenté et réalisé par Amine Bouobida

Encadré par Hassan Silkan

SOUTENU LE 16 /0 7 /20 23

Année universitaire : 2023 / 2024

machine learning & Deep learning

pour la Reconnaissance d'Objets 3 D

machine learning & Deep learning

pour la Reconnaissance d'Objets 3 D

i. Dédicaces Dédicaces à Mes Chers Parents et à Mon Respecté Professeur, Avec une profonde révérence et une gratitude sincère, je rédige ces dédicaces comme une expression profonde de l'immense impact que vous avez eu sur ma croissance personnelle et intellectuelle tout au long de ma vie. Votre soutien indéfectible, vos conseils et votre mentorat ont joué un rôle essentiel dans la formation de mon caractère et le développement de mes aspirations, des premiers instants jusqu'à ce jour. À mes chers parents, votre amour inconditionnel et vos encouragements ont été le socle de ma détermination et de mon succès. De mes premières années jusqu'à cet instant même, vos sacrifices et votre foi constante en mes capacités m'ont donné le courage de repousser les limites de mon potentiel. Votre confiance inébranlable a été une force motrice, me poussant vers l'excellence dans chaque entreprise. J'exprime ma plus sincère gratitude pour vos contributions inestimables à mon épanouissement, et je promets de rendre hommage à votre dévouement en m'efforçant sans relâche d'atteindre le sommet de mes capacités tout au long de ma vie. À mon professeur respecté, votre engagement à transmettre le savoir et à encourager la curiosité intellectuelle a laissé une empreinte indélébile sur ma croissance professionnelle. De la salle de classe au monde extérieur, votre expertise pédagogique et votre mentorat ont été cruciaux dans la formation de ma compréhension et de ma façon d'aborder les divers défis et opportunités. Je suis profondément reconnaissant pour les précieuses connaissances et la sagesse que vous m'avez transmises, lesquelles ont enrichi non seulement mon parcours académique, mais ont également nourri ma passion pour l'apprentissage continu. Je m'engage à perpétuer les leçons durables que vous m'avez enseignées et à appliquer les connaissances acquises sous votre tutelle respectée tout au long de ma vie, en visant à maintenir les plus hauts standards d'excellence dans toutes mes entreprises. Je considère comme un privilège d'avoir de tels individus remarquables comme mes phares guides, et je suis résolument déterminé à tirer le meilleur parti des précieux enseignements que vous m'avez prodigués. Fort des compétences, des connaissances et du soutien infaillible que vous m'avez accordés, je suis animé du désir non seulement d'exceller dans chaque projet et défi, mais également de contribuer de manière significative au paysage professionnel et personnel dans son ensemble. Avec une appréciation sincère et un engagement indéfectible envers l'excellence.

iii. Résumé Soutenue par les progrès récents et rapides des techniques d'acquisition 3D, la reconnaissance d'objets 3D a suscité de nombreux efforts de recherche au cours des dernières années. Cependant, plusieurs problématiques subsistent dans ce domaine, notamment la gestion de la grande quantité d'informations, l'invariance à l'échelle et à l'angle de vue, les occultations et la robustesse au bruit. Dans ce contexte, notre objectif est de reconnaître un objet 3D isolé donné dans une vue requête, à partir d'une base d'apprentissage contenant quelques vues de cet objet. Notre idée est de formuler une méthodologie locale qui combine des aspects d'approches existantes et apporte une amélioration des performances de la reconnaissance. Nous avons choisi une méthode basée sur les points d'intérêt (PIs) qui se fonde sur des mesures de variation locale de la forme. Notre sélection de points saillants repose sur la combinaison de deux espaces de classification de surfaces : l'espace SC (indice de forme - intensité de courbure) et l'espace HK (courbure moyenne - courbure gaussienne). Dans la phase de description de l'ensemble des points extraits, nous proposons une signature d'histogrammes qui intègre une information sur la relation entre la normale du point de référence et les normales des points voisins, ainsi qu'une information sur les valeurs de l'indice de forme de ce voisinage. Les expérimentations menées ont permis d'évaluer de manière quantitative la stabilité et la robustesse de ces nouveaux détecteurs et descripteurs. Enfin, nous évaluons, à l'aide de plusieurs bases publiques d'objets 3D, le taux de reconnaissance atteint par notre méthode, qui démontre des performances supérieures aux techniques existant

iv. Table des matièr

v. Introduction La détection et la reconnaissance d'objets sont des domaines essentiels dans de nombreux domaines d'application, allant de la vision par ordinateur à la robotique en passant par les systèmes autonomes et la surveillance. La capacité à identifier et localiser avec précision les objets au sein d'une image ou d'un flux vidéo revêt une importance cruciale. En effet, cela permet de réaliser des tâches telles que le suivi d'objets, la compréhension de scènes, l'interaction homme-machine, et bien plus encore. Cependant, atteindre une précision élevée dans la détection et la reconnaissance d'objets présente des défis complexes. L'un des principaux défis auxquels sont confrontés les systèmes de détection et de reconnaissance d'objets est la variabilité des conditions d'acquisition et des objets eux-mêmes. Les objets peuvent apparaître sous différentes formes, tailles, couleurs et angles de vue. De plus, les conditions d'éclairage, les occlusions et les arrière-plans encombrés peuvent rendre la tâche encore plus difficile. Les approches traditionnelles basées sur des méthodes de vue unique ont montré leurs limites dans la gestion de ces variations complexes. C'est ici que les techniques multi-vues se révèlent être une solution prometteuse pour améliorer la détection et la reconnaissance d'objets. En utilisant plusieurs points de vue ou perspectives d'un objet, les techniques multi- vues permettent d'obtenir des informations complémentaires et de mieux représenter la variabilité des objets dans un environnement réel. En exploitant cette diversité de points de vue, les systèmes de détection et de reconnaissance peuvent surmonter les limitations des méthodes de vue unique et améliorer leurs performances. Une des forces des techniques multi-vues réside dans leur capacité à fournir une représentation plus riche et robuste des objets. En utilisant des informations provenant de différentes perspectives, il devient possible de capturer les caractéristiques discriminantes des objets sous différents angles, éclairages et conditions. Cela permet une meilleure résistance aux variations et une plus grande généralisation dans la détection et la reconnaissance d'objets. De plus, les techniques multi-vues offrent également la possibilité de gérer les défis liés aux occlusions. En utilisant des vues multiples, les parties occultées d'un objet dans une vue peuvent être révélées dans d'autres vues, permettant ainsi une reconstruction plus complète de l'objet et une meilleure précision de détection.

i. Contexte Ces dernières années, l'avancement rapide de l'intelligence artificielle et des technologies d'apprentissage automatique a révolutionné divers secteurs et applications. La classification d'images et la reconnaissance d'objets, en particulier, ont connu des progrès importants, ouvrant de nouvelles possibilités dans des domaines tels que la vision par ordinateur, les systèmes autonomes et le diagnostic médical. Ce rapport de travail se penche sur le développement et la mise en œuvre d'une approche novatrice qui combine la puissance d'un réseau neuronal et d'un algorithme K-means++ modifié pour accomplir des tâches de classification d'images et de reconnaissance d'objets. L'objectif de cette recherche est de tirer parti des synergies entre ces deux techniques, en exploitant leurs forces respectives pour améliorer la précision, l'efficacité et la robustesse dans l'analyse d'images. ii. Réseau neuronal Au cœur de ce projet se trouve une architecture de réseau neuronal profond spécifiquement conçue pour les tâches de traitement d'images. Les réseaux neuronaux, inspirés de la structure du cerveau humain, excellent dans l'apprentissage de motifs complexes et de représentations de caractéristiques à partir de vastes quantités de données. La conception du réseau choisi exploite des couches convolutionnelles, permettant une extraction hiérarchique des caractéristiques, ainsi que des couches entièrement connectées, facilitant la classification finale. iii. K-means++ Modifié Traditionnellement, le regroupement K-means est une technique populaire pour regrouper des points de données en clusters en fonction de leur similarité. Cependant, dans le contexte de l'analyse d'images, le K-means standard peut souffrir de sensibilité à l'initialisation et de convergence vers des solutions sous- optimales. Pour surmonter ces limitations, nous introduisons un schéma d'initialisation K-means++ modifié, qui améliore la qualité de l'initialisation des centroïdes et favorise un meilleur comportement de convergence. iv. Objectif L'objectif principal de cette recherche est double : premièrement, développer un système de classification d'images efficace et précis qui peut

vi. Chapitre 1 : Multi-View Techniques i. multi-view techniques in object detection and recognition. Les techniques multi-vues dans la détection et la reconnaissance d'objets consistent à utiliser plusieurs points de vue ou perspectives d'un objet pour améliorer la précision et la robustesse de la détection et de la reconnaissance. Au lieu de se fier à un seul point de vue, ces techniques exploitent la diversité des points de vue pour capturer les différentes apparences, angles et conditions d'éclairage des objets. Le concept central des techniques multi-vues est d'améliorer la représentation des objets en intégrant des informations provenant de plusieurs perspectives. En considérant différents points de vue, les algorithmes acquièrent une compréhension plus complète de la forme, de la texture et de l'apparence des objets, ce qui entraîne une amélioration des performances de détection et de reconnaissance. Une approche des techniques multi-vues consiste à acquérir plusieurs images ou séquences vidéo du même objet sous différents angles ou points de vue. Cela peut être réalisé en utilisant plusieurs caméras ou en capturant des images successives d'un objet en mouvement. Chaque point de vue fournit des informations visuelles uniques sur l'objet, permettant une caractérisation plus complète. Une autre approche consiste à utiliser des modèles 3D ou des nuages de points obtenus à partir de capteurs de profondeur ou de techniques de reconstruction 3D. Ces modèles capturent la géométrie tridimensionnelle de l'objet, ce qui permet une représentation plus précise et détaillée. En utilisant des techniques multi-vues, il devient possible de prendre en compte les variations d'apparence, les changements de point de vue, les occlusions et les conditions d'éclairage différentes, ce qui améliore la capacité de détection et de reconnaissance des objets. Ces approches sont particulièrement utiles dans des domaines tels que la robotique, la réalité augmentée, la navigation autonome et la surveillance intelligente. En résumé, les techniques multi-vues exploitent la diversité des points de vue pour améliorer la détection et la reconnaissance d'objets. Elles permettent une meilleure compréhension des objets en capturant leurs différentes apparences et en les représentant de manière plus complète et précise.

ii. how multi-view techniques utilize multiple viewpoints Les techniques multi-vues jouent un rôle essentiel dans l'amélioration de la précision de la détection et de la reconnaissance d'objets en exploitant les informations obtenues à partir de plusieurs points de vue ou perspectives d'un objet. Ces techniques visent à capturer les variations d'apparence, de forme et de contexte qui se produisent lorsque les objets sont observés sous différents angles ou dans des conditions d'éclairage différentes. En considérant plusieurs points de vue, les algorithmes peuvent surmonter des défis tels que les occlusions, les changements de point de vue et les variations de posture de l'objet. Un avantage clé des techniques multi-vues est la capacité à capturer une représentation plus complète d'un objet. Chaque point de vue fournit des informations visuelles uniques, permettant de mieux comprendre les différentes caractéristiques de l'objet. Par exemple, un objet peut présenter des détails spécifiques qui ne sont visibles que sous certains angles. En combinant ces différentes perspectives, les algorithmes peuvent construire une représentation globale plus précise de l'objet, améliorant ainsi la capacité de détection et de reconnaissance. De plus, les techniques multi-vues permettent de gérer les défis liés aux changements de pose et aux variations d'éclairage. En utilisant plusieurs points de vue, les algorithmes peuvent compenser les effets de l'ombrage, des reflets ou des zones d'ombre qui peuvent affecter la qualité de la détection et de la reconnaissance. En prenant en compte ces variations, les techniques multi-vues augmentent la résilience des algorithmes aux conditions changeantes de l'environnement. Les techniques multi-vues sont utilisées dans une variété d'applications telles que la vision par ordinateur, la robotique, la réalité augmentée et la sécurité. Elles offrent des avantages significatifs en termes de précision et de robustesse de la détection et de la reconnaissance d'objets, ce qui les rend indispensables dans de nombreux domaines où une compréhension précise des objets est nécessaire. En résumé, les techniques multi-vues exploitent les informations provenant de multiples points de vue ou perspectives d'un objet pour améliorer la précision de la détection et de la reconnaissance. En combinant les différentes perspectives, elles permettent de capturer une représentation plus complète de l'objet, de compenser les variations de pose et d'éclairage, et d'obtenir des résultats plus fiables dans diverses applications.

iv. Approches de détection et de reconnaissance d'objets La détection et la reconnaissance d'objets sont des tâches fondamentales en vision par ordinateur, avec des applications allant des systèmes de conduite autonome et de surveillance à la réalité augmentée et à la robotique. La capacité à détecter et reconnaître avec précision les objets joue un rôle crucial dans la capacité des machines à comprendre et interagir avec le monde visuel. Dans ce rapport, nous discuterons des différentes approches couramment utilisées dans la détection et la reconnaissance d'objets, notamment les approches traditionnelles de vision par ordinateur, les classificateurs de cascade de Haar, les approches basées sur les caractéristiques, les approches basées sur l'apprentissage en profondeur, l'apprentissage par transfert et les approches 3D et multi-vues. En explorant ces approches, nous cherchons à comprendre leurs techniques diverses et leur importance dans l'amélioration de la détection et de la reconnaissance d'objets. Dans les sections suivantes, nous approfondirons chaque approche pour en comprendre les principes, les points forts et les applications potentielles. Permettez-nous maintenant de procéder à l'exploration des différentes approches utilisées dans la détection et la reconnaissance d'objets. v. Méthodes basées sur les caractéristiques Les méthodes de détection et de reconnaissance d'objets basées sur les caractéristiques ont une riche histoire et ont été largement utilisées dans la recherche et les applications de vision par ordinateur. L'algorithme SIFT (Scale- Invariant Feature Transform), introduit par David Lowe en 1999, est l'un des travaux pionniers dans ce domaine. SIFT a révolutionné le domaine en proposant une technique d'extraction de caractéristiques robuste et invariante, capable de gérer les variations d'échelle, la rotation et les transformations affines. Après le succès de SIFT, d'autres descripteurs de caractéristiques et algorithmes de mise en correspondance ont été développés pour améliorer les performances et l'efficacité des méthodes basées sur les caractéristiques. Un exemple notable est l'algorithme Speeded-Up Robust Features (SURF), proposé par Herbert Bay et al. en 2006. SURF a introduit une approche efficace pour la détection et la description des caractéristiques, ce qui le rend adapté aux applications en temps réel. Au fil des ans, les méthodes basées sur les caractéristiques ont fait l'objet de recherches approfondies et ont été appliquées dans divers domaines. Elles ont été utilisées dans des tâches de détection et de reconnaissance d'objets pour des applications telles que la recherche d'images, le suivi visuel et la réalité augmentée. Ces méthodes ont démontré leur efficacité dans la gestion

de scénarios difficiles, notamment les arrière-plans encombrés, les occlusions et les changements de point de vue. Grâce aux progrès de l'apprentissage profond et à la disponibilité d'ensembles de données annotées à grande échelle, les réseaux neuronaux profonds ont gagné en importance ces dernières années. Cependant, les méthodes basées sur les caractéristiques jouent toujours un rôle important, en particulier dans les cas où l'interprétabilité et la robustesse sont cruciales. Elles sont souvent utilisées en combinaison avec des approches d'apprentissage profond, formant un système hybride qui combine les forces des deux méthodes. En conclusion, les méthodes basées sur les caractéristiques ont une longue histoire dans la détection et la reconnaissance d'objets. Elles ont évolué depuis les premières techniques comme SIFT jusqu'à des algorithmes plus efficaces et plus robustes comme SURF. Ces méthodes ont été largement adoptées et ont contribué de manière significative à l'avancement de la vision par ordinateur. Malgré l'émergence de l'apprentissage profond, les méthodes basées sur les caractéristiques restent pertinentes et sont employées dans diverses applications où leurs caractéristiques distinctives et leur interprétabilité sont appréciées. Bien que les méthodes basées sur les caractéristiques se soient avérées efficaces dans la détection et la reconnaissance d'objets, elles présentent également certaines limitations et désavantages.

  1. Sensibilité au bruit de l'image : L'extraction et la correspondance des caractéristiques dans les méthodes basées sur les caractéristiques peuvent être sensibles au bruit de l'image. Les images de mauvaise qualité ou présentant du bruit peuvent conduire à une détection et une correspondance de caractéristiques inexactes, ce qui entraîne une diminution des performances de détection et de reconnaissance.
  2. Généralisation limitée : Les méthodes basées sur les caractéristiques reposent fortement sur des caractéristiques locales distinctives pouvant être détectées et appariées de manière fiable. Cependant, ces méthodes peuvent rencontrer des difficultés avec des objets qui ne présentent pas de caractéristiques distinctives ou dont l'apparence est ambiguë. Il peut être difficile de généraliser les méthodes basées sur les caractéristiques pour traiter un large éventail d'objets aux caractéristiques variées.
  3. Dépendance à l'angle de vue : Les méthodes basées sur les caractéristiques supposent souvent une plage limitée d'angles de vue et peuvent avoir du mal avec les changements importants d'angle de vue. Lorsque les objets sont observés depuis des angles de vue extrêmes ou subissent des déformations non rigides, les caractéristiques extraites peuvent ne pas correspondre correctement, ce qui entraîne une précision de détection et de reconnaissance réduite.
  4. Complexité computationnelle : Selon la complexité des algorithmes d'extraction et de correspondance des caractéristiques, les méthodes basées sur les caractéristiques peuvent être coûteuses en termes de

de traitement des données. Les algorithmes de correspondance et de classification des objets utilisent des modèles 3D ou des informations de profondeur pour effectuer des comparaisons plus précises et pour résister aux variations géométriques telles que les changements de perspective, d'échelle et de rotation. Cependant, l'utilisation de méthodes basées sur la 3D présente également des défis. En plus de la nécessité d'équipements spécifiques, la reconstruction 3D peut être un processus complexe et nécessite souvent des ressources importantes. De plus, les informations de profondeur peuvent être sensibles aux variations d'éclairage et aux textures des surfaces, ce qui peut affecter la fiabilité des résultats. Malgré ces défis, les avantages potentiels des méthodes basées sur la 3D sont significatifs. Elles permettent de capturer des informations géométriques précises, d'améliorer la résistance aux transformations géométriques et de fournir des informations plus riches pour la détection et la reconnaissance d'objets. Dans des domaines tels que la robotique, la réalité augmentée, la surveillance et bien d'autres, les méthodes basées sur la 3D offrent de nouvelles perspectives pour des applications plus précises, robustes et sophistiquées. vii. Méthodes fondées sur l'apprentissage Les méthodes basées sur l'apprentissage sont une approche prometteuse pour la détection et la reconnaissance d'objets multi-vues. Elles exploitent les algorithmes d'apprentissage automatique et d'apprentissage profond pour améliorer les performances et la généralisation des systèmes de détection et de reconnaissance d'objets. L'utilisation de l'apprentissage automatique dans la vision par ordinateur remonte aux années 1990, où des chercheurs ont commencé à explorer des méthodes telles que les machines à vecteurs de support (SVM) pour la classification d'objets. Ces approches ont permis d'extraire des caractéristiques discriminantes à partir des données d'entraînement et de les utiliser pour la détection et la reconnaissance d'objets. Au fur et à mesure des avancées technologiques et de la disponibilité de grandes quantités de données, l'apprentissage profond est devenu une approche dominante dans la vision par ordinateur. Les réseaux de neurones convolutifs (CNN) ont révolutionné la détection et la reconnaissance d'objets en permettant l'apprentissage de caractéristiques à plusieurs niveaux d'abstraction. Ces réseaux sont capables d'extraire automatiquement des caractéristiques pertinentes à partir des données brutes, ce qui élimine le besoin de conception manuelle de caractéristiques. L'apprentissage profond a également bénéficié des progrès en matière de matériel informatique, notamment l'utilisation de cartes graphiques (GPU) pour accélérer les calculs intensifs requis par les réseaux de neurones. Ces avancées ont permis de former des réseaux de neurones profonds plus grands et plus

complexes, ce qui a considérablement amélioré les performances de la détection et de la reconnaissance d'objets. Les avantages des méthodes basées sur l'apprentissage résident dans leur capacité à apprendre à partir de grandes quantités de données et à généraliser à de nouvelles situations. Ces méthodes peuvent détecter et reconnaître efficacement des objets dans différentes vues, même en présence de variations d'éclairage, d'échelle, de rotation et d'occlusion. De plus, l'apprentissage profond permet d'extraire automatiquement des caractéristiques pertinentes, ce qui réduit la dépendance à l'égard de caractéristiques manuellement conçues. Cependant, l'utilisation de méthodes basées sur l'apprentissage présente également des défis. L'un des principaux défis est la nécessité d'une grande quantité de données d'entraînement annotées pour former des modèles précis. L'annotation manuelle des données peut être un processus coûteux et fastidieux. De plus, les modèles d'apprentissage profond peuvent être sensibles aux biais des données, ce qui peut entraîner des performances moins robustes dans des situations différentes de celles rencontrées lors de l'entraînement. Les méthodes basées sur l'apprentissage, telles que l'apprentissage automatique et l'apprentissage profond, sont utilisées pour améliorer la détection et la reconnaissance d'objets multi-vues. Elles permettent d'extraire des caractéristiques discriminantes à partir des données d'entraînement et d'utiliser ces caractéristiques pour détecter et reconnaître des objets. L'apprentissage profond, en particulier, a révolutionné le domaine grâce à ses capacités à extraire automatiquement des caractéristiques pertinentes à différents niveaux d'abstraction. Cependant, l'utilisation de ces méthodes nécessite une quantité importante de données d'entraînement annotées et peut être sensible aux biais des données. Malgré ces défis, les méthodes basées sur l'apprentissage offrent des avantages significatifs en termes de performances et de généralisation dans la détection et la reconnaissance d'objets multi-vues.

sont composés de plusieurs couches qui capturent des caractéristiques de plus en plus complexes et abstraites à partir des images d'entrée. Le choix de la technique d'extraction de caractéristiques dépend des exigences spécifiques de l'application, de la nature des objets à détecter et à reconnaître, ainsi que des ressources informatiques disponibles. Il est important de sélectionner des caractéristiques discriminantes et informatives pour une classification précise. Les caractéristiques discriminantes sont celles qui présentent des différences significatives entre les différentes classes d'objets, ce qui les rend efficaces pour distinguer un objet d'un autre. L'importance de la sélection de caractéristiques discriminantes réside dans leur capacité à capturer les caractéristiques uniques des objets qui sont pertinentes pour la classification. En se concentrant sur les caractéristiques distinctives, les algorithmes de classification peuvent différencier de manière plus précise entre les différentes classes d'objets et améliorer la préc

viii. Chapitre 3 : Descripteurs i. Introduire le concept de descripteurs Les descripteurs sont des éléments clés dans la détection et la reconnaissance d'objets en vision par ordinateur. Ils représentent des informations visuelles importantes, telles que la couleur, la texture et la forme, qui permettent de caractériser les objets de manière distinctive. Les descripteurs extraient des caractéristiques significatives des images, les transformant en représentations numériques exploitables par les algorithmes de classification. Ils jouent un rôle crucial dans la distinction des objets d'intérêt par rapport au fond ou à d'autres éléments de l'image. En choisissant des descripteurs appropriés et discriminants, on peut améliorer la précision de la détection et de la reconnaissance d'objets, ce qui est essentiel pour de nombreuses applications pratiques, telles que la surveillance, la robotique et la réalité augmentée. ii. le rôle des descripteurs Les descripteurs jouent un rôle essentiel dans la capture des caractéristiques visuelles spécifiques des objets. Ils sont conçus pour extraire des informations pertinentes des images qui sont discriminantes et représentatives des objets d'intérêt. Les descripteurs permettent de capturer des aspects visuels tels que la couleur, la texture, la forme, les contours et d'autres attributs visuels distinctifs. En identifiant et en quantifiant ces caractéristiques, les descripteurs permettent de représenter les objets de manière numérique, facilitant ainsi leur comparaison et leur reconnaissance ultérieure. Par exemple, un descripteur de couleur peut extraire les histogrammes des différentes composantes de couleur dans une image, fournissant ainsi une représentation statistique de la distribution des couleurs présentes. Les descripteurs sont conçus pour être robustes aux variations telles que l'éclairage, l'échelle, la rotation et l'occlusion. Ils sont capables de capturer des informations spécifiques aux objets qui les distinguent des autres éléments de l'image. Par conséquent, les descripteurs permettent de capturer des caractéristiques visuelles uniques des objets, ce qui facilite leur détection, leur reconnaissance et leur classification précise dans des tâches de vision par ordinateur. En résumé, les descripteurs jouent un rôle crucial dans la représentation des objets en capturant des caractéristiques visuelles spécifiques. Leur