🤖 Intelligence Artificielle
Multimodal
IA multimodale
Définition
Modèle IA capable de traiter plusieurs types de données en entrée : texte, images, audio, vidéo. GPT-4o, Claude 3 et Gemini Ultra sont des modèles multimodaux.
Exemples concrets
- 1Analyser une facture en image et en extraire les données
- 2Décrire le contenu d'un schéma ou d'un graphique
Termes liés
LLM
Modèle de langage de grande taille entraîné sur d'immenses corpus de textes. Les LLMs (GPT-4, Claude...
IA générative
Branche de l'IA capable de créer du contenu original : texte, images, audio, vidéo, code. Les LLMs c...
OCR
Technologie permettant d'extraire du texte à partir d'images ou de documents scannés. Indispensable ...