Ressource pédagogique

Glossaire IA

Les termes essentiels de l'intelligence artificielle, du Machine Learning au déploiement en production, expliqués simplement.

7Concepts fondamentaux

Intelligence Artificielle (IA)

Ensemble de techniques permettant à des machines de simuler des capacités cognitives humaines.

L'intelligence artificielle désigne l'ensemble des théories, méthodes et techniques visant à créer des systèmes capables d'accomplir des tâches qui nécessitent normalement l'intelligence humaine : reconnaissance visuelle, compréhension du langage, raisonnement, décision, apprentissage. Elle englobe le machine learning, le deep learning, et les modèles génératifs.

Machine Learning (ML)

Branche de l'IA où les systèmes apprennent à partir de données sans être explicitement programmés.

Le Machine Learning (apprentissage automatique) est une branche de l'IA qui permet aux systèmes d'apprendre et de s'améliorer à partir de l'expérience, sans être explicitement programmés pour chaque règle. On distingue l'apprentissage supervisé (données étiquetées), non supervisé (découverte de patterns), et par renforcement (apprentissage par essai-erreur avec récompenses).

Deep Learning

Apprentissage profond basé sur des réseaux de neurones artificiels à plusieurs couches.

Le Deep Learning (apprentissage profond) est une sous-catégorie du Machine Learning qui utilise des réseaux de neurones artificiels composés de nombreuses couches (d'où le terme « profond »). Ces architectures sont particulièrement efficaces pour traiter des données complexes comme les images, la voix ou le texte. Les LLM et les modèles de vision reposent presque tous sur le deep learning.

Dataset (Jeu de données)

Ensemble structuré de données utilisé pour entraîner, valider ou tester un modèle d'IA.

Un dataset est un corpus de données structurées utilisé pour l'entraînement et l'évaluation des modèles d'IA. Sa qualité (pertinence, diversité, absence de biais) est souvent plus déterminante que la puissance brute de l'algorithme. On parle de dataset d'entraînement, de validation et de test.

Prompt

Instruction textuelle donnée à un modèle d'IA pour obtenir une réponse ou une génération.

Le prompt est l'instruction ou la question que l'on soumet à un modèle de langage (LLM) pour obtenir une réponse. La qualité du prompt — sa clarté, sa structure, son contexte — détermine directement la pertinence de la sortie. Le « prompt engineering » consiste à optimiser ces instructions pour obtenir les meilleurs résultats.

Prompt Engineering

Art et science de formuler des instructions optimales pour guider les modèles de langage.

Le prompt engineering est la discipline consistant à concevoir des instructions (prompts) de manière structurée et stratégique pour maximiser la qualité des réponses d'un modèle de langage. Cela inclut la définition du rôle, le contexte, les contraintes, les exemples (few-shot), et le format de sortie souhaité. C'est aujourd'hui une compétence clé pour toute équipe utilisant l'IA.

Token

Unité de texte (mot, syllabe ou caractère) traitée par un modèle de langage.

Un token est l'unité atomique de texte utilisée par les modèles de langage. Selon le modèle, un token peut représenter un mot entier, une syllabe, ou même un caractère. Le coût et les limites d'un LLM (fenêtre de contexte) sont généralement exprimés en tokens. En français, 1 token ≈ 0,75 mot en moyenne.

11Techniques & Modèles

LLM (Large Language Model)

Modèle de langage de grande taille entraîné sur des milliards de documents pour générer et comprendre le texte.

Un LLM (Large Language Model ou Grand Modèle de Langage) est un réseau de neurones entraîné sur des milliards de pages texte pour prédire la suite logique d'une séquence de mots. Les LLM comme GPT-4, Claude ou Mistral sont capables de rédiger, résumer, traduire, coder, analyser, et converser dans de multiples langues. Leur performance dépend de leur taille (nombre de paramètres) et de la qualité de leur entraînement.

Transformer

Architecture de réseau de neurones fondatrice des LLM modernes, basée sur l'attention.

Le Transformer est une architecture de réseau de neurones introduite en 2017 qui repose sur le mécanisme d'« attention ». Contrairement aux modèles séquentiels (RNN), il traite l'ensemble des mots d'une phrase en parallèle, capturant les relations entre eux quelle que soit leur distance. C'est l'architecture sous-jacente de GPT, BERT, Claude et la quasi-totalité des LLM.

RAG (Retrieval-Augmented Generation)

Technique qui enrichit les réponses d'un LLM avec des données récupérées en temps réel.

Le RAG (Génération Augmentée par Récupération) est une technique qui combine un modèle de langage avec une base de connaissances externe. Au lieu de se fier uniquement à sa mémoire d'entraînement, le modèle récupère des documents pertinents (via une base vectorielle) pour générer une réponse à jour et sourcée. C'est la clé pour créer des copilotes documentaires et des chatbots métier fiables.

Fine-tuning

Réentraînement partiel d'un modèle existant sur des données spécifiques à un domaine.

Le fine-tuning consiste à reprendre un modèle pré-entraîné (comme GPT-4o ou Llama) et à l'affiner sur un corpus spécifique à un domaine ou une tâche. Cela permet d'adapter le modèle à un vocabulaire métier, un ton particulier, ou des formats de sortie précis, tout en nécessitant moins de données et de calculs que l'entraînement from scratch.

Embedding

Représentation vectorielle d'un texte qui capture son sens sémantique.

Un embedding est une représentation numérique (vecteur) d'un texte, d'une image ou d'un objet dans un espace à plusieurs dimensions. Deux contenus sémantiquement proches auront des embeddings proches dans cet espace. C'est la base des recherches sémantiques et des bases vectorielles utilisées dans les systèmes RAG.

Vector Database

Base de données optimisée pour stocker et rechercher des vecteurs (embeddings) par similarité.

Une base de données vectorielle (Pinecone, Weaviate, Chroma, Qdrant, pgvector…) stocke des embeddings et permet de retrouver rapidement les vecteurs les plus proches d'une requête donnée. C'est l'infrastructure centrale des systèmes RAG : on y dépose la connaissance de l'entreprise, et on y interroge pour retrouver les passages pertinents.

Agent IA

Système autonome capable de percevoir son environnement, raisonner et agir pour atteindre un objectif.

Un agent IA est un système qui combine un LLM avec des outils (API, bases de données, calculatrice, moteur de recherche…) pour accomplir des tâches complexes de manière autonome. Il perçoit, raisonne, planifie des étapes, appelle des outils, analyse leurs retours, et itère jusqu'à atteindre son objectif. Contrairement à un simple chatbot, un agent peut agir sur le monde numérique.

Zero-shot / Few-shot

Capacité d'un modèle à accomplir une tâche sans exemple (zero-shot) ou avec quelques exemples (few-shot).

Le zero-shot désigne la capacité d'un LLM à accomplir une tâche sans avoir été explicitement entraîné dessus — il suffit de lui décrire la tâche dans le prompt. Le few-shot consiste à fournir quelques exemples de paires entrée/sortie dans le prompt pour guider le modèle. Cette approche est très efficace pour structurer des réponses ou adapter un modèle sans fine-tuning.

Chain of Thought

Technique de prompting qui incite le modèle à détailler son raisonnement étape par étape.

La Chain of Thought (chaîne de pensée) est une technique de prompt engineering où l'on demande explicitement au modèle d'expliciter son raisonnement intermédiaire avant de donner sa réponse finale. Cela améliore considérablement la performance sur les tâches logiques, mathématiques et multi-étapes. Variante avancée : le Tree of Thought, qui explore plusieurs branches de raisonnement.

Neurones artificiels

Unités de calcul mathématique inspirées des neurones biologiques, organisées en couches pour apprendre des patterns.

Un neurone artificiel est une fonction mathématique qui reçoit des entrées, leur applique des poids, ajoute un biais, et passe le résultat dans une fonction d'activation. Empilés en couches, ces neurones forment des réseaux capables d'apprendre des représentations hiérarchiques de plus en plus abstraites à partir des données.

Attention

Mécanisme qui permet au modèle de se concentrer sur les parties les plus pertinentes de l'entrée.

Le mécanisme d'attention, au cœur des Transformers, permet au modèle de pondérer dynamiquement l'importance de chaque mot (ou token) par rapport aux autres dans une séquence. Cela résout le problème des dépendances à longue distance et permet aux LLM de maintenir la cohérence sur des textes longs. L'« attention multi-tête » examine ces relations sous plusieurs angles simultanément.

9Applications métiers

Copilote IA

Assistant IA intégré à un outil métier pour augmenter la productivité des utilisateurs.

Un copilote IA est un assistant contextuel intégré dans un outil ou un flux de travail existant (Microsoft Copilot, GitHub Copilot, copilotes métiers custom). Il comprend le contexte de l'utilisateur, suggère des actions, génère du contenu ou automatise des tâches répétitives sans quitter l'interface de travail. Les copilotes documentaires RAG sont particulièrement demandés par les PME.

Automatisation intelligente

Automatisation de processus métiers enrichie par des capacités de compréhension et de décision de l'IA.

L'automatisation intelligente (ou IPA — Intelligent Process Automation) va au-delà des robots traditionnels (RPA) en intégrant des capacités de compréhension du langage, de vision et de décision. Elle permet d'automatiser des processus complexes et non structurés : tri de documents, qualification de leads, rédaction de réponses, analyse de contrats, extraction de données libres.

Chatbot / Conversational AI

Interface conversationnelle basée sur un LLM capable de dialoguer naturellement avec les utilisateurs.

Un chatbot IA moderne repose sur un LLM et peut maintenir des conversations naturelles, comprendre le contexte, et accomplir des tâches via des appels d'outils. Contrairement aux chatbots à règles (arbres de décision), il gère les formulations imprévues et les conversations multi-tours. Associé à un RAG, il devient un assistant métier fiable.

Génération de contenu (GenAI)

Création automatique de texte, image, audio ou vidéo par des modèles génératifs.

La GenAI (Générative AI) désigne les modèles capables de créer du contenu original : texte (LLM), images (DALL-E, Midjourney, Stable Diffusion), audio (synthèse vocale, musique), ou vidéo (Sora, Runway). En entreprise, elle accélère la rédaction de documents, la création de visuels marketing, et la personnalisation à grande échelle.

Analyse prédictive

Utilisation de modèles statistiques et d'IA pour anticiper des événements futurs à partir de données historiques.

L'analyse prédictive utilise des algorithmes de machine learning pour identifier des patterns dans les données historiques et en déduire des probabilités futures. Applications : prévision de demande, détection de churn client, maintenance préventive, scoring de risque, optimisation des stocks. C'est l'une des formes les plus matures de l'IA en entreprise.

Reconnaissance d'image / Vision par ordinateur

Capacité d'un système à analyser, comprendre et interpréter des images ou des vidéos.

La vision par ordinateur (Computer Vision) utilise des réseaux de neurones convolutifs pour extraire des informations d'images ou de vidéos. Applications : reconnaissance faciale, contrôle qualité industriel, comptage d'objets, lecture de documents (OCR avancé), diagnostic médical sur imagerie, surveillance de chantiers. Des modèles multimodaux récents combinent vision et langage.

Synthèse vocale (TTS)

Conversion de texte écrit en parole audio par synthèse vocale.

La synthèse vocale (Text-to-Speech, TTS) transforme un texte en audio naturel. Les modèles récents (ElevenLabs, Azure TTS, OpenAI TTS) produisent des vois quasi-indiscernables de l'humain, avec contrôle de l'intonation, du rythme et de l'émotion. Applications : assistants vocaux, contenus audio accessibles, narration de documents, réponse vocale dans les callbots.

Transcription (STT)

Conversion de la parole audio en texte écrit.

La transcription automatique (Speech-to-Text, STT) convertit l'audio en texte. Les modèles modernes (Whisper d'OpenAI, modèles Google, Azure Speech) gèrent plusieurs langues, les accents, le bruit de fond, et peuvent identifier les différents locuteurs. Applications : comptes-rendus de réunion, sous-titrage, prise de notes médicales, analyse d'appels.

Similarité sémantique

Mesure de la proximité de sens entre deux textes via leurs embeddings.

La similarité sémantique évalue si deux textes expriment la même idée, même en utilisant des mots différents. On la calcule en comparant les embeddings des textes (généralement via la similarité cosinus). C'est la base des moteurs de recherche sémantique, du clustering de documents, et de la détection de doublons intelligente.

6Infrastructure & Déploiement

API (Interface de programmation)

Protocole permettant à deux logiciels de communiquer et d'échanger des données.

Une API (Application Programming Interface) définit les règles selon lesquelles un logiciel peut interagir avec un autre. Les API d'IA (OpenAI, Anthropic, Mistral, Google…) permettent d'envoyer des prompts et de recevoir des réponses, ou d'intégrer des capacités d'IA dans des applications existantes via des requêtes HTTP standardisées.

Context Window

Volume maximal de texte (en tokens) qu'un modèle peut traiter en une seule requête.

La fenêtre de contexte (context window) est la quantité maximale de tokens qu'un LLM peut traiter en une seule fois — entrée + sortie confondues. Elle varie de quelques milliers à plusieurs millions de tokens selon les modèles (GPT-4o, Claude 3.5, Gemini 1.5 Pro). Pour les documents longs ou les conversations prolongées, un contexte large est essentiel.

Inference (Inférence)

Phase d'utilisation d'un modèle entraîné pour produire des prédictions ou des générations.

L'inférence est l'exécution d'un modèle d'IA déjà entraîné pour produire une sortie à partir d'une entrée donnée. C'est la phase « production » par opposition à l'entraînement. L'inférence peut être effectuée dans le cloud (API) ou en local (edge inference), avec des compromis entre latence, coût et confidentialité.

API Key / Clé API

Identifiant secret permettant d'authentifier les appels vers un service d'IA.

Une clé API est un token d'authentification permettant d'accéder à un service d'IA (OpenAI, Anthropic, etc.). Elle sert à identifier le client et à facturer l'usage. Sa sécurité est critique : elle ne doit jamais être exposée dans du code client (navigateur) et doit être stockée côté serveur ou dans des variables d'environnement sécurisées.

On-premise / Edge

Déploiement d'un modèle sur l'infrastructure propre de l'entreprise ou directement sur les appareils utilisateurs.

Le déploiement on-premise consiste à héberger et exécuter un modèle d'IA sur les serveurs de l'entreprise plutôt que via un service cloud. L'edge inference va plus loin en exécutant le modèle directement sur les appareils (smartphones, ordinateurs, IoT). Ces approches garantissent la confidentialité des données et réduisent la latence, mais nécessitent des ressources matérielles adaptées.

Orchestration

Coordination des différents composants d'un système d'IA (modèles, bases de données, outils).

L'orchestration désigne la coordination des multiples composants d'un système d'IA : appels aux LLM, récupération de données dans des bases vectorielles, exécution de fonctions, gestion des erreurs, logging, et chaînage des étapes. Des frameworks comme LangChain, LlamaIndex, ou des orchestrateurs custom permettent de structurer ces flux de manière fiable et maintenable.