RAG
RAG (Retrieval Augmented Generation) est un pattern d'architecture IA qui enrichit les réponses des grands modèles de langage (LLM) en leur fournissant des données métier pertinentes récupérées dynamiquement. Plutôt que de se fier uniquement aux connaissances du modèle, le système recherche d'abord des documents pertinents dans une base vectorielle, puis les injecte dans le contexte du LLM.
Le fonctionnement :
- Indexation : les documents métier sont découpés en chunks, transformés en vecteurs (embeddings) et stockés dans une base vectorielle (pgvector, Pinecone, Weaviate).
- Recherche : quand l'utilisateur pose une question, elle est convertie en vecteur et les documents les plus similaires sont récupérés.
- Génération augmentée : les documents pertinents sont injectés dans le prompt du LLM, qui génère une réponse contextualisée et sourcée.
- Flexibilité : s'adapte à tous types de données (documentation, base de connaissances, données produit, historique client).
- PostgreSQL + pgvector : permet d'implémenter le stockage vectoriel directement dans PostgreSQL, sans infrastructure supplémentaire.
Le RAG est le pattern d'architecture IA que nous implémentons le plus fréquemment pour nos clients. C'est la réponse la plus pragmatique au besoin de connecter un LLM à des données métier spécifiques : FAQ intelligentes, recherche dans la documentation, assistants produit. Nous privilégions l'implémentation avec pgvector dans PostgreSQL — un outil que nous maîtrisons déjà — ce qui évite d'ajouter une base vectorielle dédiée à l'infrastructure. C'est une approche éprouvée et accessible.
Notre stack
Tout ce que nous considérons comme fondamental pour réussir un projet. Nos équipes disposent de la connaissance et sont en maîtrise. Les avantages et bénéfices ont été démontrés
En exploration
Nos équipes sont encore en train d'acquérir de l'expérience pour généraliser l'adoption.
En veille
Nos équipes ont identifiés ces candidats pour des études et expérimentations plus poussées qui conduiront en cas de succès à une phase d'adoption.
En retrait
Ce qui est actuellement utilisé mais que nous déconseillons dorénavant d'employer car est en rupture avec nos exigences et standards.
Vous avez un projet ?
Parlons en !