RéalisationRetail & Fashion · PLMEn productionRAG & recherche augmentée

RAG Centric PLM

Assistant IA conversationnel pour la base de connaissances Centric PLM, intégré directement dans Microsoft Teams

Réponse courte

RAG Centric PLM est un assistant IA conversationnel développé par Digit-AI qui transforme environ 1 400 fichiers de documentation technique Centric PLM en base interrogeable en langage naturel, accessible depuis Microsoft Teams. Les consultants et chefs de projet retail/fashion posent leurs questions et reçoivent en quelques secondes une réponse sourcée, citation à l'appui. Le pipeline RAG enchaîne un router (Claude Haiku 4.5) qui choisit les collections à interroger, une récupération hybride (Qdrant, cosine + BM25, ~54 800 chunks sur 5 collections) suivie d'un reranker cross-encoder, puis une génération (Claude Sonnet 4.6) qui rédige la réponse avec citation des sources. L'application est en production sur Azure (région francecentral), avec ingestion incrémentale depuis SharePoint et Confluence, sauvegarde versionnée et auto-healing.

Contexte

Le contexte client

Les consultants Centric PLM passent un temps considérable à chercher l'information dans une documentation riche mais dispersée

Les consultants et chefs de projet retail/fashion qui déploient Centric PLM jonglent avec une documentation très dense et éparpillée : guides d'administration, exemples d'expressions, scripts d'intégration, comptes-rendus client. Trouver la bonne réponse pouvait prendre plusieurs heures. RAG Centric PLM rend cette base interrogeable en langage naturel et répond en quelques secondes, avec citation des sources.

Documentation dispersée

Guides d'administration, exemples d'expressions, scripts d'intégration, comptes-rendus client… répartis sur plusieurs supports.

Temps de recherche élevé

Une question précise pouvait demander plusieurs heures de fouille manuelle avant d'obtenir une réponse fiable.

Multi-clients, multi-formats

Configurations spécifiques par client (Site.xml, Site.js, slicers, expressions), scripts d'intégration en SQL/CSV/XML.

Connaissance évolutive

La base s'enrichit chaque semaine : nouvelles formations, retours d'expérience client, mises à jour produit Centric.

Périmètre fonctionnel

Consultants et chefs de projet déployant Centric PLM dans le retail et la mode. Processus couverts : interrogation en langage naturel depuis Teams, réponses sourcées, exploration via interface web, ingestion incrémentale des sources et évaluation continue de la qualité.

Contraintes principales

Hébergement souverain en région francecentral · Réponses systématiquement sourcées et auditables · Base évolutive synchronisée automatiquement · Sécurité (anti-injection prompt, secrets centralisés, conteneurs non-root) · Haute disponibilité avec backup et auto-healing.

Objectifs

Ce que RAG Centric PLM résout

Trois axes pour rendre la connaissance Centric PLM instantanément accessible et fiable

Réduire le temps de recherche

Passer de plusieurs heures de fouille manuelle à quelques secondes pour obtenir une réponse précise, directement dans Teams.

KPI : heures → secondesKPI : 1 seule entrée (Teams)

Des réponses fiables et sourcées

Chaque réponse cite ses sources (fichier, collection, score) et s'appuie sur une génération à basse température pour la rigueur factuelle.

KPI : 100 % sourcéKPI : réponses auditables

Une base toujours à jour

Ingestion incrémentale depuis SharePoint et Confluence pour refléter en continu l'évolution de la connaissance, sans réindexation manuelle.

KPI : sync quotidien/hebdoKPI : ingestion delta

Fonctionnalités

Ce que permet RAG Centric PLM

Au-delà du chat conversationnel, une application pensée pour s'intégrer dans les outils du quotidien et évoluer en continu

💬

Bot conversationnel dans Teams

Pose une question dans un canal ou en chat direct et reçois une réponse en quelques secondes, sans changer d'outil. Authentification SSO Teams native.

📎

Réponses sourcées

Chaque réponse cite les chunks utilisés (nom de fichier, client, collection, score de pertinence) pour remonter au document source.

🌐

Interface web Streamlit

Pour les usages avancés : exploration des collections, statistiques d'ingestion, replay d'une évaluation sur un jeu de questions.

🔄

Ingestion incrémentale

Sync SharePoint quotidien (delta query) et Confluence hebdomadaire (espaces CBFR + CKB) : seuls les fichiers nouveaux ou modifiés sont retraités.

🛡️

Sauvegarde versionnée

Snapshot Qdrant quotidien vers Azure Blob, versioning par date et rétention GFS (7 jours / 4 semaines / 6 mois), avec restauration point-in-time.

🧪

Évaluation continue

Jeu de 39 questions d'évaluation rejouable à chaque release, avec comparatif side-by-side et auto-classification (complète / partielle / refus).

Stack

Stack Technique

Une stack moderne, en grande partie open source, déployée sur Azure Container Apps en région francecentral pour la souveraineté des données

Langage & API

Python 3.11FastAPIStreamlit

Vector & embeddings

Qdrant 1.12sentence-transformers (E5-large)BAAI bge-reranker-v2

Intelligence artificielle

Claude Haiku 4.5Claude Sonnet 4.6 (Anthropic)

Intégrations

Microsoft Bot FrameworkSharePoint (Graph API)Confluence Cloud

Infrastructure

Docker · GHCRAzure Container AppsAzure Blob Storage

CI/CD & Secrets

GitHub ActionsDoppler

Pattern différenciant — Pipeline RAG à 3 étapes routées : plutôt qu'une recherche vectorielle naïve, le pipeline enchaîne un router (Claude Haiku) qui cible les bonnes collections, une récupération hybride (cosine + BM25) suivie d'un reranker cross-encoder, puis une génération (Claude Sonnet, température 0.1) qui rédige une réponse sourcée et protégée contre l'injection de prompt. Résultat : des réponses précises, traçables et fiables sur une base de ~54 800 chunks.

Architecture

Schémas d'Architecture

Des sources synchronisées vers Qdrant, un pipeline RAG en trois étapes, et un accès double Teams + interface web — le tout sur Azure francecentral

Sources de connaissance

SharePoint Online

Drive Centric · delta quotidien (Graph API)

Confluence Cloud

Espaces CBFR + CKB · hebdomadaire

↓

Ingestion incrémentale

Chunking + embeddings E5-large

Seuls les fichiers nouveaux/modifiés

↓

Vector store

Qdrant 1.12

~54 800 chunks · 5 collections · cosine + BM25

↓

Pipeline RAG

Router (Claude Haiku 4.5)

Retrieval + reranker

Generation (Claude Sonnet 4.6)

↓

Accès utilisateur

Bot Microsoft Teams

SSO natif · réponse sourcée

Interface web Streamlit

Exploration, stats, évaluation

↓

Plateforme (Azure francecentral)

Container Apps · Blob backup GFS · Doppler

Hébergement souverain

Résultats

Impact et gains qualitatifs

Le service est en production : voici comment l'expérience consultant a évolué

~54 800

Chunks vectorisés

Répartis sur 5 collections

Collections spécialisées

Configuration · intégration · fonctionnel · référence · confluence

Sources synchronisées

SharePoint (quotidien) + Confluence (hebdo)

24/7

Disponibilité Teams

Backup quotidien + rétention GFS

Indicateur	Avant	Avec RAG Centric PLM	Gain
Temps pour trouver une info technique précise	Plusieurs heures, parfois plusieurs jours	Quelques secondes à quelques minutes	Réduit drastiquement
Accès à la documentation	Multiplication d'outils (drives, wikis, mails)	Une seule entrée : un chat dans Teams	Centralisé
Traçabilité de la réponse	Difficile (de mémoire ou par capture)	Chaque réponse cite ses sources	Auditable
Mise à jour de la base	Indexation manuelle, occasionnelle	Sync SharePoint quotidien + Confluence hebdo	Automatisé
Sécurité des données	Documents diffusés par mail, pièces jointes	Hébergement Azure francecentral, anti-injection	Renforcé

Sécurité & opérations

🇪🇺

Hébergement souverain

Tous les services en région francecentral (Paris) sur Azure. Ingress interne entre services, ingress externe limité à l'API et au web.

🔐

Secrets centralisés

Gestion via Doppler puis injection comme secrets référencés dans les Container Apps. Aucune clé en clair, audits bandit / gitleaks / hadolint.

🧱

Anti-injection prompt

Le system prompt protège contre l'injection de prompt utilisateur. Filtre de rédaction des secrets dans les logs, conteneurs en utilisateur non-root.

♻️

Backup & restore

Snapshot Qdrant quotidien vers Azure Blob, copie versionnée avec rotation GFS et restauration point-in-time en une commande.

🚦

Auto-healing

Un job sentinelle s'exécute toutes les 15 minutes : si une collection Qdrant est vide alors qu'un backup existe, il restaure automatiquement.

⚙️

CI/CD GitOps

Un push sur main déclenche le build des 5 images Docker via GitHub Actions, le push vers GHCR et le déploiement des Container Apps.

Exemples

Exemples de questions traitées

Quelques questions réelles posées à l'application (extrait du jeu d'évaluation interne), illustrant la diversité des sujets couverts

Comment fait-on un watchAttribute dans Centric PLM ?

L'API JavaScript watchAttribute est configurée dans Site.js pour déclencher une action quand un utilisateur modifie la valeur d'un attribut sur un nœud. Plusieurs patterns existent (même nœud, nœud cible, plusieurs nœuds via changeList).

Sources : 5 chunks des collections configuration et référence (Centric Configuration Training, AAT-AdvancedAttributeConfiguration).

Quelle est la différence entre les attributs list, map et vector ?

La réponse synthétise les trois structures, leur cas d'usage typique en configuration Centric, et renvoie aux exemples Site.xml correspondants pour chaque type d'attribut.

Sources : Chunks issus de configuration, formations Centric et exemples d'intégration client.

Quelles sont les grandes étapes d'un projet de montée de version PLM ?

L'application liste le séquencement type (préparation, pré-prod, recette, prod), avec les points d'attention par module et les références aux release notes Centric.

Sources : Chunks référence, release notes Centric v7.4, fiches projet.

Et si on commençait par en parler ?

Pas de commercial agressif. Pas de formulaire en 12 étapes. Juste 30 minutes pour comprendre votre situation et voir si on peut vous aider. Premier échange gratuit et sans engagement.