DSI - transverse
June 25, 2026
June 26, 2026
Partager sur :

Qualité des données pour l'IA : 96% des organisations françaises ne sont pas prêtes.

Table des matières

Article rédigé à partir du Baromètre national DSI Data & IA — consortium DavinciDoc (Efalia, Wikit, Laboratoire Hubert Curien), avec le soutien de BPI France.

L'intelligence artificielle est devenue un sujet de comité de direction. Budgets débloqués, pilotes lancés, licences Copilot activées. Et pourtant, pour la majorité des organisations françaises, l'IA reste au stade de l'expérimentation. Pas faute de volonté. Faute de fondations.

Le premier Baromètre national DSI Data & IA vient de poser un diagnostic chiffré sur ce décalage. Les résultats sont clairs, parfois brutaux. Et ils pointent tous vers le même responsable.

🔑 L'essentiel à retenir

  • 96% des organisations françaises estiment que leurs données ne sont pas prêtes pour l'IA — seules 4% les qualifient de normalisées, enrichies et gouvernées.
  • Le facteur n°1 de l'adoption IA n'est pas le budget ni le modèle choisi : c'est la qualité des données. Les organisations IA-ready affichent un score d'adoption 2,4 fois supérieur à celles dont les données sont hétérogènes.
  • 4 fondations déterminent votre niveau de maturité : qualité des données, posture cloud, équipe data, gouvernance.
  • Ce que vous devez faire maintenant : auditer votre patrimoine documentaire avant de lancer un quelconque projet IA.

Pourquoi l'IA stagne dans les organisations françaises : le vrai responsable

La réponse est dans les données du baromètre. Et elle est sans appel.

Les organisations dont les données sont IA-ready affichent un score d'adoption 2,4 fois supérieur à celles dont les données sont hétérogènes. Ce n'est pas une corrélation anecdotique. C'est le résultat le plus structurant de l'étude.

Le baromètre mesure le niveau d'adoption de l'IA sur une échelle de 0 à 3, allant de « aucune expérimentation » à « déploiement généralisé ».
Le gradient selon la qualité des données est sans appel :

Score d'adoption IA selon la qualité des données — Baromètre DSI 2026

Qualité des données Score d'adoption Progression
Données hétérogènes, faible volume 0,90 / 3
Données partiellement préparées 1,60 / 3
Données bien préparées 2,07 / 3
Données IA-ready normalisées, enrichies et gouvernées ✓ IA-ready 2,20 / 3

Source : Baromètre national DSI Data & IA — consortium DavinciDoc (Efalia, Wikit, Laboratoire Hubert Curien), soutenu par BPI France

Ce n'est pas le modèle IA qui détermine votre adoption. C'est ce que vous lui donnez à manger.

La dynamique est bidirectionnelle. Les organisations qui investissent dans l'IA investissent aussi dans la qualité de leurs données — et inversement. C'est un cercle vertueux pour ceux qui y entrent. Un cercle vicieux pour les autres.

Le constat central est implacable : 96% des organisations estiment leurs données non prêtes. 25% les décrivent comme hétérogènes et de faible volume. 49% comme « partiellement préparées » — utilisables, mais lacunaires. La quasi-totalité du marché français est en retard sur ses fondations data.

Avant de parler de modèle, d'architecture RAG ou de copilote, posez-vous une question simple : sur quelles données allez-vous faire tourner tout ça ?

Les 4 facteurs qui font la différence — ce que le baromètre mesure

Le baromètre croise quatre dimensions dont dépend l'adoption réelle de l'IA dans une organisation. Voici ce que les chiffres disent :

Les 4 facteurs qui font la différence — Baromètre DSI 2026

Facteur Ce que mesure le baromètre Impact observé
Qualité des données IA-ready vs données hétérogènes ×2,4 d'adoption
Posture cloud Multi-cloud vs on-premise ×1,9 d'adoption
Équipe data dédiée Centre d'excellence vs sans équipe ×1,9 d'adoption
Gouvernance IA 3 éléments ou + vs aucun ×1,4 d'adoption

Source : Baromètre national DSI Data & IA — consortium DavinciDoc (Efalia, Wikit, Laboratoire Hubert Curien), soutenu par BPI France

Ces quatre facteurs ne s'additionnent pas : ils se renforcent.

Une organisation multi-cloud sans qualité des données ne progresse pas mieux qu'une organisation on-premise bien structurée. Le baromètre l'énonce clairement : le cloud est un facilitateur, pas un déclencheur.

La gouvernance mérite une attention particulière. Son effet révèle un paradoxe contre-intuitif. Les organisations sans aucun cadre affichent un score d'adoption de 1,51/3. Celles qui n'ont mis en place qu'un seul élément descendent à 1,07/3. Puis le score remonte — jusqu'à 2,10/3 pour trois éléments ou plus.

La gouvernance à moitié faite freine l'élan. La gouvernance complète le libère.

"La gouvernance structurée n'est pas un frein à l'innovation — elle en est le catalyseur."
— Baromètre national DSI Data & IA, DavinciDoc

L'état réel de vos documents : le diagnostic en chiffres

Avant de parler d'IA, parlez de documents. Dans la majorité des organisations françaises, 80 à 90% du patrimoine informationnel est constitué de données non structurées : PDF, emails, arborescences de dossiers partagés, bases héritées. C'est sur ce terreau que l'IA documentaire doit s'enraciner.

Le baromètre dresse un portrait préoccupant :

L'état réel des documents dans les organisations françaises — Baromètre DSI 2026

Indicateur Chiffre
Ne maîtrisent pas la qualité de leur patrimoine documentaire 85%
N'ont pas sécurisé leurs fondations documentaires 75%
Classent encore manuellement leurs documents 56%
N'ont pas dépassé la recherche basique ou manuelle 56%
Ne connaissent pas leur volume documentaire annuel 24%
Utilisent NLP ou LLM pour structurer leur donnée 9% seulement
Ont déployé un chatbot ou système RAG 13% seulement

Source : Baromètre national DSI Data & IA — consortium DavinciDoc (Efalia, Wikit, Laboratoire Hubert Curien), soutenu par BPI France

Ce que cela signifie pour un projet IA : connecter un système RAG à une base mal indexée, sans métadonnées structurées, sans règles de qualité, ne produit pas des réponses médiocres. Il produit des erreurs présentées avec la légitimité d'une source interne.

"
À retenir

Garbage in, garbage out.

Le principe est vieux comme l'informatique. Il s'applique à l'IA avec une acuité nouvelle.

La distribution par niveau de maturité documentaire le confirme :

  • 27% au stade initial — pas de versionnage, suppression ad hoc
  • 48% au stade émergent — versionnage partiel, règles incomplètes
  • 19% au stade structuré
  • 6% seulement ont automatisé leur cycle de vie documentaire complet

55% du panel se retrouve dans une zone intermédiaire où l'information existe, mais ne peut pas encore alimenter un système IA de façon fiable. Le RAG est un aboutissement, pas un point de départ.

Que faire concrètement ? La feuille de route en 3 étapes

Les DSI interrogés ont identifié leurs propres priorités pour les 12 à 18 mois à venir : gouvernance et qualité des données pour 68% d'entre eux, montée en compétences pour 56%, sécurisation des usages LLM pour 43%. Ils ont parfaitement identifié leurs faiblesses. Reste à les traiter.

Le baromètre dessine une progression en trois temps — indicative, à adapter selon votre contexte et votre niveau de maturité :

Feuille de route — De la donnée hétérogène à l'IA-ready

1

Auditer et cadrer Étape 1

  • Cartographier vos sources documentaires et évaluer leur niveau de maturité réel
  • Identifier les doublons, versions contradictoires et données orphelines
  • Poser un premier cadre de gouvernance LLM : politique d'usage, périmètre autorisé
  • Sélectionner 2 ou 3 cas d'usage IA ciblés — pas plus
2

Structurer Étape 2

  • Constituer ou formaliser une équipe data dédiée, même modeste
  • Lancer des programmes de montée en compétences ancrés dans les réalités métier
  • Évaluer rigoureusement les POC avant de les étendre
3

Industrialiser Étape 3

  • Étendre les cas d'usage validés à d'autres directions métier
  • Explorer les architectures d'agents IA
  • Renforcer la souveraineté des données selon votre contexte réglementaire

Un principe à garder en tête tout au long de cette trajectoire : les modèles IA changent. La donnée documentaire, elle, reste.

GPT-4, Claude, Mistral, Llama — le marché des LLM évolue en permanence. Ce qui ne change pas, c'est la valeur de votre patrimoine documentaire : sa qualité, sa structure, sa gouvernance. Une GED bien configurée est un socle stable, agnostique du modèle que vous choisissez. Vous pouvez changer de LLM sans refaire votre fondation data.

C'est ce que pointe Anne-Laure Plessier, Product Marketing Manager chez Efalia :

Un plan de classement en GED, c'est l'ontologie de l'entreprise. Ça nous donne déjà toute la grammaire de l'organisation — l'effort restant pour alimenter un système IA en données structurées est considérablement réduit.

La structuration documentaire n'est pas une contrainte technique. C'est un investissement durable, indépendant des évolutions du marché IA.

Christophe Bouvard, co-fondateur de Wikit, illustre concrètement ce principe de connexion :

Le serveur MCP, c'est une prise universelle standard — l'USB-C de l'IA. Il permet à n'importe quel agent de se connecter à une source documentaire en respectant les droits des utilisateurs.

La question n'est donc pas « quel modèle IA choisir ? ».


Elle est : sur quelles données mon modèle va-t-il s'appuyer ?

Conclusion

96% des organisations françaises ne sont pas prêtes pour l'IA. Ce chiffre n'est pas un acte d'accusation — c'est un point de départ.

Les organisations qui avancent ont compris une chose simple : l'IA est aussi efficace que les données qu'on lui fournit. Elles ont commencé par là. Elles ont audité, structuré, gouverné. Et elles affichent aujourd'hui des scores d'adoption 2,4 fois supérieurs à leurs homologues.

La lucidité sur ses propres fondations est la première compétence IA d'une organisation.

Vous voulez savoir où vous en êtes ? Commencez par un diagnostic documentaire.

Baromètre DSI Datas X IA 2026
‍Étude complète 2026. 9 piliers. 25 axes analysés. La réalité terrain des DSI françaises — sans filtre. Par les experts du consortium DaVinciDoc.

Ces articles pourraient vous intéresser

DSI - transverse
June 24, 2026

AI hallucinations: understanding and limiting errors

96% of French organizations are not ready for AI: unstructured data, poorly fed RAG, lack of governance. Discover the 3 main causes of AI hallucinations and the 5 pillars of AI-ready EDM to go from 53% to 83% of relevance thanks to structured data and rich metadata.
DSI - transverse
June 24, 2026

Cahier des charges GED IA-ready

Structurez votre cahier des charges GED en quelques heures avec l'IA : méthode, template gratuit et option IA-ready pour anticiper les usages de demain.
Logo IA en surbrillance sur un circuit imprime bleu Efalia
DSI - transverse
June 24, 2026

GED et IA : 5 fondations techniques pour réussir votre transformation en 2026

Découvrez les 5 pilliers techniques à poser pour transformer votre GED en moteur RAG interopérable, sans changer vos outils métiers, avec à la clé +30% de pertinence sur vos réponses IA !
DSI - transverse
DSI - transverse
Text Link
DSI - transverse
Text Link
GED & IA