Les bases de connaissance sont des collections d’articles aux contenus riches et parfois personnalisables via des templates, qui formalisent les connaissances de l’entreprise dans n’importe quel domaine. Typiquement, elles apportent des réponses aux questions que les clients ou employés sont susceptibles de poser sur les produits, services et processus de l’entreprise. L’exploitation d’une telle base prend de multiples formes. Par exemple, un chabot ou un moteur de recherche analyse chaque question afin d’orienter l’utilisateur vers le ou les articles adéquats. En amont, un travail important est effectué afin de créer et gérer ces articles sur l’ensemble de leur cycle de vie. Les IA génératives pourraient bouleverser ce processus pourtant bien rôdé depuis le milieu des années 2000. Plusieurs scénarios se dessinent, de la disparition pure et simple de ces bases à leur conservation pratiquement en l’état. 

Scénario 1 : les bases de connaissance traditionnelles disparaissent 

 Ce n’est pas le scénario privilégié à court ni même à moyen terme mais il a le mérite de poser la question de l’impact des IA génératives sur les bases de connaissance. Ce scénario part d’un double constat. Tout d’abord, actuellement, les articles d’une telle base sont généralement présentés tels quels aux utilisateurs, dès lorsqu’ils semblent répondre à la question posée. Or, une IA générative est capable de générer en mode conversationnel des réponses sur-mesure dont le nombre est potentiellement infini. Dès lors, plutôt que de passer du temps à créer des centaines d’articles, il peut sembler suffisant de fournir à cette IA, en mode fine tuning ou via des prompts, les informations brutes à partir desquelles les rédacteurs auraient rédigé ces articles. En somme, pour l’IA, la base de connaissance telle qu’on l’entendait jusque-là devient une étape intermédiaire superflue. Ce scénario est évoqué par certains spécialistes mais avec une grande prudence. Il se heurte en effet à des difficultés. Les LLM sur lesquels sont basées ces IA ont en effet tendance à inventer des réponses plutôt que d’avouer leur ignorance – ce sont les fameuses hallucinations. De plus, elles ne sont pas toujours en mesure de fournir précisément les données sources qui leur ont permis de générer une réponse. En somme, ces IA génératives posent encore des problèmes de pilotage et de traçabilité. 

Que faut-il faire ? Ce scénario nécessiterait une refonte complète des bases de connaissance de l’entreprise mais il est peu probable qu’il se réalise rapidement. Il est urgent d’attendre. 

Scénario 2 : les bases de connaissance conservent leur forme actuelle mais sont démultipliées par l’IA 

Dans le scénario le plus probable, à un horizon de deux ou trois ans, la base de connaissance est conservée dans sa forme actuelle, tout d’abord parce qu’elle permet de forcer les réponses à des questions récurrentes et jugées essentielles. Même dans ce scénario, l’IA générative à un rôle important à jouer. Elle permet tout d’abord de mieux identifier les articles correspondant à une demande et de mieux cibler la réponse, en sélectionnant non pas un article entier mais un extrait, en agrégeant au contraire plusieurs articles ou encore en contextualisant la réponse (par exemple selon le niveau d’expertise de l’utilisateur). Les réponses sont de facto sourcées puisque directement liées à des articles. Il est en outre plus facile de contrôler la qualité des données sur lesquelles est entrainée l’IA, lorsque celles-ci sont structurées dans une base d’articles plutôt que disséminées dans une multitude de documents disparates. Parallèlement, l’IA générative facilite la rédaction des articles, par exemple en générant des brouillons ou des résumés à partir de données brutes. 

Que faut-il faire ? Dès aujourd’hui, ce scénario permet de remplacer l’interface utilisateur (souvent basée sur un moteur de recherche) par une IA générative qui sera plus efficace pour identifier les articles correspondant aux questions posées. Sans effort important, l’IA peut également faciliter la création de nouveaux articles. 

Scénario 3 : les bases de connaissance subsistent provisoirement 

À moyen ou long terme, les problèmes d’hallucination des IA seront probablement résolus. De plus, les IA analytiques ou génératives permettront d’automatiser de mieux en mieux les processus d’identification des données redondantes, erronées, incomplètes, manquantes ou obsolètes, parmi une masse de données sources brutes. Il sera également sans doute possible de sourcer les réponses et de piloter l’IA afin d’imposer certaines réponses. On atteindra alors un point où la confiance sera suffisante pour que l’on puisse se passer des bases de connaissance structurées. La migration vers une IA générative sans une telle base pourrait être progressive, avec la conservation provisoire d’articles pour certaines questions. 

Que faut-il faire ? Lancer les actions du scénario 2 tout en réfléchissant à l’utilisation de l’IA générative pour composer des réponses personnalisées à partir d’un ou plusieurs articles. Dès lors que ces articles ne seront, à terme, généralement plus lus que par les IA, on pourra envisager d’en simplifier la structure et le design. La voie sera ouverte à l’éventualité d’un abandon progressif des bases de connaissances traditionnelles.

Florian Lamboley, Directeur technique d’Almavia CX