Contact - Demande d’informations

Yanick Gourville - hocusbookus

Tel : 06 77 56 07 30 - [email protected]

Conférences, formations débats - Sur, autour et avec l’intelligence artificielle

Préambule

Ce rapport est un exemple de document construit en utilisant la fonctionnalité Deep Research de ChatGPT o1-pro. Cette fonctionnalité permet de réaliser des recherches approfondies sur le web, d'extraire des informations pertinentes de différentes sources, et de synthétiser ces données dans un rapport structuré et cohérent. L'objectif est de démontrer par le biais d’un exemple utile, comment une fonctionnalité de recherche approfondie (trouvable dans d’autres modèles - Perplexity, CoPilot, Gemini, Deepseek, …) peut assister les professionnels dans la recherche d'informations. Ce document a vocation à servir de cas concret, autant que de base de réflexion.

Introduction

Entre 2022 et 2025, les bibliothèques et médiathèques françaises ont multiplié les expérimentations autour de l’intelligence artificielle (IA). L’essor des IA offre de nouvelles opportunités pour automatiser certaines tâches professionnelles, enrichir les services aux usagers et proposer des animations innovantes. La Bibliothèque nationale de France (BnF) souligne que l’IA permet d’analyser des volumes massifs de données à une vitesse inégalée, un atout précieux pour une institution gérant plus de 40 millions de documents physiques et près de 9 millions de documents numérisés (L’intelligence artificielle au service de la Bibliothèque et de ses usagers | BnF - Site institutionnel). Dans ce rapport, nous dressons un panorama complet de l’intégration de l’IA en bibliothèque, en abordant les implémentations concrètes en bibliothéconomie, les services novateurs offerts aux usagers, des cas pratiques avec retours d’expérience et les enjeux éthiques et réglementaires soulevés. Une sitographie détaillée en fin de document recense l’ensemble des sources consultées.

1. Expérimentations et implémentations en bibliothéconomie

1.1 Automatisation des processus documentaires (catalogage, indexation, métadonnées)

Les professionnels des bibliothèques explorent l’IA pour automatiser des tâches documentaires fastidieuses, tout en améliorant la qualité des données. L’Agence Bibliographique de l’Enseignement Supérieur (ABES) a ainsi mené dès 2021-2022 des projets pilotes exploitant le machine learning sur le catalogue collectif Sudoc. Une première étude a porté sur l’indexation automatique à l’aide du langage d’indexation RAMEAU : un prototype a été développé pour suggérer des sujets RAMEAU pertinents à partir du titre et du résumé d’un document (Acclimatation de l’IA à l’Abes : la période des semis – Arabesques). Ce défi est de taille étant donné le vocabulaire très vaste (100 000 termes) et le caractère subjectif de l’indexation intellectuelle. Après des résultats prometteurs, l’ABES a annoncé la poursuite de ces travaux en 2023 en collaboration avec une société spécialiste de l’IA, avec pour objectif de déployer cet algorithme sur ses données et de le proposer en web service ouvert (par exemple via l’outil Annif) (Acclimatation de l’IA à l’Abes : la période des semis – Arabesques) (Acclimatation de l’IA à l’Abes : la période des semis – Arabesques). Une deuxième étude à l’ABES a expérimenté la reconnaissance d’entités nommées (NER) dans les notices bibliographiques : il s’agissait d’identifier automatiquement, au sein des mentions de responsabilité textuelles, les noms de personnes et les fonctions associées (auteur, réalisateur, etc.) (Acclimatation de l’IA à l’Abes : la période des semis – Arabesques). Des milliers de notices ont dû être annotées manuellement pour entraîner le modèle d’IA, démontrant l’importance du travail expert en amont. Ces prototypes visent à assister les catalogueurs en repérant les auteurs oubliés dans les zones dédiées ou en proposant le bon code de fonction (Acclimatation de l’IA à l’Abes : la période des semis – Arabesques) (Acclimatation de l’IA à l’Abes : la période des semis – Arabesques).

En matière de liaison automatisée aux autorités, l’ABES capitalise aussi sur des outils d’IA plus anciens. Le programme Qualinka, lancé dès 2012, applique des techniques d’IA symbolique pour suggérer des liens entre notices bibliographiques (ex. auteurs figurant dans une notice de monographie) et notices d’autorité IdRef correspondantes (Acclimatation de l’IA à l’Abes : la période des semis – Arabesques) (Acclimatation de l’IA à l’Abes : la période des semis – Arabesques). Intégré depuis 2019 à l’interface des catalogueurs du Sudoc (Paprika), Qualinka fournit une aide à la décision précieuse pour créer ou corriger des liens entre notices (Acclimatation de l’IA à l’Abes : la période des semis – Arabesques). Là encore, l’IA sert à accélérer le travail de catalogage sans s’y substituer entièrement. Comme le résume Yann Nicolas de l’ABES : « L’IA ne remplacera pas le catalogage ni d’autres formes de curation de données. Au contraire, il faut des données de qualité, validées par des professionnels, pour faire apprendre les machines. L’IA peut aider là où le travail humain serait trop fastidieux ou incapable de digérer la masse des documents à décrire et analyser. » (Acclimatation de l’IA à l’Abes : la période des semis – Arabesques). Cette vision illustre le rôle complémentaire de l’IA : automatiser les tâches à faible valeur ajoutée et à grande échelle, tout en s’appuyant sur l’expertise humaine pour le contrôle qualité des métadonnées.

D’autres institutions nationales exploitent l’IA pour enrichir les processus documentaires. La BnF, via son programme de R&D, a développé des projets tels que GallicaPix (outil de recherche iconographique piloté par IA) et GallicaEnv (constitution d’un corpus thématique sur l’environnement via IA et recherche sémantique), lancés en 2021 pour explorer autrement les collections numériques de Gallica (IA et bibliothèques : les cas d’usage | Archimag). L’IA sert aussi à l’indexation automatique en archives ouvertes : par exemple le projet ISSA (piloté par le Cirad depuis 2020) applique une indexation sémantique automatique aux publications scientifiques afin d’offrir des outils d’exploration aux chercheurs et documentalistes (IA et bibliothèques : les cas d’usage | Archimag). Enfin, des algorithmes de machine learning sont déployés pour la qualité des données : le réseau WorldCat d’OCLC utilise déjà l’apprentissage automatique pour détecter des doublons parmi des millions de notices bibliographiques (L’IA dans un catalogue de bibliothèques, pour des conseils plus pertinents), améliorant ainsi la fiabilité du catalogue collectif international.

<aside> 💡

Focus : L’indexation automatique RAMEAU à l’ABES

L’ABES a testé dès 2021-2022 une IA pour suggérer automatiquement des sujets RAMEAU à partir des titres et résumés des documents.

Objectif : Accélérer le catalogage et homogénéiser les métadonnées.

Défi : Gérer un vocabulaire de 100 000 termes et limiter les erreurs d’association.

Résultat : Un taux de pertinence élevé, incitant l’ABES à poursuivre en 2023 avec un déploiement en web service.

Points clés : Automatisation documentaire avec l’IA

• Accélération du catalogage et de l’indexation via le machine learning.

• Recommandations assistées par IA pour les catalogueurs, mais nécessitant validation humaine.

• L’IA ne remplace pas les bibliothécaires, elle optimise leur temps.

• Développement d’outils comme Qualinka pour améliorer le liage entre notices.

</aside>

1.2 Chatbots et assistants virtuels pour bibliothécaires et usagers

(Pepper, le robot qui vous accueille à la bibliothèque | Carpentras) Pepper, robot humanoïde, a déjà été adopté dans plusieurs bibliothèques pour accueillir et aider le public (ici, robot Pepper en action). Il fait la lecture, donne des informations pratiques et peut même initier au codage (Automates et robots débarquent en bibliothèque : vers les robots bibliothécaires ? | Archimag).

Les bibliothèques innovent également en déployant des agents conversationnels capables de dialoguer avec les usagers ou d’assister le personnel. Dès 2022, la BnF a expérimenté un chatbot original sur son site Richelieu : LittéBot, un « chatbot littéraire » permettant de converser avec le personnage de Dom Juan. Ce bot s’appuyait sur une IA nourrie par un corpus de 400 pièces de théâtre du XVIIe siècle, offrant une expérience ludique aux visiteurs (IA et bibliothèques : les cas d’usage | Archimag). En 2023, c’est un pays voisin francophone qui a marqué les esprits : la Bibliothèque nationale du Luxembourg (BNL) a lancé en octobre 2023 un chatbot basé sur ChatGPT d’OpenAI, intégré à sa bibliothèque numérique eluxemburgensia. Accessible aux usagers via leur carte de lecteur, ce robot conversationnel a été inauguré en grande pompe en présence de la ministre de la Culture, suscitant un fort engouement médiatique (Comment la BNL a développé son chatbot basé sur ChatGPT | Archimag) (Comment la BNL a développé son chatbot basé sur ChatGPT | Archimag). Fruit du travail d’une petite équipe, ce chatbot IA est capable de répondre aux questions des usagers en langage naturel, en puisant dans les ressources numériques de la bibliothèque. Il représente un exemple abouti d’assistant virtuel au service du public, accessible 24/7 et pouvant désengorger les renseignements de première ligne.

Introduction - visual selection-4.png