Skip to main content

Recherche dans des sources de données externes en langage naturel

Italie - Sénat

Scénario n° : 030

Auteur : Sénat d'Italie

Date : 12 juin 2024  
 

Objectif : 

Permettre aux utilisateurs d'interroger des sources de données externes, telles que le site web de l'Institut national italien de la statistique (ISTAT) ou le site Normattiva (portail des lois en vigueur), en langage naturel, en facilitant les interactions intuitives et conviviales avec des ensembles de données externes afin d'améliorer l'accessibilité et l'expérience des utilisateurs. 

Acteurs : 

  • Utilisateurs du site web du Sénat (citoyens, chercheurs et journalistes)
  • Équipe du service du développement web et informatique du Sénat 

Conditions préalables : 

  • Accès à des sources de données externes via des interfaces de programmation d'applications (API) ou des outils de raclage de sites web
  • Modèle d'IA basé sur un grand modèle de langage entraîné à comprendre et à traiter les requêtes en langage naturel
  • Accessibilité d'Internet aux utilisateurs 

Scénario : 

  1. L'utilisateur accède au site web du Sénat.
  2. L'utilisateur saisit une requête en langage naturel (p. ex. "Quel est le taux de chômage le plus récent selon l'ISTAT ?") dans la barre de recherche.
  3. Le modèle d'IA basé sur un grand modèle de langage traite la requête en langage naturel en vue de comprendre l'intention et les termes clés.
  4. Le système d'IA envoie une demande à la source de données externe concernée (p. ex. le site web de l'ISTAT) pour extraire les informations demandées.
  5. La source de données externe transmet les données pertinentes au système d'IA.
  6. Le système d'IA formate les données et les présente à l'utilisateur dans un format convivial.
  7. L'utilisateur peut affiner sa recherche ou poser d'autres questions en langage naturel pour obtenir davantage d'informations.
  8. Le système enregistre la requête et les résultats à des fins d'amélioration du modèle. 

Flux alternatifs : 

  • Si le modèle d'IA basé sur un grand modèle de langage ne comprend pas la requête, il invite l'utilisateur à la reformuler ou il fait des suggestions.
  • Si la source de données externe n'est pas disponible ou transmet des données incomplètes, le système informe l'utilisateur et lui suggère d'autres sources. 

Résultats attendus : 

  • L'expérience des utilisateurs est améliorée grâce à la transmission rapide de réponses précises provenant de sources externes.
  • L'utilisation de la fonctionnalité de recherche du site web du Sénat visant à accéder à des données externes est augmentée.
  • La recherche d'informations spécifiques provenant de données externes demande moins de temps et d'efforts aux utilisateurs.
  • L'accessibilité des utilisateurs qui ne maîtrisent pas la recherche dans des bases de données ou des sites web techniques est améliorée. 

Problèmes potentiels : 

  • Garantir que le modèle d'IA basé sur un grand modèle de langage comprend de façon exacte différents termes et formulations propres aux bases de données externes
  • Effectuer des recherches qui nécessitent un traitement complexe de données ou plusieurs sources externes 

Données requises : 

  • Requêtes et interactions avec les utilisateurs pour entraîner et améliorer le modèle d'IA basé sur un grand système de langage
  • Accès à des API ou à des outils de raclage de site web permettant d'extraire des données de sources externes
  • Données provenant des recherches des utilisateurs en temps réel à des fins d'entraînement et d'adaptation permanents  

Intégration à d'autres systèmes : 

  • Systèmes et modèles de traitement IA basés sur un grand modèle de langage
  • API ou outils de raclage de site web permettant d'accéder à des sources de données externes
  • Composants d'interface utilisateur permettant d'afficher les résultats de recherche 

Indicateurs de réussite : 

  • Temps de réponse
  • Évaluation de la satisfaction des utilisateurs et commentaires
  • Exactitude et pertinence des résultats de recherche provenant de sources de données externes
  • Réduction des requêtes des utilisateurs nécessitant une intervention ou une assistance manuelle

 

La collection Scénarios d'utilisation de l'IA dans les parlements est publiée par le Centre pour l'innovation au parlement de l'UIP dans le cadre du projet de lignes directrices relatives à la gouvernance de l'IA dirigé par le Pôle de recherche sur les données parlementaires.

Cette collection est publiée sous licence Creative Commons "Attribution – Utilisation non commerciale – Partage dans les mêmes conditions 4.0 International". Le contenu peut être diffusé et réutilisé librement en citant le nom de l'auteur et l'UIP. 

 

Un scénario d'utilisation décrit le mode de fonctionnement idéal d'un système. Il est conçu pour prévoir, élaborer et évaluer la mise en œuvre.  Un scénario d'utilisation n'est pas une étude de cas, qui se limite à une description de la mise en œuvre concrète d'un projet réel. Nous attirons votre attention sur le fait que le présent scénario est publié tel qu'il nous a été transmis et que ni l'UIP ni l'auteur ne peuvent être tenus responsables de son utilisation.

Pour de plus amples informations sur les travaux de l'UIP dans le domaine de l'intelligence artificielle, veuillez consulter la page https://www.ipu.org/fr/impact/democratie-et-parlements-forts/lintelligence-artificielle ou écrire à l'adresse [email protected].