Skip to main content

Système automatisé de comptes rendus Hansard : conversion de l'audio parlementaire en texte à l'aide de l'IA

Bahreïn - Conseil des représentants

Scénario n° 062

Auteur : Conseil des représentants de Bahreïn

Date : 6 octobre 2024

Objectif :

Transcrire automatiquement les séances parlementaires de l'audio au texte, en générant avec exactitude des comptes rendus Hansard en temps réel. Cette solution basée sur l'IA rationalisera le processus de production des documents officiels, permettant aux débats et discussions parlementaires d'être documentés avec plus d'efficacité et d’exactitude. 

Acteurs :

  • Personnel du Parlement chargé de la production des comptes rendus Hansard
  • Parlementaires
  • Équipe technique chargée de l’audiovisuel
  • Équipe chargée de l’assistance et du développement en matière d’IA 

Conditions préalables :

  • Enregistrements audio de haute qualité des séances parlementaires
  • Modèles pré-entraînés de conversion audio-texte, adaptés au langage parlementaire et législatif
  • Intégration aux systèmes existants de comptes rendus et bases de données Hansard
  • Accès aux calendriers des séances parlementaires pour une transcription en temps réel  

Scénario :

  1. Les enregistrements audio ou les flux en direct des séances parlementaires sont captés et envoyés au système d'IA pour transcription.
  2. Le système d'IA traite l'audio en temps réel, grâce aux modèles de conversion de la parole au texte permettant de convertir avec précision les mots prononcés en texte.
  3. Le système identifie et étiquette les intervenants, attribuant les déclarations au parlementaire ou au membre du personnel concerné, et garantissant l'exactitude de la transcription officielle.
  4. Le système d'IA met en forme le texte transcrit conformément aux normes Hansard, en ajoutant les horodatages, les noms des intervenants et les métadonnées de la séance.
  5. Le personnel parlementaire vérifie l'exactitude de la transcription et procède aux modifications ou ajustements nécessaires. 
  6. Une fois vérifié, le compte rendu Hansard est publié dans les archives parlementaires officielles, ce qui le met à la disposition des parlementaires, du personnel et du public. 
  7. Le système stocke les transcriptions dans une base de données consultable, ce qui permet aux utilisateurs de rechercher des débats, des discours ou des sujets spécifiques dans les archives du Hansard. 

Flux alternatifs :

  • Si la qualité audio est médiocre ou si plusieurs personnes parlent en même temps, le système signale des sections de la transcription pour qu'elles soient examinées manuellement.
  • En cas de problème technique avec le flux audio, le système passe à un enregistrement de secours ou demande au personnel d'intervenir.
  • Si le système d'IA ne peut pas reconnaître le discours d'un parlementaire en raison d'un dialecte peu courant ou de l'utilisation de jargon, il met en évidence la section pour une transcription manuelle. 

Résultats attendus :

  • Amélioration de la rapidité de production et de l’exactitude des comptes rendus Hansard grâce à l'automatisation de la transcription audio-texte
  • Réduction du temps consacré par le personnel parlementaire à la production des documents officiels
  • Amélioration de l'accès aux débats parlementaires grâce à la transcription en temps réel 
  • Archives interrogeables des séances parlementaires, facilitant l'accès aux documents historiques pour les parlementaires, le personnel et le public 

Problèmes potentiels :

  • Veiller à ce que le système d'IA transcrive avec précision le langage parlementaire complexe, les dialectes et les termes techniques. 
  • Gérer les bruits de fond, les conversations simultanées et les paroles manquant de clarté pendant les séances.
  • Assurer la sécurité et la confidentialité lors du traitement de débats parlementaires sensibles ou classifiés.
  • Intégrer le système de transcription de manière transparente dans les flux de production existants du Hansard.

Données requises :

  • Flux audio de haute qualité des séances parlementaires
  • Modèles pré-entraînés de conversion audio-texte, adaptés au langage législatif 
  • Annotations ou transcriptions manuelles pour l'entraînement et l'amélioration du système d'IA 
  • Profils des intervenants pour une attribution précise des discours 

Intégration à d’autres systèmes :

  • Systèmes de gestion et de publication des comptes rendus Hansard
  • Systèmes audiovisuels parlementaires
  • Systèmes de base de données pour le stockage et la recherche dans les comptes rendus transcrits 

 

La collection Scénarios d'utilisation de l'IA dans les parlements est publiée par le Centre pour l'innovation au parlement de l'UIP dans le cadre du projet de lignes directrices relatives à la gouvernance de l'IA dirigé par le Pôle de recherche sur les données parlementaires.

Cette collection est publiée sous licence Creative Commons "Attribution – Utilisation non commerciale – Partage dans les mêmes conditions 4.0 International". Le contenu peut être diffusé et réutilisé librement en citant le nom de l'auteur et l'UIP. 

Un scénario d'utilisation décrit le mode de fonctionnement idéal d'un système. Il est conçu pour prévoir, élaborer et évaluer la mise en œuvre.  Un scénario d'utilisation n'est pas une étude de cas, qui se limite à une description de la mise en œuvre concrète d'un projet réel. Nous attirons votre attention sur le fait que le présent scénario est publié tel qu'il nous a été transmis et que ni l'UIP ni l'auteur ne peuvent être tenus responsables de son utilisation.

Pour de plus amples informations sur les travaux de l'UIP dans le domaine de l'intelligence artificielle, veuillez consulter la page https://www.ipu.org/fr/impact/democratie-et-parlements-forts/lintelligence-artificielle ou écrire à l'adresse [email protected].