La cotation d’une information est une étape essentielle dans le travail d’analyse du renseignement. L’officier traitant doit s’assurer de la crédibilité de la donnée recueillie et de la fiabilité du dispositif de collecte. Les Traitements automatiques des langues (TAL) participent à ce processus qui doit rester sous le contrôle de l’expert humain.
L’Intelligence artificielle (IA) pour la cotation de l’information textuelle : standards experts, approches actuelles, défis techniques
Artificial Intelligence (AI) for Rating Written Information: Experts’ Standards, Current Approaches, Technical Challenges
Rating the value of a piece of information is an essential step in intelligence analysis. The officer handling it needs to be sure of the credibility of the received data and of the reliability of the source. Automatic language processors contribute to this process, which must nevertheless remain under the control of a human expert.
Les dernières avancées en Traitement automatique des langues (TAL) permettent désormais d’envisager, pour les informations textuelles, d’automatiser une étape clé du cycle de renseignement : la cotation de l’information. Dans cette tâche, un officier se charge d’évaluer la qualité des informations recueillies auprès de capacités pertinentes, en particulier des sources humaines, en utilisant à cette fin divers documents de comparaison et de recoupement, notamment textuels. Ces documents sont soit directement sous format texte (comptes rendus d’entretien, fiches source, résumés d’interception, documents sources ouvertes), soit sous d’autres formats transposables en texte (captations sonores, visuelles, etc.).
Dans cet article, nous allons étudier comment la cotation peut être automatisée pour ce type de document, en mobilisant et en combinant des techniques récentes de TAL. D’abord, nous rappellerons la procédure de cotation de l’information définie par la doctrine Otan. Puis, nous montrerons comment diverses approches techniques désormais à maturité peuvent être combinées pour soutenir un dispositif automatisé de cotation. Enfin, nous passerons en revue les principales contraintes et défis opérationnels à surmonter, et rappellerons le rôle toujours central de l’expertise humaine dans le processus de cotation.
Cotation de l’information textuelle et cahier des charges pour son automatisation
L’échelle alphanumérique de cotation
Selon la doctrine définie par l’Otan pour la cotation, un officier de renseignement note d’abord la crédibilité du contenu de l’information sur une échelle de 1 à 6, puis la fiabilité de la source, plus généralement la capacité de collecte, sur une échelle de A à F, avant de concaténer les deux notes en une cote unique (ex. B2) (1) (2). Pour la crédibilité, les notes 1 à 5 indiquent un degré décroissant de confirmation en fonction de l’information pertinente dont dispose l’officier dans le contexte, avec 6 lorsque l’évaluation est impossible faute d’éléments pertinents ou suffisants. Pour la fiabilité, les notes A à E reflètent une confiance décroissante dans la probité de la source, avec F lorsqu’aucune appréciation n’est possible (par exemple si la source est nouvelle ou sans historique pertinent). L’échelle alphanumérique utilisée et ses différents niveaux sont donnés dans la table suivante (3) (4).
Il reste 92 % de l'article à lire
Plan de l'article








