Une approche basée sur la méthode LRP pour l'explication des Réseaux de Neurones Convolutifs appliqués à la classification des textes

Florentin Jiechieu; Norbert Tsopze

Communication dans un congrès Année : 2022

A LRP based approach to explain Text Convolutional Neural Networks (Text-CNN)

Une approche basée sur la méthode LRP pour l'explication des Réseaux de Neurones Convolutifs appliqués à la classification des textes

(1, 2) , (1, 2)

1
2

Florentin Jiechieu

Fonction : Auteur

Unité de modélisation mathématique et informatique des systèmes complexes [Bondy]

Département d'Informatique [Yaoundé I]

Norbert Tsopze

Fonction : Auteur
PersonId : 925648

Unité de modélisation mathématique et informatique des systèmes complexes [Bondy]

Département d'Informatique [Yaoundé I]

Résumé

Jacovi et al. in 2018 proposed a method for the explanation of Convolutional Neural Networks designed for text classification (Text-CNN). The problem with this method is that it only applies to Text-CNN with no hidden layer in the fully connected part. We will therefore find ourselves limited in terms of accuracy if we want to use this method. In addition, the LRP (Layer-wise Relevance Propagation) method makes it possible to compute the contributions of inputs of neural networks with multiple hidden layers, but cannot be applied directly to Text-CNNs because unlike images where each pixel has a meaning taken alone, each component of a vector representation (word embedding) of a word taken alone has no particular meaning. Therefore, we propose in this article to extend the method of Jacovi et al. by using the LRP method in order to be able to explain Text-CNN whose fully connected layer is deep. The qualitative evaluation suggests that the explanations provided by the proposed method are consistent on text classification problems such as Question-Answering (QA) and Sentiment Analysis. Moreover, the quantitative evaluation shows that the explanations provided are 100% faithful to the model.

Jacovi et al. en 2018 ont proposé une méthode pour l'explication des Réseaux de Neurones Convolutifs conçus pour la classification des textes (Text-CNN). Le problème avec cette méthode est qu'elle ne s'applique que sur les Text-CNN qui n'ont pas de couche cachée dans la partie densément connectée. On se retrouvera donc limité en terme de performance si on veut utiliser cette méthode d'explication. Par ailleurs, la méthode LRP (Layer-wise Relevance Propagation) permet de calculer les contributions des caractéristiques en entrée des réseaux de neurones avec un nombre quelconque de couches cachées, mais ne peut s'appliquer directement sur les Text-CNN car contrairement aux images où chaque pixel a un sens pris seul, chaque composante d'une représentation vectorielle (word embedding) d'un mot prise seule n'a pas de signification particulière. C'est ainsi que nous proposons dans cet article, d'étendre la méthode de Jacovi et al. en mettant à contribution la méthode LRP afin de pouvoir expliquer les Text-CNN dont la partie densément connectée est profonde (possède plusieurs couches). L'évaluation qualitative laisse percevoir que les explications fournies par la méthode proposée sont cohérentes sur les problèmes de classification des textes comme le Question-Answering (QA) ainsi que l'analyse des sentiments. Par ailleurs, l'évaluation quantitative montre que les explications fournies sont fidèles à 100% au modèle.

Mots clés

Explanability LRP Text Classification Text-CNN

Explicabilité LRP Classification des Textes Text-CNN

Domaines

Intelligence artificielle [cs.AI] Apprentissage [cs.LG] Réseau de neurones [cs.NE]

Liste complète des métadonnées

Format du dépôt	Fichier
Type de dépôt	Communication dans un congrès
Titre	en A LRP based approach to explain Text Convolutional Neural Networks (Text-CNN) fr Une approche basée sur la méthode LRP pour l'explication des Réseaux de Neurones Convolutifs appliqués à la classification des textes
Résumé	en Jacovi et al. in 2018 proposed a method for the explanation of Convolutional Neural Networks designed for text classification (Text-CNN). The problem with this method is that it only applies to Text-CNN with no hidden layer in the fully connected part. We will therefore find ourselves limited in terms of accuracy if we want to use this method. In addition, the LRP (Layer-wise Relevance Propagation) method makes it possible to compute the contributions of inputs of neural networks with multiple hidden layers, but cannot be applied directly to Text-CNNs because unlike images where each pixel has a meaning taken alone, each component of a vector representation (word embedding) of a word taken alone has no particular meaning. Therefore, we propose in this article to extend the method of Jacovi et al. by using the LRP method in order to be able to explain Text-CNN whose fully connected layer is deep. The qualitative evaluation suggests that the explanations provided by the proposed method are consistent on text classification problems such as Question-Answering (QA) and Sentiment Analysis. Moreover, the quantitative evaluation shows that the explanations provided are 100% faithful to the model. fr Jacovi et al. en 2018 ont proposé une méthode pour l'explication des Réseaux de Neurones Convolutifs conçus pour la classification des textes (Text-CNN). Le problème avec cette méthode est qu'elle ne s'applique que sur les Text-CNN qui n'ont pas de couche cachée dans la partie densément connectée. On se retrouvera donc limité en terme de performance si on veut utiliser cette méthode d'explication. Par ailleurs, la méthode LRP (Layer-wise Relevance Propagation) permet de calculer les contributions des caractéristiques en entrée des réseaux de neurones avec un nombre quelconque de couches cachées, mais ne peut s'appliquer directement sur les Text-CNN car contrairement aux images où chaque pixel a un sens pris seul, chaque composante d'une représentation vectorielle (word embedding) d'un mot prise seule n'a pas de signification particulière. C'est ainsi que nous proposons dans cet article, d'étendre la méthode de Jacovi et al. en mettant à contribution la méthode LRP afin de pouvoir expliquer les Text-CNN dont la partie densément connectée est profonde (possède plusieurs couches). L'évaluation qualitative laisse percevoir que les explications fournies par la méthode proposée sont cohérentes sur les problèmes de classification des textes comme le Question-Answering (QA) ainsi que l'analyse des sentiments. Par ailleurs, l'évaluation quantitative montre que les explications fournies sont fidèles à 100% au modèle.
Auteur(s)	Florentin Jiechieu ^{1, 2} , Norbert Tsopze ^{1, 2} 1 UMMISCO - Unité de modélisation mathématique et informatique des systèmes complexes [Bondy] ( 541946 ) - IRD France Nord - 32 avenue Henri Varagnat - 93143 Bondy cedex - France Université Gaston Berger de Saint-Louis Sénégal ( 48348 ) ; Université de Yaoundé I ( 217395 ) ; Institut de la francophonie pour l'informatique ( 301775 ) ; Université Cadi Ayyad [Marrakech] ( 302207 ) ; Sorbonne Université UMI209 ( 413221 ) ; Institut de Recherche pour le Développement ( 451861 ) ; Université Cheikh Anta Diop de Dakar [Sénégal] ( 1175215 ) 2 Département d'Informatique [Yaoundé I] ( 57006 ) - Université de Yaoundé 1 - Faculté des sciences, BP 812 Yaoundé-Cameroun - Cameroun Faculté des Sciences [Yaoundé I] ( 86986 ) ; Université de Yaoundé I ( 217395 )
Langue du document	Français
Vulgarisation	Oui
Comité de lecture	Oui
Invité	Oui
Audience	Internationale
Actes	Oui
Titre du congrès	CARI 2022
Date début congrès	2022-10-04
Date fin congrès	2022-10-07
Ville	YAOUNDE
Pays	Cameroun
URL du congrès ou éditeur	https://www.cari-info.org/
Domaine(s)	Informatique [cs]/Intelligence artificielle [cs.AI] Informatique [cs]/Apprentissage [cs.LG] Informatique [cs]/Réseau de neurones [cs.NE]
Mots-clés	en Explanability, LRP, Text Classification, Text-CNN fr Explicabilité, LRP, Classification des Textes, Text-CNN

Fichier principal

jiechieu_and_norbert-CARI2022.pdf ( 239.86 Ko )

Origine : Fichiers produits par l'(les) auteur(s)

FLORENTIN FLAMBEAU JIECHIEU KAMENI : Connectez-vous pour contacter le contributeur

https://hal.science/hal-03701361

Soumis le : mercredi 22 juin 2022 à 07:46:39

Dernière modification le : jeudi 18 janvier 2024 à 14:12:21

Archivage à long terme le : vendredi 23 septembre 2022 à 18:06:51

Dates et versions

hal-03701361, version 1 (22-06-2022)

Identifiants

HAL Id : hal-03701361 , version 1

Citer

Florentin Jiechieu, Norbert Tsopze. Une approche basée sur la méthode LRP pour l'explication des Réseaux de Neurones Convolutifs appliqués à la classification des textes. CARI 2022, Oct 2022, YAOUNDE, Cameroun. ⟨hal-03701361⟩

Exporter

BibTeX TEI Dublin Core DC Terms EndNote Datacite

Collections

IRD AFRIQ SORBONNE-UNIVERSITE SU-SCIENCES UMI-209 CARI2022

174 Consultations

128 Téléchargements

Dernière date de mise à jour le 20/04/2024

A LRP based approach to explain Text Convolutional Neural Networks (Text-CNN)

Une approche basée sur la méthode LRP pour l'explication des Réseaux de Neurones Convolutifs appliqués à la classification des textes

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager