Vectorization on class-oriented documents for job recommendation based on supervised machine learning models - HAL Accéder directement au contenu
Communication dans un congrès Année : 2022

Vectorization on class-oriented documents for job recommendation based on supervised machine learning models

Vectorisation sur des documents orientés classe pour la recommandation d'emploi basée sur des modèles d'apprentissage automatique supervisé.

Résumé

Nowadays, job recommender systems are more useful in the fight against unemployment due to their strong presence in e-recruitment platforms that are becoming very popular. Most of the recommender systems based on machine learning that recommend jobs to profiles use a vector representation of job offers based on keywords. However, these keywords are results of vectorization which is applied on a collection of documents where each one is a job offer. In this case, each keyword discriminates one job offer from another, whereas it can be preferable that each keyword discriminates one class from another. The aim of this paper is to improve the recommendation of job offers to users, by proposing to apply vectorization on a class-oriented collection of documents in order to obtain more useful keywords for the representation of job offers. In the case of job recommendation, each class-oriented document corresponds to a user profile. Experiments are done on two datasets (Nigam and Minajobs), using TF-IDF and Doc2Vec as vectorization techniques, Naive Bayes and Decision Trees as supervised machine learning models for top-N recommendation, and Precision, MRR and MAP as evaluation metrics. Our results show that, whatever the case, the best performance is always reach by a job recommender system resulting from our contribution. Compared to classic job recommender systems, the improvement rates can go up to 13% and 24% for systems based on Naive Bayes and go up to 55% and 46% for those based on Decision tree, respectively in the Nigam and Minajobs datasets.
Aujourd'hui, les systèmes de recommandation d'emploi sont plus utiles dans la lutte contre le chômage en raison de leur forte présence dans les plateformes de recrutement en ligne qui deviennent très populaires. La plupart des systèmes de recommandation basés sur l'apprentissage automatique qui recommandent des emplois à des profils utilisent une représentation vectorielle des offres d'emploi basée sur des mots-clés. Cependant, ces mots-clés sont les résultats d'une vectorisation appliquée à une collection de documents dont chacun est une offre d'emploi. Dans ce cas, chaque mot-clé discrimine une offre d'emploi par rapport à une autre, alors qu'il peut être préférable que chaque mot-clé discrimine une classe par rapport à une autre. L'objectif de cet article est d'améliorer la recommandation d'offres d'emploi aux utilisateurs, en proposant d'appliquer la vectorisation sur une collection de documents orientée classe afin d'obtenir des mots-clés plus utiles pour la représentation des offres d'emploi. Dans le cas de la recommandation d'emploi, chaque document orienté classe correspond à un profil d'utilisateur. Les expériences sont réalisées sur deux jeux de données (Nigam et Minajobs), en utilisant TF-IDF et Doc2Vec comme techniques de vectorisation, Naive Bayes et Decision Trees comme modèles d'apprentissage automatique supervisés pour la recommandation top-N, et Precision, MRR et MAP comme métriques d'évaluation. Nos résultats montrent que, dans tous les cas, la meilleure performance est toujours atteinte par un système de recommandation d'emploi issu de notre contribution. Par rapport aux systèmes classiques de recommandation d'emploi, les taux d'amélioration peuvent aller jusqu'à 13% et 24% pour les systèmes basés sur Naive Bayes et jusqu'à 55% et 46% pour ceux basés sur Decision tree, respectivement dans les jeux de données Nigam et Minajobs.
Fichier principal
Vignette du fichier
Vectorization on class-oriented documents for job recommendation based.pdf ( 745.45 Ko ) Télécharger
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-03715621, version 1 (06-07-2022)

Identifiants

  • HAL Id : hal-03715621 , version 1

Citer

Ghislain Wabo, Armel Nzekon, Fritz Sosso, Xaveria Djam. Vectorization on class-oriented documents for job recommendation based on supervised machine learning models. CARI 2022, Oct 2022, Yaoundé, Cameroon. ⟨hal-03715621⟩
160 Consultations
37 Téléchargements
Dernière date de mise à jour le 07/04/2024
comment ces indicateurs sont-ils produits

Partager

Gmail Facebook Twitter LinkedIn Plus