Ce projet a été réalisé dans le cadre du
cours de Natural Language Processing (NLP).
L’objectif pédagogique était de concevoir un système de recherche
d’information performant combinant :
👉 Le sujet nous invitait à proposer une solution hybride capable de mieux interpréter le sens des phrases, en particulier dans le cadre d’une application concrète.
Nous avons choisi de travailler sur le
traitement des avis d’étudiants sur leurs cours.
Ces avis sont souvent :
Concevoir un moteur de recherche capable de retrouver automatiquement les avis les plus similaires à une phrase saisie, en comprenant le sens, pas uniquement les mots.
BERT (Bidirectional Encoder Representations from Transformers) est un
modèle de langage développé par Google.
Il comprend les phrases en tenant compte du
contexte des mots (avant et après).
🔎 Exemple :
“Ce cours manque de pratique” ≠ “C’est un cours très pratique”
Nous avons utilisé la librairie sentence-transformers et le
modèle :
📌 distiluse-base-multilingual-cased
Ce modèle transforme une phrase en vecteur numérique (embedding), ce qui permet ensuite de :
BM25 est un algorithme utilisé par les moteurs de recherche (notamment via Elasticsearch).
Il fonctionne en :
📌 C’est rapide et efficace… mais ça ne comprend pas le sens !
Notre système combine :
distiluse-base-multilingual-cased
| Requête étudiante | Résultats retournés |
|---|---|
| “Le cours était trop théorique” | “Il manque de pratique” |
| “Je n’ai rien compris aux explications” | “Les explications étaient trop rapides” |
| “Bon professeur” | “Très pédagogue et clair” |
✅ Les résultats sont pertinents même quand les mots sont différents, car le sens est compris.
Pour chaque requête, le système affiche :
Plus le score est proche de 1, plus l’avis est pertinent par rapport à la requête.
Le prof n’explique pas bien
Le cours est trop théorique
Pas assez d’exemples
Trop de pratique
Manque de structure
Contenu bien expliqué
Ce projet a été conçu et réalisé par notre groupe dans le cadre du cours de NLP :
➡️ https://github.com/codeangel223/npl---BERT-BM25
Merci pour votre attention 🙏
Ce projet illustre l’intérêt des approches hybrides en NLP pour mieux comprendre le langage humain dans des contextes réels.