Skip to content

Topic detection using LDA in the "Grand Débat" contributions

Notifications You must be signed in to change notification settings

baruch11/grand-debat

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

28 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Détection de thème sur une question environnement du grand débat

Fork du projet TALAGRAND disponible ici : https://github.com/Quantmetry/grand-debat. Dans mon implémentation, j'ai utilisé le même algo de LDA de scikit-learn, modifié la préparation de données, et déterminé le nombre de thèmes grâce un score de cohérence.

Mon but est d'essayer des techniques d'extraction de thème (topic detection) sur des questions du grand débat. Pour cet essai j'ai pris : "de quelle manière votre vie quotidienne est-elle touchée par le changement climatique ?").
Je l'ai comparé ensuite à la synthèse "officielle" réalisée par OpinionWay : https://granddebat.fr/media/default/0001/01/b88758e8caa2733bec607a74b3b5371cc0a3b420.pdf

installation

pip install -r requirements.txt python -m spacy download fr_core_news_md

About

Topic detection using LDA in the "Grand Débat" contributions

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 81.1%
  • Python 18.9%