Wir haben unsere Datenschutzbestimmungen aktualisiert. Klicke hier, um dir die _Einzelheiten anzusehen. Tippe hier, um dir die Einzelheiten anzusehen.
Aktiviere deine kostenlose 30-tägige Testversion, um unbegrenzt zu lesen.
Erstelle deine kostenlose 30-tägige Testversion, um weiterzulesen.
Herunterladen, um offline zu lesen
Cours sur le topic modeling - UPEM - Master Méthode computationnelle et analyse de contenu
I: Topic Modeling
* Nature et applications
* Approche Deterministe: LSA
* Approche Probabiliste: LDA
* Quelques librairies en R et python
II: Le package STM en R
* Parametres
* Métriques: exclusivité et cohérence sémantique
* Appliqué a un corpus propre
LAB - R STM
* Le corpus: résumés d'articles tech, IEEE et Arstechnica
* Le package STM en R
* Comment determiner le nombre optimal de topics?
* Comment interpreter les résultats?
* Jupyter Notebook et Script R
III: forum Alt-right sur Facebook
* 500.000 commentaires provenant du forum alt-right God Trump Emperor
* De la nécessité de travailler le contenu
* Filtrer le bruit avec
* Lemmatization, tokenization
* Part of Speech tagging
* Named entity recognition
* Jupyter Notebook et Script R
IV: Application au Francais
* Quelles sont les librairies pour:
* Part of Speech
* Tokenization
* Lemmatization
V: Resources
* Articles et blogs
Cours sur le topic modeling - UPEM - Master Méthode computationnelle et analyse de contenu
I: Topic Modeling
* Nature et applications
* Approche Deterministe: LSA
* Approche Probabiliste: LDA
* Quelques librairies en R et python
II: Le package STM en R
* Parametres
* Métriques: exclusivité et cohérence sémantique
* Appliqué a un corpus propre
LAB - R STM
* Le corpus: résumés d'articles tech, IEEE et Arstechnica
* Le package STM en R
* Comment determiner le nombre optimal de topics?
* Comment interpreter les résultats?
* Jupyter Notebook et Script R
III: forum Alt-right sur Facebook
* 500.000 commentaires provenant du forum alt-right God Trump Emperor
* De la nécessité de travailler le contenu
* Filtrer le bruit avec
* Lemmatization, tokenization
* Part of Speech tagging
* Named entity recognition
* Jupyter Notebook et Script R
IV: Application au Francais
* Quelles sont les librairies pour:
* Part of Speech
* Tokenization
* Lemmatization
V: Resources
* Articles et blogs
Sie haben diese Folie bereits ins Clipboard „“ geclippt.
Sie haben Ihre erste Folie geclippt!
Durch Clippen können Sie wichtige Folien sammeln, die Sie später noch einmal ansehen möchten. Passen Sie den Namen des Clipboards an, um Ihre Clips zu speichern.Die SlideShare-Familie hat sich gerade vergrößert. Genießen Sie nun Zugriff auf Millionen eBooks, Bücher, Hörbücher, Zeitschriften und mehr von Scribd.
Jederzeit kündbar.Unbegrenztes Lesevergnügen
Lerne schneller und intelligenter von Spitzenfachleuten
Unbegrenzte Downloads
Lade es dir zum Lernen offline und unterwegs herunter
Außerdem erhältst du auch kostenlosen Zugang zu Scribd!
Sofortiger Zugriff auf Millionen von E-Books, Hörbüchern, Zeitschriften, Podcasts und mehr.
Lese und höre offline mit jedem Gerät.
Kostenloser Zugang zu Premium-Diensten wie TuneIn, Mubi und mehr.
Wir haben unsere Datenschutzbestimmungen aktualisiert, um den neuen globalen Regeln zum Thema Datenschutzbestimmungen gerecht zu werden und dir einen Einblick in die begrenzten Möglichkeiten zu geben, wie wir deine Daten nutzen.
Die Einzelheiten findest du unten. Indem du sie akzeptierst, erklärst du dich mit den aktualisierten Datenschutzbestimmungen einverstanden.
Vielen Dank!