Skip to content

Combo-Breaker/NLP_DPO_2020

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

41 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

NLP-блок курса "Современный анализ данных" (ФКН НИУ ВШЭ), 2020

Занятие 1: Введение в автоматическую обработку текстов. Частотный анализ. Морфологический анализ.

  • Вводная лекция, препроцессинг текста Open In Colab
  • Препроцессинг текста + анализ тональности Open In Colab
  • Регулярные выражения Open In Colab

Занятие 2: Дистрибутивная семантика. Модели word2vec и fastText. Классификация текстов.

  • Word embeddings Open In Colab
  • Классификация с помощью CNN Open In Colab

ДЗ 1 Классификация новостей Open In Colab

Соревнование: https://www.kaggle.com/c/lenta-classification-2020/

Решение ДЗ Open In Colab

Занятие 3: Снижение размерности в NLP. Тематические моделирование. Синтаксический парсинг.

  • Тематическое моделирование Open In Colab
  • Синтаксический парсинг Open In Colab

Занятие 4: Языковые модели. Статистические и нейросетевые языковые модели.

  • Языковые модели и генерация текста Open In Colab
  • Transformer-based архитектуры Open In Colab Open In Colab

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published