Skip to content

Latest commit

 

History

History
27 lines (18 loc) · 2.37 KB

File metadata and controls

27 lines (18 loc) · 2.37 KB

Домашнее задание 10

Дедлайн продлён до 22 декабря 23:59

Критерии

Балл Критерий
Выберите объемное произведение на русском или на английском.
3 Выберите частотную для выбранного произведения лемму X. С помощью UDPipe или SpaCy извлеките все зависимые для выбранной леммы X и все зависимые зависимых. Например, глагол говорить, все зависимые для него (модификаторы, прямые дополнения и т.п.) и все зависимые зависимых (модификаторы прямого дополнения глагола и т.п.).
2 Постройте граф зависимостей от выбранного слова Х и зависимостей зависимостей. Например, очень красиво говорить, громко говорить: очень — красиво — говорить — громко
3 Цвет вершины - это часть речи, толщина связи - количество таких пар, цвет связи (+ подпись, по желанию) - это тип связи (advmod, например)
2 Построен dispersion plot для главных персонажей произведения (ИЛИ распределение важных для сюжета терминов, если это что-то специфичное для этого произведения: слово смерть, например, или убийство для детектива) и для выбранной леммы X. Краткий комментарий про то, как выбранная лемма X распределена по произведению.

Checklist:

  • файл с расширением .ipynb
  • текстовый файл или ссылка на текстовый файл, который Вы парсили

Ссылки:

191

192

193

194