Skip to content

Latest commit

 

History

History
16 lines (9 loc) · 997 Bytes

README.md

File metadata and controls

16 lines (9 loc) · 997 Bytes

word_cloud_generation

Генератор облака слов на основе текста в формате *.txt или страницы Википедии.

Используемые библиотеки

Текст очищается от знаков препинания и специальных символов с помощью регулярных выражений (библиотека re), очищается от стоп-слов и лемматизируется с помощью библиотеки NLTK.

Цели проекта

  1. Изучение библиотек request, re, nltk, natasha, matplotlib, wikipedia, wordcloud.
  2. Создание инструмента, который может использоваться для обучающих, исследовательских и личных целей.

Требования

Для использования программы требуется Jupyter Notebook (https://jupyter.org/try).