Skip to content

tarbagan/tuvalang

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

31 Commits
 
 
 
 
 
 
 
 

Repository files navigation

TUVALANG

Набор предобученых NLP-моделей для обработки тувинского языка.

Состав:

  • TuRu- модель бинарного классификатора тувинского/русского языка
  • Tuva2vec - модель эмбеддингов тувинского языка

Примеры:

Пример модели TuRu

from turu import TuRu
model_file = 'turu_model.pkl'
text_in = u'Февраль 17-де, ай санаашкыны-биле Чаа чылга – Шагаа байырлалынга тураскаадып, Тыва Республиканың күрүне шаңналдарын тывыскан.'
turu = TuRu()
lang = turu.get_turu(text_in=text_in, model_file=model_file)

out: {"type": 1, "lang": "tuvan"}

Пример модели Tuva2vec

(w2v_model, "тыва", ["улус", "чоон"]

out: Alt-текст

About

Модели тувинского языка

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published