Skip to content

wlwlaa/Movie-review-classifier

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Movie-review-classifier

Описание

Этот репозиторий содержит модель, подготовленную в рамках тестового задания для junior-специалистов по направлению Data Science АО "Гринатом".

С демо модели можно ознакомиться по ссылке

Начало работы

Требования

Для успешного запуска проекта необходимы:

Подготовка окружения

Для развертывания сервиса выполните следующие шаги:

  1. Клонируйте репозиторий на локальную машину:
git clone https://github.com/wlwlaa/Movie-review-classifier.git
  1. Перейдите в папку проекта:
cd Movie-review-classifier
  1. Установите зависимости:
pip install -r requirements.txt
  1. Создайде папку models и поместите в нее загруженные веса модели:
mkdir models
cp /Users/$USER/Downloads/model_7000_Loss_0.09370.pth ./models/model_7000_Loss_0.09370.pth

Запуск проекта

  1. Запустите файл app.py:
python app.py
  1. Перейдите по указаннному в консоли URL адресу в браузере:
127.0.0.1:7860

Модель

Описание

В этом проекте моделью является fine-tuned трансформер DistilBERT base uncased finetuned SST-2. Это упрощенная версия классифкатора BERT, предоставляя меньший размер и меньшие вычислительные затраты, при этом, сохраняя высокую точность.

Метрики

Ключевые метрики:

  • F1 score: 0.9564
  • Accuracy: 0.9564

Датасет

Для дообучения использовался Large Movie Review Dataset v1.0, включающий в себя 50,000 различных отзывов к фильмам с оценкой от 1 до 10. Данные были предварительно очищены от "шума", перемешаны и разделены на обучающую/тестовую выборку в отношении 80/20.

Обучение

Обучение производилось в среде Google Colab Pro на ускорителе Nvidia L4. Подробнее с процессом обучения можно ознамиться в файле Greenatom.ipynb, находящимся в репозитории.

Лицензия

Проект распространятся под лицензией Apache 2.0 - подробнее в файле LICENSE.

Releases

No releases published

Packages

No packages published