Модель uaddress для библиотеки deepparse
Read this in other language: English, Русский, Український
- python3
- deepparse
- pandas
- colored
pip3 install -r requirements.txt
python3 pretrain.py
python3 train.py
python3 example.py
Файл | Описание |
---|---|
example.py | Пример разбора адреса на типы |
train.py | Обучения модели |
pretrain.py | Подготовка данных для обучения модели |
check_data.py | Проверка данных для обучения модели |
improver.py | Улучшение адреса |
data/data.csv | Данные для обучения модели |
data/test.csv | Данные для проверки модели после обучения |
data/raw.csv | Сырые данные для подготовки данных для обучения модели |
data/uaddress.ckpt | Модель после обучения (bpemb) |
data/uaddress_fasttext.ckpt | Модель после обучения (Fasttext) |
Название | Описание |
---|---|
Country | Страна |
RegionType | Тип области |
Region | Область |
CountyType | Тип района |
County | Район |
SubLocalityType | Тип подрайона |
SubLocality | Подрайон |
LocalityType | Тип населённого пункта |
Locality | Населённый пункт |
StreetType | Тип улицы |
Street | Улица |
HousingType | Тип корпуса |
Housing | Корпус |
HostelType | Тип общежития |
Hostel | Общежитие |
HouseNumberType | Тип номера дома |
HouseNumber | Номер дома |
HouseNumberAdditionally | Дополнительный номер дома |
SectionType | Тип секции |
Section | Секция |
ApartmentType | Тип квартиры |
Apartment | Квартира |
RoomType | Тип комнаты |
Room | Комната |
Sector | Сектор |
EntranceType | Тип подъезда |
Entrance | Номер подъезда |
FloorType | Тип этажа |
Floor | Этаж |
PostCode | Индекс |
Manually | Набор типов для дальнейшей разборки адреса |
NotAddress | Не адрес |
Comment | Комментарий |
AdditionalData | Дополнительные данные |