Π Π°Π·Π±ΠΎΡΠΊΠ° ΡΠΊΡΠ°ΠΈΠ½ΡΠΊΠΎΠ³ΠΎ Π°Π΄ΡΠ΅ΡΠ° Π½Π° ΡΠΈΠΏΡ
Read this in other language: English, Π ΡΡΡΠΊΠΈΠΉ, Π£ΠΊΡΠ°ΡΠ½ΡΡΠΊΠΈΠΉ
- python3
- spacy
- re
- pandas
- csv
- os
- signal
- threading
python3 pretrain.py
python3 train.py
python3 -m spacy train config/config.cfg --paths.train training/train.spacy --paths.dev training/test.spacy --output models
python3 -m spacy train config/config_acc.cfg --paths.train training/train.spacy --paths.dev training/test.spacy --output models
python3 example.py
python3 -m spacy init fill-config config/base_config.cfg config/config.cfg
python3 -m spacy init fill-config config/base_config_acc.cfg config/config_acc.cfg
import uaddresspacy
print(uaddresspacy.parse(", - ΠΏΠΎΠ»ΡΠ°Π²ΡΡΠΊΠ° ΡΡΡΡΠ²ΡΡΠΊΠΈΠΉ ΠΆΠΎΠ²ΡΠ½Π΅Π²Π΅ Π²ΡΠ». -, Π±ΡΠ΄. -, ΠΊΠ².,"))
# [('ΠΏΠΎΠ»ΡΠ°Π²ΡΡΠΊΠ°', 'Locality'), ('ΡΡΡΡΠ²ΡΡΠΊΠΈΠΉ', 'CountyType'), ('ΠΆΠΎΠ²ΡΠ½Π΅Π²Π΅', 'Locality'), ('Π²ΡΠ».', 'StreetType'), ('Π±ΡΠ΄.', 'HouseNumberType'), ('ΠΊΠ².', 'ApartmentType')]
print(uaddresspacy.parse(", 01000 ΠΊΠΈΡΠ², ΠΌΡΡΡΠΎ ΠΊΠΈΡΠ², ΠΌΡΡΡΠΎ ΠΊΠΈΡΠ² Π²ΠΎΡΠΎΠ²ΡΡΠΊΠΎΠ³ΠΎ, Π±ΡΠ΄. 43-Π±, ΠΊΠ². 14,"))
# [('01000', 'PostCode'), ('ΠΊΠΈΡΠ²', 'Region'), ('ΠΌΡΡΡΠΎ', 'LocalityType'), ('ΠΊΠΈΡΠ²', 'Locality'), ('Π²ΠΎΡΠΎΠ²ΡΡΠΊΠΎΠ³ΠΎ', 'Street'), ('Π±ΡΠ΄.', 'HouseNumberType'), ('43-Π±', 'HouseNumber'), ('ΠΊΠ².', 'ApartmentType'), ('14', 'Apartment')]
python3 pretrain.py
Π€Π°ΠΉΠ» | ΠΠΏΠΈΡΠ°Π½ΠΈΠ΅ |
---|---|
pretrain.py | ΠΠΎΠ΄Π³ΠΎΡΠΎΠ²ΠΊΠ° Π΄Π°Π½Π½ΡΡ Π΄Π»Ρ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ ΠΌΠΎΠ΄Π΅Π»ΠΈ |
train.py | ΠΠΎΠ΄Π³ΠΎΡΠΎΠ²ΠΊΠ° ΠΌΠΎΠ΄Π΅Π»ΠΈ |
example.py | ΠΠΎΠ»ΡΡΠΈΡΡ ΠΏΡΠΈΠΌΠ΅Ρ ΡΠ°Π·Π±ΠΎΡΠΊΠΈ Π°Π΄ΡΠ΅ΡΠ° Π½Π° ΡΠΈΠΏΡ |
report.csv | ΠΡΠΈΠΌΠ΅Ρ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠ° ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ Π½Π° ΡΠΈΠΏΡ |
addresses.csv | Π‘ΠΏΠΈΡΠΎΠΊ Π°Π΄ΡΠ΅ΡΠΎΠ² Π΄Π»Ρ ΠΏΡΠΎΠ²Π΅ΡΠΊΠΈ |
training/raw.csv | ΠΠ°Π½Π½ΡΠ΅ Π΄Π»Ρ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ |
training/pretrain.csv | ΠΠ°Π½Π½ΡΠ΅ Π΄Π»Ρ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ ΠΌΠΎΠ΄Π΅Π»ΠΈ |
ΠΠ°Π·Π²Π°Π½ΠΈΠ΅ | ΠΠΏΠΈΡΠ°Π½ΠΈΠ΅ |
---|---|
Country | Π‘ΡΡΠ°Π½Π° |
RegionType | Π’ΠΈΠΏ ΠΎΠ±Π»Π°ΡΡΠΈ |
Region | ΠΠ±Π»Π°ΡΡΡ |
CountyType | Π’ΠΈΠΏ ΡΠ°ΠΉΠΎΠ½Π° |
County | Π Π°ΠΉΠΎΠ½ |
Included | ΠΡ ΠΎΠ΄ΠΈΡ Π² ΡΠΎΡΡΠ°Π² |
LocalityType | Π’ΠΈΠΏ Π½Π°ΡΠ΅Π»ΡΠ½Π½ΠΎΠ³ΠΎ ΠΏΡΠ½ΠΊΡΠ° |
Locality | ΠΠ°ΡΠ΅Π»ΡΠ½Π½ΡΠΉ ΠΏΡΠ½ΠΊΡ |
StreetType | Π’ΠΈΠΏ ΡΠ»ΠΈΡΡ |
Street | Π£Π»ΠΈΡΠ° |
HousingType | Π’ΠΈΠΏ ΠΊΠΎΡΠΏΡΡΠ° |
Housing | ΠΠΎΡΠΏΡΡ |
HostelType | Π’ΠΈΠΏ ΠΎΠ±ΡΠ΅ΠΆΠΈΡΠΈΡ |
Hostel | ΠΠ±ΡΠ΅ΠΆΠΈΡΠΈΠ΅ |
HouseNumberType | Π’ΠΈΠΏ Π½ΠΎΠΌΠ΅ΡΠ° Π΄ΠΎΠΌΠ° |
HouseNumber | ΠΠΎΠΌΠ΅Ρ Π΄ΠΎΠΌΠ° |
HouseNumberAdditionally | ΠΠΎΠΏΠΎΠ»Π½ΠΈΡΠ΅Π»ΡΠ½ΡΠΉ Π½ΠΎΠΌΠ΅Ρ Π΄ΠΎΠΌΠ° |
SectionType | Π’ΠΈΠΏ ΡΠ΅ΠΊΡΠΈΠΈ |
Section | Π‘Π΅ΠΊΡΠΈΡ |
ApartmentType | Π’ΠΈΠΏ ΠΊΠ²Π°ΡΡΠΈΡΡ |
Apartment | ΠΠ²Π°ΡΡΠΈΡΠ° |
RoomType | Π’ΠΈΠΏ ΠΊΠΎΠΌΠ½Π°ΡΡ |
Room | ΠΠΎΠΌΠ½Π°ΡΠ° |
Sector | Π‘Π΅ΠΊΡΠΎΡ |
FloorType | Π’ΠΈΠΏ ΡΡΠ°ΠΆΠ° |
Floor | ΠΡΠ°ΠΆ |
PostCode | ΠΠ½Π΄Π΅ΠΊΡ |
Manually | ΠΠ°Π±ΠΎΡ ΡΠΈΠΏΠΎΠ² Π΄Π»Ρ Π΄Π°Π»ΡΠ½Π΅ΠΉΡΠ΅ΠΉ ΡΠ°Π·Π±ΠΎΡΠΊΠΈ Π°Π΄ΡΠ΅ΡΠ° |
NotAddress | ΠΠ΅ Π°Π΄ΡΠ΅Ρ |
Comment | ΠΠΎΠΌΠΌΠ΅Π½ΡΠ°ΡΠΈΠΉ |
AdditionalData | ΠΠΎΠΏΠΎΠ»Π½ΠΈΡΠ΅Π»ΡΠ½ΡΠ΅ Π΄Π°Π½Π½ΡΠ΅ |