Есть исходная номенклатура производителя - она постоянна. Ну относительно, если не появлялся новый продукт.
И есть клиенты, которые у себя заводят продукт так, как им удобно. И все по-разному.
А отчеты предоставляют со своими названиями.
И их надо сопоставить с названиями производителя.
Нужно в отчете клиента найти и сопоставить с базовой номенклатурой.
Ну в последствии добавить артикул. Но артикул не так важно. Главное, чтобы он находил нужную номенклатуру в базовой Производителя.
FuzzyWuzzy (PyPi)
Применение библиотеки FuzzyWuzzy для нечёткого сравнения (Habr)
Сравнение адресов Python (Stackoverflow)
Критически важно!!!
В исходной номенклатуре гарантированно должны быть канонические наименования всех искомых продуктов.
RUN: py -m fuzzy_pharma