Skip to content

Commit 617868c

Browse files
author
papyrussolution
committed
2 parents 7b0de23 + b190f24 commit 617868c

File tree

1 file changed

+20
-0
lines changed

1 file changed

+20
-0
lines changed

README.md

Lines changed: 20 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -8,6 +8,8 @@ Universe-HTT barcode reference
88
Самый большой и аккуратный открытый справочник штрихкодов в интернете! Если не верите - поисковики помогут развеять сомнения.
99
Более 3.5 миллионов штрихкодов стандартов ean13,ean8,upc-e,upc-a с соответствующими наименованиями, брэндами и категориями.
1010

11+
Кроме прочего, база данных включает в себя все валидные штрихкоды, представленные в базе данных [USDA Food Composition Databases](https://ndb.nal.usda.gov/ndb/search/list) (по состоянию на август 2018 года).
12+
1113
Оригинал справочника находится на сервере Universe-HTT - здесь мы размещаем его копию, содержащую следующие поля:
1214

1315
* (ID) Идентификатор товара в базе данных Universe-HTT
@@ -26,13 +28,23 @@ Universe-HTT barcode reference
2628

2729
Репозиторий в каталоге DATA содержит данные, разбитые на фрагменты (примерно по 1Мб каждый). Полный файл, упакованный в формате 7z, находится в [релизах](https://github.com/papyrussolution/UhttBarcodeReference/releases).
2830

31+
Дополнительные файлы:
32+
33+
* uhtt_barcode_ref_stat.txt - статистика: общее количество штрихкодов (barcode-count), количество брэндов (brand-count), количество категорий (categ-count), количество слов (word-count)
34+
* uhtt_barcode_ref_brand_concord.csv - список брэндов с количеством штрихкодов, соответствующих каждому. Отсортированы по наименованию.
35+
* uhtt_barcode_ref_category_concord.csv - список категорий с количеством штрихкодов, соответствующих каждой. Отсортированы по наименовани.
36+
* uhtt_barcode_ref_word_concord_bytext.csv - список слов из наименований товаров с частотой по всей выборке. Отсортированы в лексикографическом порядке.
37+
* uhtt_barcode_ref_word_concord_byfreq.csv - список слов из наименований товаров с частотой по всей выборке. Отсортированы по частоте.
38+
2939
В качестве благодарности, вы можете отметить звездочкой этот репозиторий, а так же репозиторий [OpenPapyrus](https://github.com/papyrussolution/OpenPapyrus) поскольку именно эту великолепную ERP-систему мы используем для администрирования, обработки и обеспечения доступа к данным справочника через портал [Universe-HTT](https://uhtt.ru).
3040

3141
---------------------------
3242

3343
The largest and most accurate open reference book of bar codes on the Internet! If you do not believe it, the search engines will help dispel doubts.
3444
Over 3.5 million bar codes of ean13, ean8, upc-e, upc-a standards with corresponding names, brands and categories.
3545

46+
Among other things, the database includes all valid barcodes presented in the [USDA Food Composition Databases](https://ndb.nal.usda.gov/ndb/search/list) (as of August 2018).
47+
3648
The original directory is located on the Universe-HTT server - here we place its copy containing the following fields:
3749

3850
* (ID) The identifier of the goods in the Universe-HTT database
@@ -51,4 +63,12 @@ In addition, bar codes EAN13 with leading digit 2 (private codes) are practicall
5163

5264
The repository in the DATA directory contains data broken into fragments (approximately 1MB each). The complete file, packed in 7z format, is in [releases](https://github.com/papyrussolution/UhttBarcodeReference/releases).
5365

66+
Additional files:
67+
68+
* uhtt_barcode_ref_stat.txt - statistics: the total number of bar codes (barcode-count), the number of brands (brand-count), the number of categories (categ-count), the number of words (word-count)
69+
* uhtt_barcode_ref_brand_concord.csv - a list of brands with the number of bar codes corresponding to each. Sorted by name.
70+
* uhtt_barcode_ref_category_concord.csv - a list of categories with the number of bar codes corresponding to each. Sorted by name.
71+
* uhtt_barcode_ref_word_concord_bytext.csv - a list of words from product names with a frequency across the entire sample. Sorted out in lexicographical order.
72+
* uhtt_barcode_ref_word_concord_byfreq.csv - a list of words from product names with a frequency across the entire sample. Sorted by frequency.
73+
5474
As gratitude, you can mark this repository with an asterisk, as well as the [OpenPapyrus](https://github.com/papyrussolution/OpenPapyrus) repository, since we use this excellent ERP-system for administration, processing and access to the directory data through the portal [Universe-HTT](https://uhtt.ru).

0 commit comments

Comments
 (0)