PEP Parser — это проект, который автоматически собирает данные о всех PEP ( Python Enhancement Proposals) с сайта PEPs. Парсер сохраняет данные в два CSV-файла:
- Список всех PEP: содержит номер, название и статус каждого PEP.
- Сводка по статусам: подсчитывает количество PEP для каждого статуса, а также общее количество PEP.
- Сбор данных о PEP: номер, название, статус.
- Формирование CSV-файлов:
- Файл со списком всех PEP.
- Файл со сводкой по статусам.
- Подсчет общего количества PEP.
- Сохранение файлов в указанной директории.
-
Клонирование репозитория:
git clone https://github.com/artemmikh/scrapy_parser_pep cd scrapy_parser_pep
-
Создание виртуального окружения:
python -m venv venv source venv/bin/activate # Для Windows: venv\Scripts\activate
-
Установка зависимостей:
pip install -r requirements.txt
-
Настройка проекта: В файле
settings.py
настройте директориюresults/
для сохранения данных.
-
Запустите парсер:
scrapy crawl pep
-
Результаты:
- CSV-файл со списком PEP будет находиться в папке
results/
и именоваться, например, какpep_2024-12-06T12-00-00.csv
. - CSV-файл со сводкой будет находиться там же и именоваться, например, как
status_summary_2024-12-06T12-00-00.csv
.
- CSV-файл со списком PEP будет находиться в папке