Skip to content

PEPScrapy — Парсер документов PEP

Notifications You must be signed in to change notification settings

tvules/PEPScrapy

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

PEPScrapy

Содержание

Парсер документов PEP на базе фреймворка Scrapy.

🔥 Возможности

  • Для каждого документа PEP получить информацию: номер, название, статус.
  • Узнать общее количество документов PEP в каждом статусе.

Формат выходных данных: .csv

Технологии

Scrapy

⚙ Начало Работы

Чтобы запустить локальную копию проекта, следуй инструкциям ниже.

⚠ Зависимости

Установка

  1. Клонируй репозиторий

    git clone https://github.com/tvules/PEPScrapy.git
    cd PEPScrapy
  2. Установи зависимости проекта

    pip install -r requirements.txt

👀 Использование

  1. Выполни скрипт парсинга

    scrapy crawl pep

    Собранная информация будет доступна в директории results/.


Автор проекта: Ilya Petrukhin

About

PEPScrapy — Парсер документов PEP

Topics

Resources

Stars

Watchers

Forks

Languages