AsyncScrapper

Asynchronous Web Scraper (gevent + BeautifulSoup)

To run: Goto AsynCrapper directory in terminal

python scraper_test.py input.csv

Add urls in input.csv or create a new csv file with urls and pass it as an argument

Output: Url containing 'jquery.js' added in generated_csv/accepted.csv If not, added in generated_csv/rejected.csv

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
generated_csv		generated_csv
.gitignore		.gitignore
README.md		README.md
__init__.py		__init__.py
csv_reader.py		csv_reader.py
input.csv		input.csv
requirements.txt		requirements.txt
scraper_test.py		scraper_test.py

Provide feedback