Skip to content

electronic-pig/DoubanTop250-WebCrawler

Repository files navigation

DoubanTop250-WebCrawler

GitHub build status python version GitHub Repo stars

豆瓣Top250电影列表网络爬虫+数据可视化Web应用

主要文件结构

│  app.py                  //flask应用入口
│  dockerfile              //docker部署文件
│  movieTop250.db          //sqlite数据库文件
│  requirements.txt        //项目依赖文件
│  WebCrawler.py           //网页爬虫文件
│  wordCloud.py            //词云生成文件
├─static                   
│  └─assets                //静态资源文件
├─templates                //项目页面文件
│      index.html
│      movie.html
│      score.html
│      team.html
│      word.html
├─github
│  └─workflows
|        main.yml          //github Actions 自动化部署配置文件
        

项目运行

pip install -r requirements.txt
python app.py

Docker部署

docker pull electronicpig/douban-webapp:latest
docker run -d --name douban-webapp -p 8000:8000 electronicpig/douban-webapp:latest

运行效果

主页面

image

电影列表页面

image