-
Notifications
You must be signed in to change notification settings - Fork 220
快速上手
ShilongLee edited this page Jul 29, 2024
·
12 revisions
如果使用Windows操作系统,请跳转到Windows查看启动方式.
-
本地运行
-
make
运行,可选,通过port
参数指定端口。make run
-
也可通过
python
直接运行。但是更建议使用make
的方法,建立虚拟环境可以不与其他项目环境干扰。pip3 install -r requirements.txt python3 main.py
-
-
服务器上运行
sudo docker run -d --name crawler -p 8080:8080 shilongli0101/crawler:latest
或(国内阿里云镜像源)
sudo docker run -d --name crawler -p 8080:8080 registry.cn-hangzhou.aliyuncs.com/shilongli0101/crawler:latest # 国内镜像源
下面以抖音为例,使用Postman模拟请求,其他平台同理。
- 获取cookie
打开抖音网页版,打开浏览器控制台,删选Fetch/XHR,找到第一个请求(没有请求刷新一下),复制request Header中的Cookie。
注意这个cookie是有过期时间的,请求不成功时多半是cookie过期了,例如报错
请先添加账号
,重新获取一下cookie就可以了。
- 添加用户
发送请求,code为0表示成功。
获取当前数据库中的账号列表。
标记账号及其cookie为过期,后续爬虫不再使用该账号。
先到视频详情页获取视频id,然后根据id发送获取详情请求。
先到视频详情页获取视频id,然后根据id发送获取评论请求。
翻页参数自行测试:
offset: 默认0
limit: 默认20
先到视频详情页获取视频id,然后根据上一步获取评论中的cid发送获取回复请求。
翻页参数自行测试:
offset: 默认0
limit: 默认20
翻页参数自行测试:
offset: 默认0
limit: 默认10
更多细节,请查看API文档。