Skip to content

该项目通过python脚本从巨潮网络的服务器获取中国股市(sz,sh)的公告(上市公司和监管机构),把公告信息防盗数据库,公告文件下载到本地,并支持网页查询和读取。

Notifications You must be signed in to change notification settings

feiyilicare/China_stock_announcement

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

40 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

China_stock_announcement

简介

  • 该项目通过python脚本从巨潮网络的服务器获取中国股市公告(上市公司和监管机构),公告信息存入数据库,公告文件下载到本地
  • 还可支持文本抽取, 网页,API的查询和读取等功能
  • python实现公告爬取下载,nodejs搭建网络服务,提供api和网页展示

文件说明

  • database/: 存放数据库的sql文件,可以用shell命令执行,创建数据库和数据表
  • nodejs_query/: 存放node服务的代码
  • python_scraw/: 存放python爬虫的程序
  • 2plaintext/: 存放一个python小脚本,用于将pdf、doc、docx文件转为纯文本文件

使用

  • 准备好MySQL,Python等环境, 参考python_scraw/cninfo_main.py的头引入,下载一些python包
  • 进入 database/ 执行 mysql -u $USER -p$PASSWORD <database.sql,创建数据库和数据表
  • 在python_scraw/config中,修改文件路径和数据库配置
  • 执行python cninfo_main.py 进行下载,参数介绍见 python_scraw/README.md

附加

  • 如需提供静态网站展示,可以用nodejs_query中的代码启动一个服务
  • 2plaintext/ 下的程序可以抽取纯文本

About

该项目通过python脚本从巨潮网络的服务器获取中国股市(sz,sh)的公告(上市公司和监管机构),把公告信息防盗数据库,公告文件下载到本地,并支持网页查询和读取。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 70.5%
  • JavaScript 19.7%
  • HTML 9.8%