Skip to content

📚 罗列书柜 | A set of Ruby scripts for downloading books from www.gushiwen.cn, and generating EPUBs.

Notifications You must be signed in to change notification settings

dev-chenxing/dev-chenxing.github.io

Repository files navigation

我书架上有的是书,你可随意取一本去

         ——「醒世恒言·卷三十八」

吾家藏书五十余卷

三侠五义 两晋演义 何典 儒林外史
儿女英雄传 八仙得道传 刘公案 前汉演义
北史演义 十二楼 南北史演义 南史演义
后汉演义 呼家将 女仙外史 好逑传
孽海花 官场现形记 小五义 小八义
常言道 幻中游 新齐谐 施公案
春秋配 李公案 林公案 济公全传
海上花列传 海国春秋 狄公案 白牡丹
红楼梦 绣云阁 绿野仙踪 老残游记
老残游记续集 聊斋志异 花月痕 荡寇志
薛丁山征西 薛仁贵征东 薛刚反唐 说唐演义全传
说岳全传 镜花缘 阅微草堂笔记 隋唐演义
雍正剑侠图 雷峰塔奇传 鬼神传

How to use

A set of scripts for downloading books from https://www.gushiwen.cn, and generating EPUBs.

You need the following dependencies:

(Optional) print_to_pdf.sh script requires MuPDF

To scrape books

  • Add your list of books to scrape to booklist.csv
    • in the format of url,title,author
    • for example, https://so.gushiwen.cn/guwen/book_46653FD803893E4FECEF70A63E964959.aspx,女仙外史,吕熊
    • url is the table of contents page of the book
    • author must not be empty. If the author is unknown, use 佚名
    • booklist.csv must ends with empty last line
  • Run sh scrape.sh
  • The books scraped will be stored in books

关于我

陈刑,生卒年不详,南海(今广东广州)人。因屡试不第,常流连网络撰写代码。