Skip to content

An automatic translation tool for paper ( PDF => TXT, English => Chinese )

License

Notifications You must be signed in to change notification settings

elliotxx/paper_autotranslation

Repository files navigation

论文自动翻译

自动翻译论文(pdf),生成带翻译段落的 txt 文档作参考,以方便阅读英文文献。

介绍

PDF 解析成文本采用 pdfminer 库,主要参考:解决pdfminer ImportError: cannot import name process_pdf(7)PDFMiner提取PDF文本

翻译部分调用了网友封装的有道翻译的免费 API,参考 github:Chinese-boy/Many-Translaters

ps:有道翻译API现在收费了,一篇4页的论文翻译一次就花了1元。

日志输出等级

0: 输出最简单,无段落信息,无错误信息
1: 输出段落信息,无错误信息
2: 输出段落信息,输出错误信息

依赖

  • pdfminer
  • requests
  • execjs

用法

  1. 安装依赖
pip install pdfminer requests
  1. 运行测试用例
paper_translation.py "2017_ICSA_Bidirectional Mapping between Architecture Model and Code for Synchronization.pdf"
  1. 本地会生成 pdf 同名的 txt 文件

注意:程序基于 python2.7,python3.x 请使用文件 "paper_translation_3x.py"(感谢 @Zephyrusvvvv 和我一起修改 3.x 的版本)

效果图

效果图

参考资料

About

An automatic translation tool for paper ( PDF => TXT, English => Chinese )

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages