Skip to content

Releases: exam-data/NETEMVocabulary

考研词汇词频排序表 v7.0

20 May 14:20
2169bc3
Compare
Choose a tag to compare

What's Changed

使用人工校对所有释义。

New Contributors

Full Changelog: v6.1.0...v7.0


经统计,在《2024年全国硕士研究生招生考试英语(一)考试大纲词汇表》中要求掌握的词汇共 5530 个,根据四六级、考研英语、专四专八约 200 套试卷文本,按照试卷文本中出现的词频对词汇表进行排序。

排序使用了词形还原策略,所以与实际试卷呈现略有差异。

2444 个单词出现 40 次以上,即平均每做 5 套试卷就能遇到一次的这些单词即为真正的高频词汇

释义经过了人工初步校对,可以保证一定的准确性。减轻不必要的机械记忆负担。

每个单词有其他拼写(即考纲当中有多种写法的单词)的,一并列出,以保证原始数据的准确性。目前根据这个数据进行了初步填充。有空再和考纲校对。

netem_full_list.json 里面存储了所有的数据。也已转换成 sql 文件

本仓库数据基于 CC BY-NC-SA 4.0 共享,程序基于 MIT License.

Release 页面下载 PDF 版本。

如果想自行生成,请参阅文档

考研词汇词频排序表 v6.1.0

09 Jan 16:09
5ec7450
Compare
Choose a tag to compare

What's Changed

  • 更改了列名,优化了代码结构
  • 修复了不准确的释义

Full Changelog: v6.0.2...v6.1.0


考研词汇词频排序数据

经统计,在《2024年全国硕士研究生招生考试英语(一)考试大纲词汇表》中要求掌握的词汇共 5530 个,根据四六级、考研英语、专四专八约 200 套试卷文本,按照试卷文本中出现的词频对词汇表进行排序。

排序使用了词形还原策略,所以与实际试卷呈现略有差异。

2444 个单词出现 40 次以上,即平均每做 5 套试卷就能遇到一次的这些单词即为真正的高频词汇

高频词汇的释义经过了人工初步校对,其他单词选取使用频率总和大于 50% 的释义(数据来自 the little dict),可以保证一定的准确性。减轻不必要的机械记忆负担。

每个单词有异形词(即考纲当中有多种写法的单词)的,一并列出,以保证原始数据的准确性。目前根据这个数据进行了初步填充。有空再和考纲校对。

目前正在开发对应的跨端小程序,见 mini-voca-app

netem_full_list.json 里面存储了所有的数据。也已转换成 sql 文件

考研词汇词频排序表 v6.0.2

07 Dec 06:58
31a583b
Compare
Choose a tag to compare

What's Changed

  • 修复了一个单词释义达到最大长度的情况。
  • 增加了文档。
  • 增加了生成用于微信小程序数据库的 jsonl 文件的脚本。

Full Changelog: v6.0.1...v6.0.2


考研词汇词频排序数据

经统计,在《2023年全国硕士研究生招生考试英语(一)考试大纲词汇表》中要求掌握的词汇共 5530 个,根据四六级、考研英语、专四专八约 200 套试卷文本,按照试卷文本中出现的词频对词汇表进行排序。

排序使用了词形还原策略,所以与实际试卷呈现略有差异。

2444 个单词出现 40 次以上,即平均每做 5 套试卷就能遇到一次的这些单词即为真正的高频词汇

高频词汇的释义经过了人工初步校对,其他单词选取使用频率总和大于 50% 的释义(数据来自 the little dict),可以保证一定的准确性。减轻不必要的机械记忆负担。

每个单词有异形词(即考纲当中有多种写法的单词)的,一并列出,以保证原始数据的准确性。目前根据这个数据进行了初步填充。有空再和考纲校对。

目前正在开发对应的跨端小程序,见 mini-voca-app

netem.json 里面存储了所有的数据。也已转换成 sql 文件

考研词汇词频排序表 v6.0.1

17 Oct 06:08
Compare
Choose a tag to compare

考研词汇词频排序数据

经统计,在《2023年全国硕士研究生招生考试英语(一)考试大纲词汇表》中要求掌握的词汇共 5530 个,根据四六级、考研英语、专四专八约 200 套试卷文本,按照试卷文本中出现的词频对词汇表进行排序。

排序使用了词形还原策略,所以与实际试卷呈现略有差异。

2444 个单词出现 40 次以上,即平均每做 5 套试卷就能遇到一次的这些单词即为真正的高频词汇

高频词汇的释义经过了人工初步校对,其他单词选取使用频率总和大于 50% 的释义(数据来自 the little dict),可以保证一定的准确性。减轻不必要的机械记忆负担。

每个单词有异形词(即考纲当中有多种写法的单词)的,一并列出,以保证原始数据的准确性。目前根据这个数据进行了初步填充。有空再和考纲校对。

目前正在开发对应的跨端小程序,见 mini-voca-app

netem.json 里面存储了所有的数据。也已转换成 sql 文件

Full Changelog: v6.0...v6.0.1

考研词汇词频排序表 v6.0

17 Oct 04:32
Compare
Choose a tag to compare

考研词汇词频排序数据

经统计,在《2023年全国硕士研究生招生考试英语(一)考试大纲词汇表》中要求掌握的词汇共 5530 个,根据四六级、考研英语、专四专八约 200 套试卷文本,按照试卷文本中出现的词频对词汇表进行排序。

排序使用了词形还原策略,所以与实际试卷呈现略有差异。

2444 个单词出现 40 次以上,即平均每做 5 套试卷就能遇到一次的这些单词即为真正的高频词汇

高频词汇的释义经过了人工初步校对,其他单词选取使用频率总和大于 50% 的释义(数据来自 the little dict),可以保证一定的准确性。减轻不必要的机械记忆负担。

每个单词有异形词(即考纲当中有多种写法的单词)的,一并列出,以保证原始数据的准确性。目前根据这个数据进行了初步填充。有空再和考纲校对。

目前正在开发对应的跨端小程序,见 mini-voca-app

netem.json 里面存储了所有的数据。也已转换成 sql 文件

What's Changed

Please visit milestone v6.0.

Full Changelog: v5.0...v6.0

考研词汇词频排序表 v5.0

13 Sep 12:11
Compare
Choose a tag to compare

考研词汇词频排序数据

经统计,在《2023年全国硕士研究生招生考试英语(一)考试大纲词汇表》中要求掌握的词汇共 5530 个,根据四六级、考研英语、专四专八约 200 套试卷文本,按照试卷文本中出现的词频对词汇表进行排序。

排序使用了词形还原策略,所以与实际试卷呈现略有差异。

2444 个单词出现 40 次以上,即平均每做 5 套试卷就能遇到一次的这些单词即为真正的高频词汇

高频词汇的释义经过了人工初步校对,其他单词选取使用频率总和大于 50% 的释义(数据来自 the little dict),可以保证一定的准确性。减轻不必要的机械记忆负担。

每个单词有异形词(即考纲当中有多种写法的单词)的,一并列出,以保证原始数据的准确性。目前根据这个数据进行了初步填充。有空再和考纲校对。

目前正在开发对应的跨端小程序,见 develop 分支

vocabulary.json 里面存储了所有的数据。也已转换成 sql 文件

本仓库数据基于 CC BY-NC-SA 4.0 共享,程序基于 MIT License.

Release 页面下载 PDF 版本。

使用 generate_doc.py 生成文档初版。

Full Changelog: v4.6...v5.0

考研词汇词频排序表 v4.6

03 Sep 12:24
71f8771
Compare
Choose a tag to compare

What's Changed

New Contributors

Full Changelog: v4.5...v4.6

考研词汇词频排序表 v4.5

01 Aug 06:54
0ad0962
Compare
Choose a tag to compare

考研词汇词频排序数据

经统计,在《2023年全国硕士研究生招生考试英语(一)考试大纲词汇表》中要求掌握的词汇共 5530 个,根据四六级、考研英语、专四专八约 200 套试卷文本,按照试卷文本中出现的词频对词汇表进行排序。

排序使用了词形还原策略,所以与实际试卷呈现略有差异。

2444 个单词出现 40 次以上,即平均每做 5 套试卷就能遇到一次的这些单词即为真正的高频词汇

高频词汇的释义经过了人工校对,能够保证一定准确性。所选取释义均是最常见的释义,减轻不必要的机械记忆负担。

每个单词有异形词(即考纲当中有多种写法的单词)的,计划将其在后面列出,以保证原始数据的准确性。由于数量庞大,尚未有意愿更新。

vocabulary.json 里面存储了所有的数据。

本仓库数据基于 CC BY-NC-SA 4.0 共享,程序基于 MIT License.

Release 页面下载 PDF 版本。

使用 generate_doc.py 生成文档初版。

考研词汇词频排序表 v2.0

12 Jun 04:18
ea4b056
Compare
Choose a tag to compare

考研词汇词频排序数据

经统计,在《2023年全国硕士研究生招生考试英语(一)考试大纲词汇表》中要求掌握的词汇共 5530 个,根据四六级、考研英语、专四专八约 200 套试卷文本,按照试卷文本中出现的词频对词汇表进行排序。

排序使用了词形还原策略,所以与实际试卷呈现略有差异。

vocabulary.json 里面存储了所有的数据。

2444 个单词出现 40 次以上,即平均每做 5 套试卷就能遇到一次的这些单词即为真正的高频词汇。这些单词的释义经过了人工校对,可以保证准确性。

其余单词释义未经人工校对,略有瑕疵。

异形词(即对考纲当中有多种写法的单词)由于数量庞大,尚未有意愿更新。

本仓库数据基于 CC BY-NC-SA 4.0 共享,程序基于 MIT License.

Release 页面下载 PDF 版本。

使用 generate_doc.py 生成文档初版。

考研词汇词频排序表 v1.5

28 Feb 12:37
4ded224
Compare
Choose a tag to compare

经统计,在《2023年全国硕士研究生招生考试英语(一)考试大纲词汇表》中要求掌握的词汇共 5530 个,根据四六级、考研英语、专四专八约 200 套试卷文本,按照出现的词频对词汇表进行排序。

排序使用了词形还原策略,所以与实际试卷呈现略有差异。

单词释义未经人工校对,略有瑕疵。

前 2444 个单词出现 40 次以上,即平均每做 5 套试卷就能遇到一次的这些单词即为真正的高频词汇

异形词(即对考纲当中有多种写法的单词)由于数量庞大,尚未有意愿更新。

vocabulary.json 中的词义来自百度翻译 API。