Skip to content

Latest commit

 

History

History
45 lines (30 loc) · 1.23 KB

README.md

File metadata and controls

45 lines (30 loc) · 1.23 KB

NLP_NLTK

NLTK的学习笔记,包括NLTK库和基础的Python。《Python自然语言处理》这本书不仅介绍了NLTK,其中的Python入门教程也非常好。

整理全部在jupyter notebook上进行。

初步计划分为三部分:

  1. NLTK

    NLTK库相关操作和概念理解

    • 文本数据集操作
      • 词索引|词频统计|选词|连词|词搭配
    • 理解自然语言
      • 词义消歧|指代消解|机器翻译|人机对话
    • 语料/资源获取
      • 古腾堡语料|网络聊天语料|布朗语料库|路透社语料|就职演说语料
      • 标注文本语料|其他语料库|导入自己的语料文件
    • 文本语料加工
    • 分类和词性标注
    • 文本分类
    • 信息提取
    • 语句结构分析
    • 基于特征的文法
    • 分析句子
    • 数据管理
  2. NLTK_Python

    《Python自然语言处理》这本书中对Python的教学内容,由浅入深。当然,内容是结合nltk进行的。

    • Python入门
    • 数据结构和变量
    • 决策和控制
    • 循环
    • 结构化程序
  3. Other

    其他补充内容