Skip to content

yaolinxia/Chinese-word-segmentation

Repository files navigation

Chinese-word-segmentation

Get_firstWords.py:分词之获取词频,按从大到小排序 jieba_QW:针对民事一审文书集,一万+文书QW字段进行的提取,使用结巴进行分词后,结果存放于test_QW.txt中 针对此分词结果统计的词频在QW_frequency.txt中

jieba_QW_addDic:加入关键词词典,针对民事一审文书集,一万+文书QW字段进行的提取,放入到test_QW_addDic.txt中 针对此分词结果统计的词频在QW_frequency_addDic.txt中

1-15

userdic=>提取裁判文书网中关键词所制作的词典 stopwords=>在网上所找到的停用词表 testResult为分词结果,以及对分词结果所做的词频统计

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •