Get_firstWords.py:分词之获取词频,按从大到小排序 jieba_QW:针对民事一审文书集,一万+文书QW字段进行的提取,使用结巴进行分词后,结果存放于test_QW.txt中 针对此分词结果统计的词频在QW_frequency.txt中
jieba_QW_addDic:加入关键词词典,针对民事一审文书集,一万+文书QW字段进行的提取,放入到test_QW_addDic.txt中 针对此分词结果统计的词频在QW_frequency_addDic.txt中
1-15
userdic=>提取裁判文书网中关键词所制作的词典 stopwords=>在网上所找到的停用词表 testResult为分词结果,以及对分词结果所做的词频统计