Skip to content
/ cilin Public

基于哈工大同义词词林扩展版的单词相似度计算方法

License

Notifications You must be signed in to change notification settings

bububa/cilin

Repository files navigation

同义词词林扩展版

Go Reference Go goreleaser GitHub go.mod Go version of a Go module GoReportCard GitHub license GitHub release

Word similarity computation based on Tongyici Cilin. 这是一个基于哈工大同义词词林扩展版的单词相似度计算方法的golang实现,参考论文如下: 2010 田久乐等,吉林大学学报(信息科学版),基于同义词词林的词语相似度计算方法。

Install

go get -u github.com/bububa/cilin

Usage

import "github.com/bububa/cilin"

cs := cilin.NewSimilarity()
w1 := "抄袭"
w2 := "克隆"
sim := cs.Calculate(w1, w2)
fmt.Printf("%s %s 相似度为 %f\n", w1, w2, sim)
// 抄袭 克隆 相似度为 0.585642777645155

w1 = "人民"
lst := []string{"国民", "群众", "党群", "良民", "同志", "成年人", "市民", "亲属", "志愿者", "先锋"}
for _, w2 := range lst {
    sim := s.Calculate(w1, w2)
    fmt.Printf("%s %s, 相似度:%f\n", w1, w2, sim)
}

// 人民 国民, 相似度:1.000000
// 人民 群众, 相似度:0.957661
// 人民 党群, 相似度:0.897808
// 人民 良民, 相似度:0.718246
// 人民 同志, 相似度:0.663015
// 人民 成年人, 相似度:0.630692
// 人民 市民, 相似度:0.540593
// 人民 亲属, 相似度:0.360396
// 人民 志愿者, 相似度:0.225247
// 人民 先锋, 相似度:0.180198

同类项目

致谢

本代码的实现要感谢下面几位作者:

About

基于哈工大同义词词林扩展版的单词相似度计算方法

Topics

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages