asr-decode

从 Kaldi 中裁剪的解码推理框架

实现

不依赖OpenFST、OpenBLAS等库实现全部计算，便于学习和移植
重现了基础的Viterbi解码(https://github.com/kaldi-asr/kaldi/blob/master/src/gmmbin/gmm-decode-simple.cc)

使用

./bin/main ./model/final.mdl ./model/HCLG.fst ./data/1_0_0_0_0_0_0_0.wav

备注:

model文件来源于yesno的基础示例
从音频计算feature的过程等价于下面过程

#从wave计算mfcc(包含一次compress)
kaldi/src/featbin/compute-mfcc-feats --config=conf/mfcc.conf scp:data/test_yesno/wav.scp ark:- | kaldi/src/featbin/copy-feats --compress=true ark:- ark,scp:test_yesno.ark,test_yesno.scp

#从mfcc计算cmvn
kaldi/src/featbin/compute-cmvn-stats --spk2utt=ark:data/test_yesno/spk2utt scp:test_yesno.scp ark,scp:cmvn_test_yesno.ark,cmvn_test_yesno.scp

#应用cmvn到mfcc feature(包含一次add deltas)
kaldi/src/featbin/apply-cmvn --utt2spk=ark:data/test_yesno/split1/1/utt2spk scp:cmvn_test_yesno.scp scp:test_yesno.scp ark:- | kaldi/src/featbin/add-deltas ark:- ark:feat.ark

Todo

其他解码方式和声学模型并优化，实现vosk-api的完整功能

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
data		data
include		include
model		model
src		src
.gitignore		.gitignore
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

asr-decode

从 Kaldi 中裁剪的解码推理框架

实现

使用

Todo

About

Releases

Packages

Languages

License

Ma-Dan/asr-decode

Folders and files

Latest commit

History

Repository files navigation

asr-decode

从 Kaldi 中裁剪的解码推理框架

实现

使用

Todo

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages