VOICEVOX の音声合成コア。
Releases にビルド済みのコアライブラリ(.so/.dll/.dylib)があります。
(エディターは VOICEVOX 、 エンジンは VOICEVOX ENGINE 、 全体構成は こちら に詳細があります。)
- ONNX Runtime v1.9.0/v1.9.1: https://github.com/microsoft/onnxruntime
- CMake
環境に対応した ONNX Runtime をダウンロードし、リポジトリにonnxruntime
というディレクトリ名で展開します。
GPU 対応版はCUDA 11.1 と CUDNN のインストールと GPU に対応した ONNXRUNTIME のダウンロードが必要です。
CUDA の macOS サポートは現在終了しているため、VOICEVOX CORE の macOS 向けコアライブラリも CUDA, CUDNN を利用しない CPU 版のみの提供となります。
core.zip
に Raspberry Pi 用の ONNX Runtime を同梱しています。
利用には、libgomp のインストールが必要です。
sudo apt install libgomp1
core.h をご参照ください。
まず Releases からコアライブラリが入った zip をダウンロードしておきます。
# C++モジュールのビルド
mkdir build
cd build
# もしダウンロードしたonnx runtimeが別のところにあるなら、以下のコマンドを
# cmake .. -DONNXRUNTIME_DIR=(ダウンロードしたonnx runtimeのパス) に変更する。
cmake ..
cmake --build . --config Release
cmake --install .
cd ..
# (省略可能) pythonモジュールのテスト
python setup.py test
# pythonモジュールのインストール
pip install .
cd example/python
python run.py \
--text "これは本当に実行できているんですか" \
--speaker_id 1 \
--root_dir_path="../../model"
# 引数の紹介
# --text 読み上げるテキスト
# --speaker_id 話者ID
# --use_gpu GPUを使う
# --f0_speaker_id 音高の話者ID(デフォルト値はspeaker_id)
# --f0_correct 音高の補正値(デフォルト値は0。+-0.3くらいで結果が大きく変わります)
# --root_dir_path onnxファイル等必要なファイルがあるディレクトリ
現在 onnx 対応作業中のため、main ブランチ上の Dockerfile はビルドできません
git checkout origin/release-0.9
を実行し、バージョン 0.9.0 の環境でお試しください
詳しくは#44へ
# イメージのビルド
docker build -t voicevox_core example/python
# コンテナの起動(音声を保存しておくボリュームを作成)
docker run -it -v ~/voicevox:/root/voice voicevox_core bash
# テスト音声 `おはようございます-1.wav` を生成
python run.py --text おはようございます --speaker_id 1
mv *.wav ~/voice
exit
# 音声の再生
aplay ~/voice/おはようございます-1.wav
サンプルコードを実装された際はぜひお知らせください。こちらに追記させて頂きます。
VOICEVOX ENGINE SHARP @yamachu ・・・ VOICEVOX ENGINE の C# 実装
Node VOICEVOX Engine @y-chan ・・・ VOICEVOX ENGINE の Node.js/C++ 実装
サンプルコードおよび core.h は MIT LICENSE です。
Releases にあるビルド済みのコアライブラリは別ライセンスなのでご注意ください。