Skip to content

無料で使える中品質なテキスト読み上げソフトウェア、VOICEVOXのコア

License

Notifications You must be signed in to change notification settings

takana-v/voicevox_core

 
 

Repository files navigation

VOICEVOX CORE

VOICEVOX の音声合成コア。
Releases にビルド済みのコアライブラリ(.so/.dll/.dylib)があります。

(エディターは VOICEVOX 、 エンジンは VOICEVOX ENGINE 、 全体構成は こちら に詳細があります。)

依存関係

環境に対応した ONNX Runtime をダウンロードし、リポジトリにonnxruntimeというディレクトリ名で展開します。

Windows と Linux の場合

GPU 対応版はCUDA 11.1CUDNN のインストールと GPU に対応した ONNXRUNTIME のダウンロードが必要です。

macOS の場合

CUDA の macOS サポートは現在終了しているため、VOICEVOX CORE の macOS 向けコアライブラリも CUDA, CUDNN を利用しない CPU 版のみの提供となります。

Raspberry Pi (armhf)の場合

core.zipに Raspberry Pi 用の ONNX Runtime を同梱しています。 利用には、libgomp のインストールが必要です。

sudo apt install libgomp1

API

core.h をご参照ください。

サンプルの実行

まず Releases からコアライブラリが入った zip をダウンロードしておきます。

Python 3

ソースコードから実行

# C++モジュールのビルド
mkdir build
cd build
# もしダウンロードしたonnx runtimeが別のところにあるなら、以下のコマンドを
# cmake .. -DONNXRUNTIME_DIR=(ダウンロードしたonnx runtimeのパス) に変更する。
cmake ..
cmake --build . --config Release
cmake --install .
cd ..

# (省略可能) pythonモジュールのテスト
python setup.py test

# pythonモジュールのインストール
pip install .

cd example/python

python run.py \
    --text "これは本当に実行できているんですか" \
    --speaker_id 1 \
    --root_dir_path="../../model"

# 引数の紹介
# --text 読み上げるテキスト
# --speaker_id 話者ID
# --use_gpu GPUを使う
# --f0_speaker_id 音高の話者ID(デフォルト値はspeaker_id)
# --f0_correct 音高の補正値(デフォルト値は0。+-0.3くらいで結果が大きく変わります)
# --root_dir_path onnxファイル等必要なファイルがあるディレクトリ

Docker から

現在 onnx 対応作業中のため、main ブランチ上の Dockerfile はビルドできません
git checkout origin/release-0.9を実行し、バージョン 0.9.0 の環境でお試しください
詳しくは#44

# イメージのビルド
docker build -t voicevox_core example/python

# コンテナの起動(音声を保存しておくボリュームを作成)
docker run -it -v ~/voicevox:/root/voice voicevox_core bash

# テスト音声 `おはようございます-1.wav` を生成
python run.py --text おはようございます --speaker_id 1
mv *.wav ~/voice
exit

# 音声の再生
aplay ~/voice/おはようございます-1.wav

その他の言語

サンプルコードを実装された際はぜひお知らせください。こちらに追記させて頂きます。

事例紹介

VOICEVOX ENGINE SHARP @yamachu ・・・ VOICEVOX ENGINE の C# 実装
Node VOICEVOX Engine @y-chan ・・・ VOICEVOX ENGINE の Node.js/C++ 実装

ライセンス

サンプルコードおよび core.hMIT LICENSE です。

Releases にあるビルド済みのコアライブラリは別ライセンスなのでご注意ください。

About

無料で使える中品質なテキスト読み上げソフトウェア、VOICEVOXのコア

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages

  • C++ 94.7%
  • Python 3.7%
  • Cython 0.7%
  • C 0.4%
  • CMake 0.2%
  • Dockerfile 0.2%
  • Batchfile 0.1%