この記事のMLSAニューラルボコーダーの学習コードです。
Python 3.10以上が必要です。 あらかじめ環境にあったPyTorch 2を導入してください。
pip install -r requirements.txtconfigディレクトリにサンプルの設定ファイルがあります。
適宜data_pathやpreprocessed_path、log_dirなどのパラメータを変更することで前処理・学習に使用できます。
data_path: 学習に使用したいwavファイルが入ったディレクトリを指定してください。preprocessed_path: 前処理データを格納するディレクトリを指定してください。log_dir: 学習ログ(tensorboardのデータ)とチェックポイントを保存するディレクトリを指定してください。
python preprocessor.py <config file>長い音声(歌声データなど)を使用する場合は-sもしくは--splitオプションを使ってください。
python preprocessor.py <config file> -spython train.py <config file>サンプル音声がTensorboard上に出力されます。
MIT ライセンスです。