Offline推論ツール [ English | 日本語 ] 本ディレクトリで次のライブラリを用いた高速なバッチ推論処理を実装を公開します。 vLLM TensorRT-LLM Hugging Face Transformers (baseline) また、Weights & Biases Run管理ツールの実装を公開します。