RWKV 5 supported vLLM？LMdeploy？TGI？Fastllm？FasterTransformer？ #232

lanzhoushaobing · 2024-03-19T10:44:12Z

RWKV 5 supported vLLM？LMdeploy？TGI？Fastllm？FasterTransformer？
What should I do to get the inference performance？like throughput, token latency and latency？

BlinkDL · 2024-03-26T13:44:16Z

not yet. someone is working on rwkv.cpp support ggerganov/llama.cpp#846

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

RWKV 5 supported vLLM？LMdeploy？TGI？Fastllm？FasterTransformer？ #232

RWKV 5 supported vLLM？LMdeploy？TGI？Fastllm？FasterTransformer？ #232

lanzhoushaobing commented Mar 19, 2024

BlinkDL commented Mar 26, 2024

RWKV 5 supported vLLM？LMdeploy？TGI？Fastllm？FasterTransformer？ #232

RWKV 5 supported vLLM？LMdeploy？TGI？Fastllm？FasterTransformer？ #232

Comments

lanzhoushaobing commented Mar 19, 2024

BlinkDL commented Mar 26, 2024