Skip to content

LIKEGAKKI/LiveTalking

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Real time interactive streaming digital human, realize audio video synchronous dialogue. It can basically achieve commercial effects.
实时交互流式数字人,实现音视频同步对话。基本可以达到商用效果

ernerf效果 musetalk效果 wav2lip效果

为避免与3d数字人混淆,原项目metahuman-stream改名为livetalking,原有链接地址继续可用

News

  • 2024.12.8 完善多并发,显存不随并发数增加
  • 2024.12.21 添加wav2lip、musetalk模型预热,解决第一次推理卡顿问题。感谢@heimaojinzhangyz
  • 2024.12.28 添加数字人模型Ultralight-Digital-Human。 感谢@lijihua2017
  • 2025.2.7 添加fish-speech tts
  • 2025.2.21 添加wav2lip256开源模型 感谢@不蠢不蠢
  • 2025.3.2 添加腾讯语音合成服务

Features

  1. 支持多种数字人模型: ernerf、musetalk、wav2lip、Ultralight-Digital-Human
  2. 支持声音克隆
  3. 支持数字人说话被打断
  4. 支持全身视频拼接
  5. 支持rtmp和webrtc
  6. 支持视频编排:不说话时播放自定义视频
  7. 支持多并发

1. Installation

Tested on Ubuntu 20.04, Python3.10, Pytorch 1.12 and CUDA 11.3

1.1 Install dependency

conda create -n nerfstream python=3.10
conda activate nerfstream
#如果cuda版本不为11.3(运行nvidia-smi确认版本),根据<https://pytorch.org/get-started/previous-versions/>安装对应版本的pytorch 
conda install pytorch==1.12.1 torchvision==0.13.1 cudatoolkit=11.3 -c pytorch
pip install -r requirements.txt
#如果需要训练ernerf模型,安装下面的库
# pip install "git+https://github.com/facebookresearch/pytorch3d.git"
# pip install tensorflow-gpu==2.8.0
# pip install --upgrade "protobuf<=3.20.1"

安装常见问题FAQ
linux cuda环境搭建可以参考这篇文章 https://zhuanlan.zhihu.com/p/674972886

2. Quick Start

服务端需要开放端口 tcp:8010; udp:1-65536
如果需要商用高清wav2lip模型,可以与我联系购买

如果访问不了huggingface,在运行前

export HF_ENDPOINT=https://hf-mirror.com

3. More Usage

使用说明: https://livetalking-doc.readthedocs.io/

4. Docker Run

不需要前面的安装,直接运行。

docker run --gpus all -it --network=host --rm registry.cn-beijing.aliyuncs.com/codewithgpu2/lipku-metahuman-stream:2K9qaMBu8v

代码在/root/metahuman-stream,先git pull拉一下最新代码,然后执行命令同第2、3步

提供如下镜像

5. TODO

  • 添加chatgpt实现数字人对话
  • 声音克隆
  • 数字人静音时用一段视频代替
  • MuseTalk
  • Wav2Lip
  • Ultralight-Digital-Human

如果本项目对你有帮助,帮忙点个star。也欢迎感兴趣的朋友一起来完善该项目.

  • 知识星球: https://t.zsxq.com/7NMyO 沉淀高质量常见问题、最佳实践经验、问题解答
  • 微信公众号:数字人技术

About

Real time interactive streaming digital human

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 78.2%
  • Cuda 9.7%
  • JavaScript 7.6%
  • HTML 3.5%
  • C 0.6%
  • Dockerfile 0.2%
  • Other 0.2%