Geliştiriciler: Efe Yeniyol & Oğuz Asan
Bu proje, herhangi bir video ve ses dosyasını kullanarak gerçekçi dudak senkronizasyonu oluşturmayı sağlayan bir yapay zeka uygulamasıdır. Wav2Lip modelini kullanarak, videoları hedef ses ile senkronize edebilirsiniz.
- Yüksek doğrulukta dudak senkronizasyonu
- Herhangi bir kimlik, ses ve dil için çalışır
- CGI yüzler ve sentetik sesler için de uyumlu
- Tam eğitim kodu, çıkarım kodu ve önceden eğitilmiş modeller mevcut
- Google Colab üzerinde hızlı başlangıç imkanı
- Python 3.6
- ffmpeg
- CUDA destekli GPU (önerilen)
- Depoyu klonlayın:
git clone https://github.com/yourusername/Wav2Lip.git
cd Wav2Lip
- Gerekli paketleri yükleyin:
pip install -r requirements.txt
- Yüz algılama modelini indirin:
# face_detection/detection/sfd/s3fd.pth konumuna indirin
Herhangi bir videoyu herhangi bir ses ile senkronize edebilirsiniz:
python inference.py --checkpoint_path <model_dosyası> --face <video.mp4> --audio <ses_dosyası>
- Daha iyi sonuçlar için
--pads
parametresini ayarlayın - Görsel artifaktlar için
--nosmooth
parametresini deneyin - Video çözünürlüğünü
--resize_factor
ile ayarlayın
- Yüz algılama hassasiyeti artırıldı
- Dudak senkronizasyon kalitesi geliştirildi
- İşlem hızı optimizasyonları eklendi
- Fork edin
- Feature branch oluşturun (
git checkout -b feature/AmazingFeature
) - Değişikliklerinizi commit edin (
git commit -m 'Add some AmazingFeature'
) - Branch'inizi push edin (
git push origin feature/AmazingFeature
) - Pull Request oluşturun
Bu proje MIT lisansı altında lisanslanmıştır. Detaylar için LICENSE dosyasına bakın.
MIT License
Copyright (c) 2024 Efe Yeniyol
Permission is hereby granted, free of charge, to any person obtaining a copy of this software and associated documentation files (the "Software"), to deal in the Software without restriction, including without limitation the rights to use, copy, modify, merge, publish, distribute, sublicense, and/or sell copies of the Software, and to permit persons to whom the Software is furnished to do so, subject to the following conditions:
The above copyright notice and this permission notice shall be included in all copies or substantial portions of the Software.
THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.
- Orijinal Wav2Lip ekibine
- TTS repository'sine katkıda bulunanlara
- Face Detection kodunu sağlayan face_alignment ekibine
- Topluluk katkılarına
Efe Yeniyol - @your_twitter - [email protected]
Proje Linki: https://github.com/yourusername/Wav2Lip