Skip to content

Bold-Sour/Lip_Sync_Tr

Repository files navigation

Wav2Lip: Video Dudak Senkronizasyonu Projesi

Geliştiriciler: Efe Yeniyol & Oğuz Asan

Bu proje, herhangi bir video ve ses dosyasını kullanarak gerçekçi dudak senkronizasyonu oluşturmayı sağlayan bir yapay zeka uygulamasıdır. Wav2Lip modelini kullanarak, videoları hedef ses ile senkronize edebilirsiniz.

Logo

🌟 Özellikler

  • Yüksek doğrulukta dudak senkronizasyonu
  • Herhangi bir kimlik, ses ve dil için çalışır
  • CGI yüzler ve sentetik sesler için de uyumlu
  • Tam eğitim kodu, çıkarım kodu ve önceden eğitilmiş modeller mevcut
  • Google Colab üzerinde hızlı başlangıç imkanı

🚀 Başlangıç

Gereksinimler

  • Python 3.6
  • ffmpeg
  • CUDA destekli GPU (önerilen)

Kurulum

  1. Depoyu klonlayın:
git clone https://github.com/yourusername/Wav2Lip.git
cd Wav2Lip
  1. Gerekli paketleri yükleyin:
pip install -r requirements.txt
  1. Yüz algılama modelini indirin:
# face_detection/detection/sfd/s3fd.pth konumuna indirin

💡 Kullanım

Herhangi bir videoyu herhangi bir ses ile senkronize edebilirsiniz:

python inference.py --checkpoint_path <model_dosyası> --face <video.mp4> --audio <ses_dosyası>

İpuçları

  • Daha iyi sonuçlar için --pads parametresini ayarlayın
  • Görsel artifaktlar için --nosmooth parametresini deneyin
  • Video çözünürlüğünü --resize_factor ile ayarlayın

📊 Performans İyileştirmeleri

  • Yüz algılama hassasiyeti artırıldı
  • Dudak senkronizasyon kalitesi geliştirildi
  • İşlem hızı optimizasyonları eklendi

🤝 Katkıda Bulunma

  1. Fork edin
  2. Feature branch oluşturun (git checkout -b feature/AmazingFeature)
  3. Değişikliklerinizi commit edin (git commit -m 'Add some AmazingFeature')
  4. Branch'inizi push edin (git push origin feature/AmazingFeature)
  5. Pull Request oluşturun

📝 Lisans

Bu proje MIT lisansı altında lisanslanmıştır. Detaylar için LICENSE dosyasına bakın.

MIT License

Copyright (c) 2024 Efe Yeniyol

Permission is hereby granted, free of charge, to any person obtaining a copy of this software and associated documentation files (the "Software"), to deal in the Software without restriction, including without limitation the rights to use, copy, modify, merge, publish, distribute, sublicense, and/or sell copies of the Software, and to permit persons to whom the Software is furnished to do so, subject to the following conditions:

The above copyright notice and this permission notice shall be included in all copies or substantial portions of the Software.

THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.

🙏 Teşekkürler

  • Orijinal Wav2Lip ekibine
  • TTS repository'sine katkıda bulunanlara
  • Face Detection kodunu sağlayan face_alignment ekibine
  • Topluluk katkılarına

📧 İletişim

Efe Yeniyol - @your_twitter - [email protected]

Proje Linki: https://github.com/yourusername/Wav2Lip

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published