Một repo đang được rất nhiều dev AI Audio bookmark vì… gần như gom toàn bộ thế giới TTS/Voice Cloning open-source vào một chỗ

Một repo đang được rất nhiều dev AI Audio bookmark vì… gần như gom toàn bộ thế giới TTS/Voice Cloning open-source vào một chỗ 👀

Từ ElevenLabs clone miễn phí, voice AI realtime, đến music generation local… tất cả đều có trong danh sách này.

Đây là một “Awesome List” cực kỳ chất lượng dành cho:

* Text-to-Speech (TTS)

* Voice Cloning

* Music Generation

* Audio Restoration

* Speech Recognition (ASR)

Điểm hay nhất:

* Update liên tục theo model mới nhất 2026

* Có bảng so sánh nhanh:

* Streaming realtime?

* Hỗ trợ bao nhiêu ngôn ngữ?

* Có zero-shot voice clone không?

* Chạy CPU được không?

* License thương mại ra sao?

Một số model nổi bật trong repo:

* VoxCPM2 → 30 ngôn ngữ + realtime streaming

* TinyTTS → model siêu nhỏ chạy CPU cực nhanh

* OmniVoice → hỗ trợ hơn 600 ngôn ngữ 😳

* Fish Audio S2 Pro → emotion/prosody control mạnh

* VieNeu-TTS → model tối ưu cho tiếng Việt

* Voxtral-4B-TTS của Mistral AI

* LongCat AudioDiT diffusion TTS mới

Ngoài TTS còn có:

* Music generation

* AI singing voice

* Podcast style generation

* Audio enhancement/noise removal

* Whisper variants & ASR models

Điểm thú vị:

* Có nhiều model nhỏ tới mức chạy được trên laptop không GPU

* Một số model realtime gần ngang ElevenLabs

* Open-source audio đang phát triển cực nhanh trong 2026

* Rất hợp để build:

* AI companion

* VTuber

* Podcast AI

* Dub phim

* Voice assistant local

Nếu bạn đang làm AI Audio hoặc muốn build “ElevenLabs local” thì đây gần như là repo bắt buộc phải bookmark 😆

GitHub:

https://github.com/wildminder/awesome-ai-voice

Để lại một bình luận