Một repo đang được rất nhiều dev AI Audio bookmark vì… gần như gom toàn bộ thế giới TTS/Voice Cloning open-source vào một chỗ

Từ ElevenLabs clone miễn phí, voice AI realtime, đến music generation local… tất cả đều có trong danh sách này.

Đây là một “Awesome List” cực kỳ chất lượng dành cho:

* Text-to-Speech (TTS)

* Voice Cloning

* Music Generation

* Audio Restoration

* Speech Recognition (ASR)

Điểm hay nhất:

* Update liên tục theo model mới nhất 2026

* Có bảng so sánh nhanh:

* Streaming realtime?

* Hỗ trợ bao nhiêu ngôn ngữ?

* Có zero-shot voice clone không?

* Chạy CPU được không?

* License thương mại ra sao?

Một số model nổi bật trong repo:

* VoxCPM2 → 30 ngôn ngữ + realtime streaming

* TinyTTS → model siêu nhỏ chạy CPU cực nhanh

* OmniVoice → hỗ trợ hơn 600 ngôn ngữ

* Fish Audio S2 Pro → emotion/prosody control mạnh

* VieNeu-TTS → model tối ưu cho tiếng Việt

* Voxtral-4B-TTS của Mistral AI

* LongCat AudioDiT diffusion TTS mới

Ngoài TTS còn có:

* Music generation

* AI singing voice

* Podcast style generation

* Audio enhancement/noise removal

* Whisper variants & ASR models

Điểm thú vị:

* Có nhiều model nhỏ tới mức chạy được trên laptop không GPU

* Một số model realtime gần ngang ElevenLabs

* Open-source audio đang phát triển cực nhanh trong 2026

* Rất hợp để build:

* AI companion

* VTuber

* Podcast AI

* Dub phim

* Voice assistant local

Nếu bạn đang làm AI Audio hoặc muốn build “ElevenLabs local” thì đây gần như là repo bắt buộc phải bookmark

GitHub: