
Một repo đang được rất nhiều dev AI Audio bookmark vì… gần như gom toàn bộ thế giới TTS/Voice Cloning open-source vào một chỗ ![]()
Từ ElevenLabs clone miễn phí, voice AI realtime, đến music generation local… tất cả đều có trong danh sách này.
Đây là một “Awesome List” cực kỳ chất lượng dành cho:
* Text-to-Speech (TTS)
* Voice Cloning
* Music Generation
* Audio Restoration
* Speech Recognition (ASR)
Điểm hay nhất:
* Update liên tục theo model mới nhất 2026
* Có bảng so sánh nhanh:
* Streaming realtime?
* Hỗ trợ bao nhiêu ngôn ngữ?
* Có zero-shot voice clone không?
* Chạy CPU được không?
* License thương mại ra sao?
Một số model nổi bật trong repo:
* VoxCPM2 → 30 ngôn ngữ + realtime streaming
* TinyTTS → model siêu nhỏ chạy CPU cực nhanh
* OmniVoice → hỗ trợ hơn 600 ngôn ngữ ![]()
* Fish Audio S2 Pro → emotion/prosody control mạnh
* VieNeu-TTS → model tối ưu cho tiếng Việt
* Voxtral-4B-TTS của Mistral AI
* LongCat AudioDiT diffusion TTS mới
Ngoài TTS còn có:
* Music generation
* AI singing voice
* Podcast style generation
* Audio enhancement/noise removal
* Whisper variants & ASR models
Điểm thú vị:
* Có nhiều model nhỏ tới mức chạy được trên laptop không GPU
* Một số model realtime gần ngang ElevenLabs
* Open-source audio đang phát triển cực nhanh trong 2026
* Rất hợp để build:
* AI companion
* VTuber
* Podcast AI
* Dub phim
* Voice assistant local
Nếu bạn đang làm AI Audio hoặc muốn build “ElevenLabs local” thì đây gần như là repo bắt buộc phải bookmark ![]()
GitHub: