Результаты представленные в демонстрации не воспроизводимы в текущем виде
Привет, прошу выложить код необходимый для генерации результатов из демо.
Спасибо за проделанную работу, модель в выложенном виде подошла к f5-tts-mlx для работы на Apple Silicon, но синтез не годится, с акцентом или вовсе разваливается, код был бы полезен для портирования под русский язык
Привет! У тебя получилось запустить модель f5-tts в mlx формате?
Да, немного подлатал f5-tts-mlx и заработало, скорость генерации неудовлетворительная, а особенно после квантизации почему то еще медленнее и ббббббольше памяти, а в общем по сравнению с kokoro медленно, по этому пока потерял интерес
kokoro умеет в русский?
Да, немного подлатал f5-tts-mlx и заработало, скорость генерации неудовлетворительная, а особенно после квантизации почему то еще медленнее и ббббббольше памяти, а в общем по сравнению с kokoro медленно, по этому пока потерял интерес
не умеет, сравнение только к тому что t5-tts не юзабельна по скорости по сравнению с kokoro