Результаты представленные в демонстрации не воспроизводимы в текущем виде

#15

by diimdeep - opened 27 days ago

Discussion

diimdeep

27 days ago

•

edited 27 days ago

Привет, прошу выложить код необходимый для генерации результатов из демо.

Спасибо за проделанную работу, модель в выложенном виде подошла к f5-tts-mlx для работы на Apple Silicon, но синтез не годится, с акцентом или вовсе разваливается, код был бы полезен для портирования под русский язык

diimdeep

26 days ago

нашёл примеров
https://github.com/alphacep/vosk-tts/blob/8960285da6ae1c3fdd1a75ffa82bfcf43e13556c/extra/tts-test/ru/f5-misha/synth.py
https://github.com/Atm4x/NeuroMita/blob/main/src/handlers/voice_models/pipelines/f5_pipeline.py#L24

Misha24-10

Owner 20 days ago

Привет! У тебя получилось запустить модель f5-tts в mlx формате?

diimdeep

16 days ago

Да, немного подлатал f5-tts-mlx и заработало, скорость генерации неудовлетворительная, а особенно после квантизации почему то еще медленнее и ббббббольше памяти, а в общем по сравнению с kokoro медленно, по этому пока потерял интерес

lizardjazz1

13 days ago

•

edited 13 days ago

kokoro умеет в русский?

Да, немного подлатал f5-tts-mlx и заработало, скорость генерации неудовлетворительная, а особенно после квантизации почему то еще медленнее и ббббббольше памяти, а в общем по сравнению с kokoro медленно, по этому пока потерял интерес

diimdeep

13 days ago

не умеет, сравнение только к тому что t5-tts не юзабельна по скорости по сравнению с kokoro

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment