Finetune
Добрый день! Подскажите, пожалуйста, хочу попробовать дообучить на своем датасете (~40 часов).
Его нужно заранее прогнать через RUAccent, чтобы передать на обучение датасет с уже расставленными ударениями? Или без ударений нужен датасет?
Привет! Рекомендую использовать ударения, если для тебя критична правильная расстановка ударений в словах.
Привет, да, все четко, прогнал через ruaccent, 50 тыщ шагов дообучил на своем датасете на одном конкретном спикере, голос стал менее дребезжащим.
Не смотришь случаем в управление эмоциями?
Типа такого: https://fireredteam.github.io/demos/firered_tts/#speaker-finetune-samples
Привет, да, все четко, прогнал через ruaccent, 50 тыщ шагов дообучил на своем датасете на одном конкретном спикере, голос стал менее дребезжащим.
А случаем гайд как дообучить самому есть?
Привет, да, все четко, прогнал через ruaccent, 50 тыщ шагов дообучил на своем датасете на одном конкретном спикере, голос стал менее дребезжащим.
А случаем гайд как дообучить самому есть?
Гайд не собирал, но скриптом могу поделиться, залью на гит в течение суток-двух
Гайд не собирал, но скриптом могу поделиться, залью на гит в течение суток-двух
Если можешь тэгни меня куда смотреть, буду признателен.
Гайд не собирал, но скриптом могу поделиться, залью на гит в течение суток-двух
Если можешь тэгни меня куда смотреть, буду признателен.
https://github.com/bringmetheural/f5_tts_finetune
Закинул скрипт файнтюна