svr-tts-large / README.md
selectorrrr's picture
Update README.md
aa2a9ea verified
|
raw
history blame
1.21 kB
metadata
license: apache-2.0
language:
  - ru
pipeline_tag: text-to-speech

Высокоэмоциональный синтез русской речи.

Библиотека клиент: https://github.com/Selectorrr/svr_tts

Пример использования библиотеки для озвучивания по csv файлу: https://github.com/Selectorrr/svr_voiceover

Ключ к api выдает: https://t.me/SynthVoiceRuBot

Пример инференса в роликах на канале: https://www.youtube.com/@SynthVoiceRu/videos

Минималистичный пример испоьзования:

pip install git+https://github.com/Selectorrr/svr_tts.git
import resampy
import soundfile

from svr_tts import SVR_TTS
from svr_tts.core import SynthesisInput

if __name__ == '__main__':
    tts = SVR_TTS(api_key="some_key") //
    wave, sr = soundfile.read('tmp/example.ogg')
    wave_24k = resampy.resample(wave, sr, 24_000)
    waves_22050 = tts.synthesize_batch([
        SynthesisInput(text="Сбейте лестницу!", stress=True, timbre_wave_24k=wave_24k, prosody_wave_24k=wave_24k), 
    ])
    soundfile.write('tmp/example.wav', waves_22050[0], 22_050)