File size: 1,535 Bytes
ca0666e
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
---
tags:
- DiffSVC
- pre-trained_model
- basemodel
- diff-svc
license: "gpl"
datasets:
- 512rc_50k
- 512rc_80k
- 512rc_100k
---
[English](./README.md) | **简体中文**
# DiffSVCBaseModel

任何类型的音色都能用的大型底模!

## 这玩意咋用?

1. 按照你的数据挑选一个zip包,保存到你的电脑上

2. 填好你的配置,把数据集丢到```(diffsvc 根目录)/data/raw/{角色名称}/```

3. 把底模(仅丢 .ckpt 文件)丢到 ```(diffsvc 根目录)/checkpoints/{角色名称}```

4. 向原仓库一样预处理和训练数据集,如果不是从step1开始,那就成功了

## 我用了多少数据集?

两份开源数据集(opencpop ,m4singer),40多个小时的音频

## 下载专区


| 版本           | 下载传送门                           |
| -------------- | ---------------------------------- |
| 384rc,50k_step | [传送](./384rc_50k_step.zip) |
| 384rc,80k_step | [传送](./384rc_80k_step.zip) |
| 384rc,100k_step | [传送](./384rc_100k_step.zip) |

更多版本还在路上

> rc: 就是配置里的 residual_channels

## 涉及仓库

| 仓库            | 传送门                                                  |
| --------------- | ---------------------------------------------------- |
| Diff-SVC        | [传送](https://github.com/prophesier/diff-svc) |
| 44.1KHz声码器    | [传送](https://openvpi.github.io/vocoders)     |
| M4Singer        | [传送](https://github.com/M4Singer/M4Singer)   |
| OpenCPOP        | [传送](https://github.com/wenet-e2e/opencpop)  |