邦多利ai吧 关注:35贴子:155
  • 4回复贴,共1

【资源】BanGDream角色对话语言数据分享

只看楼主收藏回复

BanGDream角色对话语言数据分享
数据集为游戏解包所得的对话语音数据,数据来自bestdori。
爬取了截至2025年1月的数据,内含乐团故事、活动故事以及卡面故事的剧情。(不含梦限卡,因为部分标识重复导致爬歪了,所以就删去了这部分。)
文件名为角色编号,角色列表也放进去了,以方便查看各角色的编号。
SP/里的是一些特殊的数据集。
其中,Rinko0为数据包中未被替换的小明版燐燐语音(R1章)。
Soyo0为夹版Soyo,Soyo1为不夹版Soyo。(因为是早期做的,数据量不大。)
游戏的脚本(.asset)也一并放在里面了,这些文件可以直接当作json来读,里面的""部分即为对话脚本。有训练TTS模型需要的,可以用此打标。(或许对应立绘的动作也能作为情感标签的参考?)
链接:https://pan.baidu.com/s/1lW3G8igPxk5waM_3P1y3mw?pwd=3417
提取码:3417


IP属地:广东1楼2025-03-08 12:28回复
    对RVC模型来说,Soyo模型是否区分夹与不夹似乎影响不大,至少主要的影响来自推理时的输入音频。
    测试结果看来,在低音区,Soyo0和Soyo1似乎没啥区别;在高音区,Soyo0会比Soyo1偏软,但总体效果依然相近。
    或许,想要合成夹子音还需要输入音频也是夹子音才行。


    IP属地:广东2楼2025-03-08 12:34
    收起回复
      2025-07-31 13:44:23
      广告
      不感兴趣
      开通SVIP免广告
      怎么做到区分人的呢?我注意到在同一个小剧场中的.mp3文件并没有明显特征能够区分出说话人。


      IP属地:浙江3楼2025-03-10 23:51
      收起回复