BanGDream角色对话语言数据分享
数据集为游戏解包所得的对话语音数据,数据来自bestdori。
爬取了截至2025年1月的数据,内含乐团故事、活动故事以及卡面故事的剧情。(不含梦限卡,因为部分标识重复导致爬歪了,所以就删去了这部分。)
文件名为角色编号,角色列表也放进去了,以方便查看各角色的编号。
SP/里的是一些特殊的数据集。
其中,Rinko0为数据包中未被替换的小明版燐燐语音(R1章)。
Soyo0为夹版Soyo,Soyo1为不夹版Soyo。(因为是早期做的,数据量不大。)
游戏的脚本(.asset)也一并放在里面了,这些文件可以直接当作json来读,里面的""部分即为对话脚本。有训练TTS模型需要的,可以用此打标。(或许对应立绘的动作也能作为情感标签的参考?)
链接:https://pan.baidu.com/s/1lW3G8igPxk5waM_3P1y3mw?pwd=3417
提取码:3417
数据集为游戏解包所得的对话语音数据,数据来自bestdori。
爬取了截至2025年1月的数据,内含乐团故事、活动故事以及卡面故事的剧情。(不含梦限卡,因为部分标识重复导致爬歪了,所以就删去了这部分。)
文件名为角色编号,角色列表也放进去了,以方便查看各角色的编号。
SP/里的是一些特殊的数据集。
其中,Rinko0为数据包中未被替换的小明版燐燐语音(R1章)。
Soyo0为夹版Soyo,Soyo1为不夹版Soyo。(因为是早期做的,数据量不大。)
游戏的脚本(.asset)也一并放在里面了,这些文件可以直接当作json来读,里面的""部分即为对话脚本。有训练TTS模型需要的,可以用此打标。(或许对应立绘的动作也能作为情感标签的参考?)
链接:https://pan.baidu.com/s/1lW3G8igPxk5waM_3P1y3mw?pwd=3417
提取码:3417