[发明专利] 语音对抗样本生成方法及装置、电子设备及存储介质 – CN114267363A 全文链接一 全文链接二
基本信息 | |||
---|---|---|---|
申请号
|
CN202210201797.6 |
申请日
|
20220303 |
公开(公告)号
|
CN114267363A |
公开(公告)日
|
20220401 |
申请(专利权)人
|
中国科学院自动化研究所 | ||
申请人地址
|
100190 北京市海淀区中关村东路95号
|
||
发明人
|
傅睿博;陶建华;易江燕 | 专利类型 | 发明专利 |
摘要
|
本公开涉及一种语音对抗样本生成方法及装置、电子设备及存储介质,所述方法包括:接收目标文本,并从所述目标文本中提取文本特征序列;将所述文本特征序列输入预先训练好的声学模型,得到多维声学参数序列;将所述多维声学参数序列输入预先训练好的声码器模型,生成语音的时域采样序列,作为目标文本对应的对抗样本,声学模型的输出为多维声学参数序列,使得生成的语音内容在多种声学特征维度描述下保证高相似度(匹配度),因而,在语音对抗样本的生成过程中利用多维声学参数重构方法,能够提升语音对抗样本的抗检测能力,更加有效对语音生成检测模型进行欺骗。 | ||
主权项
|
1.一种语音对抗样本生成方法,其特征在于,包括以下步骤:接收目标文本,并从所述目标文本中提取文本特征序列;将所述文本特征序列输入预先训练好的声学模型,得到多维声学参数序列;将所述多维声学参数序列输入预先训练好的声码器模型,生成语音的时域采样序列,作为目标文本对应的对抗样本。 |
IPC信息
|
|||
---|---|---|---|
IPC主分类号
|
G10L19/16 | ||
G 物理
G10 乐器;声学 G10L 语言分析或合成;语言识别 |
法律状态信息
|
|||||
---|---|---|---|---|---|
法律状态公告日
|
20220401 |
法律状态
|
公开 | 法律状态信息 |
CN202210201797 20220401 公开 公开
|
代理信息
|
|||
---|---|---|---|
代理机构名称
|
北京华夏泰和知识产权代理有限公司 11662 |
代理人姓名
|
邓菊香 |