[发明专利] 语音对抗样本生成方法及装置、电子设备及存储介质 – CN114267363A 全文链接一   全文链接二

 
基本信息
申请号
CN202210201797.6
申请日
20220303
公开(公告)号
CN114267363A
公开(公告)日
20220401
申请(专利权)人
中国科学院自动化研究所
申请人地址
100190 北京市海淀区中关村东路95号
发明人
傅睿博;陶建华;易江燕 专利类型 发明专利
摘要
本公开涉及一种语音对抗样本生成方法及装置、电子设备及存储介质,所述方法包括:接收目标文本,并从所述目标文本中提取文本特征序列;将所述文本特征序列输入预先训练好的声学模型,得到多维声学参数序列;将所述多维声学参数序列输入预先训练好的声码器模型,生成语音的时域采样序列,作为目标文本对应的对抗样本,声学模型的输出为多维声学参数序列,使得生成的语音内容在多种声学特征维度描述下保证高相似度(匹配度),因而,在语音对抗样本的生成过程中利用多维声学参数重构方法,能够提升语音对抗样本的抗检测能力,更加有效对语音生成检测模型进行欺骗。
主权项
1.一种语音对抗样本生成方法,其特征在于,包括以下步骤:接收目标文本,并从所述目标文本中提取文本特征序列;将所述文本特征序列输入预先训练好的声学模型,得到多维声学参数序列;将所述多维声学参数序列输入预先训练好的声码器模型,生成语音的时域采样序列,作为目标文本对应的对抗样本。

 

 
IPC信息
IPC主分类号
G10L19/16
G 物理

G10 乐器;声学

G10L 语言分析或合成;语言识别

 

 
法律状态信息
法律状态公告日
20220401
法律状态
公开 法律状态信息
CN202210201797 20220401 公开 公开

 

 
代理信息
代理机构名称
北京华夏泰和知识产权代理有限公司 11662
代理人姓名
邓菊香