[发明专利] 一种基于异质子图神经网络的相似信息检索方法和系统 – CN114168804A 全文链接一 全文链接二
基本信息 | |||
---|---|---|---|
申请号
|
CN202111550920.7 |
申请日
|
20211217 |
公开(公告)号
|
CN114168804A |
公开(公告)日
|
20220311 |
申请(专利权)人
|
中国科学院自动化研究所 | ||
申请人地址
|
100190 北京市海淀区中关村东路95号
|
||
发明人
|
陶建华;槐泽鹏;杨国花;张大伟;李冠君 | 专利类型 | 发明专利 |
摘要
|
本发明提出一种基于异质子图神经网络的相似信息检索方法和系统。其中,方法包括:首先,将业务场景数据面向异质图进行图结构化数据,即构建异质图;其次,设计了一种子图范式,据此设计异质子图神经网络,建模和学习中心节点的邻域信息,并在不需要交互记录等标签的低资源情况下进行模型训练,从而得到节点的嵌入表示;最后,设计了基于局部敏感哈希的快速相似度计算模块来实现对相似内容检索这一功能的在线服务。本发明能够解决了低资源场景下相似信息检索这一业务需求。 | ||
主权项
|
1.一种基于异质子图神经网络的相似信息检索方法,其特征在于,所述方法包括:步骤S1、抽取出与业务直接相关的实体,将实体作为节点,同时根据实体间的语义关系构建节点间的边,完成图结构化数据;步骤S2、将业务关心的节点设置为中心节点,设计用来建模所述中心节点的邻域信息的子图范式;在具备子图范式后,应用异质子图神经网络模型来学习节点的嵌入表示:具体设计两步的聚合过程,首先将异质节点的信息聚合至中心节点上,得到所有特征信息的最终向量;再基于所述所有特征信息的最终向量,将同质节点的信息聚合至中心节点上,得到最终的嵌入表示;针对粗粒度的标签,应用交叉熵损失来训练所述异质子图神经网络模型;步骤S3、在利用预先训练的所述异质子图神经网络模型,得到所有节点的嵌入表示后,使用局部敏感哈希算法来进行嵌入表示的快速近邻检索,得到最相似节点。 |
IPC信息
|
|||
---|---|---|---|
IPC主分类号
|
G06F16/901 | ||
G 物理
G06 计算;推算;计数 G06F 电数字数据处理 |
法律状态信息
|
|||||
---|---|---|---|---|---|
法律状态公告日
|
20220311 |
法律状态
|
公开 | 法律状态信息 |
CN202111550920 20220311 公开 公开
|
代理信息
|
|||
---|---|---|---|
代理机构名称
|
北京华夏泰和知识产权代理有限公司 11662 |
代理人姓名
|
李永叶 |