[发明专利] 基于聚类匿名化与差分隐私保护的异构用电数据发布方法 – CN114092729A 全文链接一   全文链接二

 
基本信息
申请号
CN202111191708.6
申请日
20211013
公开(公告)号
CN114092729A
公开(公告)日
20220225
申请(专利权)人
南方电网数字电网研究院有限公司;中国南方电网有限责任公司;中国科学院信息工程研究所
申请人地址
510700 广东省广州市黄埔区中新广州知识城亿创街1号406房之86
发明人
奚建飞;徐欢;雷美炼;张锐;沈博;孙一帆 专利类型 发明专利
摘要
本发明公开了一种基于聚类匿名化与差分隐私保护的异构用电数据发布方法,涉及信息技术安全领域,以实现对异构用电数据进行隐私保护的目的,将聚类分析问题转化为分类问题,利用类标签对原始数据的聚类结构同时进行泛化匿名机制和加噪处理后,发布满足∈‑差分隐私保护的电力交易数据集,实现了灵活的隐私保护聚类分析,提升发布数据用于聚类分析时的准确性,同时保证了多种类型数据的隐私性和可用性,为用电数据分析提供可靠的数据。
主权项
1.一种基于聚类匿名化与差分隐私保护的异构用电数据发布方法,其特征在于,包括以下步骤:根据数据使用者的聚类分析请求,对原始数据集D中的原始用电数据进行聚类处理,得到具有类标签的标签数据集D*,标签数据集D*包括多个原始数据记录;对标签数据集D*中的数值型属性、分类型属性、集值型属性分别进行泛化处理;对泛化处理后的数据进行以下匿名处理:按照预定义的分类树对分类型属性数据进行分组,利用拉普拉斯机制对集值型属性数据添加噪声,利用指数机制对数值型属性数据添加噪声,确保数据满足差分隐私,得到匿名数据集D′;通过在匿名数据集D′上删除任意一条数据记录并添加噪声后获得满足差分隐私的查询集,计算上述查询集与原始数据集的真实查询集的相似度,当该相似度大于0时,发布满足差分隐私保护的数据集给所述数据使用者。

 

 
IPC信息
IPC主分类号
G06V10/762
G 物理

G06 计算;推算;计数

 

 
法律状态信息
法律状态公告日
20220225
法律状态
公开 法律状态信息
CN202111191708 20220225 公开 公开

 

 
代理信息
代理机构名称
北京君尚知识产权代理有限公司 11200
代理人姓名
李文涛