[发明专利] 卷积神经网络量化方法、装置、电子设备和存储介质 – CN114139678A 全文链接一 全文链接二
基本信息 | |||
---|---|---|---|
申请号
|
CN202111265219.0 |
申请日
|
20211028 |
公开(公告)号
|
CN114139678A |
公开(公告)日
|
20220304 |
申请(专利权)人
|
中国科学院自动化研究所 | ||
申请人地址
|
100190 北京市海淀区中关村东路95号
|
||
发明人
|
张峰;孟艺薇;张翠婷 | 专利类型 | 发明专利 |
摘要
|
本发明提供一种卷积神经网络量化方法、装置、电子设备和存储介质,其中方法包括:按照预设的重要权重优先原则,分别获取预训练卷积神经网络中每一层的第一量化权重范围;其中,所述重要权重优先原则包括基于每一层原始权重的幂指数出现频次确定的原则;对所述第一量化权重范围分别进行权重数量扩充处理,得到所述每一层的第二量化权重范围;基于所述第二量化权重范围,确定所述预训练卷积神经网络的目标量化权重范围。本发明能够实现在相同量化位宽的情况下增加量化范围及减小精度损失的目的,不仅能够减少网络模型的存储空间、减小计算量、减少能源消耗,也能够大大提高量化精度。 | ||
主权项
|
1.一种卷积神经网络量化方法,其特征在于,包括:按照预设的重要权重优先原则,分别获取预训练卷积神经网络中每一层的第一量化权重范围;其中,所述重要权重优先原则包括基于每一层原始权重的幂指数出现频次确定的原则;对所述第一量化权重范围分别进行权重数量扩充处理,得到所述每一层的第二量化权重范围;基于所述第二量化权重范围,确定所述预训练卷积神经网络的目标量化权重范围。 |
IPC信息
|
|||
---|---|---|---|
IPC主分类号
|
G06N3/04 | ||
G 物理
G06 计算;推算;计数 G06N 基于特定计算模型的计算机系统 G06N3/04 体系结构,例如,互连拓扑〔7〕 |
法律状态信息
|
|||||
---|---|---|---|---|---|
法律状态公告日
|
20220304 |
法律状态
|
公开 | 法律状态信息 |
CN202111265219 20220304 公开 公开
|
代理信息
|
|||
---|---|---|---|
代理机构名称
|
北京路浩知识产权代理有限公司 11002 |
代理人姓名
|
李文清 |