授权公布号:CN111814448B
预训练语言模型量化方法和装置
有效
申请
2020-07-03
申请公布
2020-10-23
授权
2024-01-16
预估到期
2040-07-03
| 申请号 | CN202010636126.3 |
| 申请日 | 2020-07-03 |
| 申请公布号 | CN111814448A |
| 申请公布日 | 2020-10-23 |
| 授权公布号 | CN111814448B |
| 授权公告日 | 2024-01-16 |
| 分类号 | G06N3/0495;G06N3/0455;G06N3/084;G06F16/35;G06F18/23213N |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 思必驰科技股份有限公司 |
| 申请人地址 | 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋 |
专利法律状态
2024-01-16
授权
状态信息
授权
2021-05-28
著录事项变更
状态信息
著录事项变更;IPC(主分类):G06F40/205;变更事项:申请人;变更前:苏州思必驰信息科技有限公司;变更后:思必驰科技股份有限公司;变更事项:地址;变更前:215123 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋;变更后:215123 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
2020-11-10
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G06F40/205;申请日:20200703
2020-10-23
公布
状态信息
公布
摘要
本发明公开预训练语言模型量化方法和装置,其中,一种预训练语言模型量化方法,包括:将预训练语言模型在下游任务上进行第一次微调;使用k均值聚类,对微调后的模型除了分类层之外的其他所有嵌入层和所有线性层的权重矩阵中的数据进行聚类,将类别数设置为2n,其中,n为压缩后目标模型每个数据所占的比特数;将量化后的模型在所述下游任务上在维持量化的条件下进行第二次微调,最终得到量化后的网络。本申请实施例提供的方案表明了底层的量化方案的提升对量化效果的影响被大大的低估和忽视了;同时也表明了简单的不使用任何技巧的k均值量化就可以达到非常好的压缩效果,说明k均值压缩方法有非常大的发展空间和应用前景。


