授权公布号:CN117217201B
基于预训练语言模型的任务处理方法、装置、设备及介质
有效
申请
2023-10-12
申请公布
2023-12-12
授权
2024-02-02
预估到期
2043-10-12
| 申请号 | CN202311321072.1 |
| 申请日 | 2023-10-12 |
| 申请公布号 | CN117217201A |
| 申请公布日 | 2023-12-12 |
| 授权公布号 | CN117217201B |
| 授权公告日 | 2024-02-02 |
| 分类号 | G06F40/20;G06F40/30;G06F40/58;G06F16/35;G06N3/092;G06N3/0442;G06F18/214 |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 北京声智科技有限公司 |
| 申请人地址 | 北京市海淀区北清路81号院一区1号楼6层601 |
专利法律状态
2024-02-02
授权
状态信息
授权
2023-12-12
公布
状态信息
公布
摘要
本申请公开了一种基于预训练语言模型的任务处理方法、装置、设备及介质,属于自然语言处理领域。本申请基于模块化的大模型来来执行NLP任务。详细来说,大模型采用模块化设计,包括多个功能模块,每个功能模块负责处理特定任务或具有特定功能,且不同功能模块之间共享知识。这种模块化设计不但使得模型具有更好的灵活性和扩展性,而且还有助于降低计算资源需求和能源消耗。另外,本申请还引入了模块激活门控机制,利用该机制能够控制每个功能模块的激活状态,即针对当前NLP任务,仅激活与当前NLP任务相关的功能模块,而关闭与当前任务无关的功能模块,进一步降低了计算资源需求和能源消耗,进而提高了模型在执行NLP任务时的执行效率。


