品牌网
公司信息商标信息专利信息
授权公布号:CN117217201B
基于预训练语言模型的任务处理方法、装置、设备及介质
有效
申请
2023-10-12
申请公布
2023-12-12
授权
2024-02-02
预估到期
2043-10-12
申请号 CN202311321072.1
申请日 2023-10-12
申请公布号 CN117217201A
申请公布日 2023-12-12
授权公布号 CN117217201B
授权公告日 2024-02-02
分类号 G06F40/20;G06F40/30;G06F40/58;G06F16/35;G06N3/092;G06N3/0442;G06F18/214
分类 计算;推算;计数;
申请人名称 北京声智科技有限公司
申请人地址 北京市海淀区北清路81号院一区1号楼6层601

专利法律状态

2024-02-02 授权
状态信息
授权
2023-12-12 公布
状态信息
公布

摘要

本申请公开了一种基于预训练语言模型的任务处理方法、装置、设备及介质,属于自然语言处理领域。本申请基于模块化的大模型来来执行NLP任务。详细来说,大模型采用模块化设计,包括多个功能模块,每个功能模块负责处理特定任务或具有特定功能,且不同功能模块之间共享知识。这种模块化设计不但使得模型具有更好的灵活性和扩展性,而且还有助于降低计算资源需求和能源消耗。另外,本申请还引入了模块激活门控机制,利用该机制能够控制每个功能模块的激活状态,即针对当前NLP任务,仅激活与当前NLP任务相关的功能模块,而关闭与当前任务无关的功能模块,进一步降低了计算资源需求和能源消耗,进而提高了模型在执行NLP任务时的执行效率。