授权公布号:CN115981871B
一种GPU资源调度方法、装置、设备及存储介质
有效
申请
2023-03-17
申请公布
2023-04-18
授权
2024-01-26
预估到期
2043-03-17
| 申请号 | CN202310261205.4 |
| 申请日 | 2023-03-17 |
| 申请公布号 | CN115981871A |
| 申请公布日 | 2023-04-18 |
| 授权公布号 | CN115981871B |
| 授权公告日 | 2024-01-26 |
| 分类号 | G06F9/50;G06F9/48 |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 苏州万店掌网络科技有限公司 |
| 申请人地址 | 江苏省苏州市高新区竹园路209号 |
专利法律状态
2024-01-26
授权
状态信息
授权
2023-05-05
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G06F9/50;申请日:20230317
2023-04-18
公布
状态信息
公布
摘要
本申请公开了一种GPU资源调度方法方法、装置、设备及存储介质,涉及计算机资源动态调度领域,包括:获取业务侧发送的初始图片检测任务并根据所述初始图片检测任务确定待执行任务和待使用模型;从所述待执行任务和所述待使用模型中确定出当前待执行任务和当前目标模型,并基于所述当前目标模型获取各GPU服务器的当前状态信息;根据所述当前状态信息并利用预设服务器筛选逻辑从所述各GPU服务器中筛选出目标服务器,以便所述目标服务器利用所述当前目标模型执行所述当前待执行任务。这样一来,可以避免GPU服务器与模型绑定,从而可以动态调度GPU服务器资源,提高了GPU服务器资源的利用率,实现了对GPU服务器资源的高效利用。


