浩鲸云计算科技股份有限公司 访客留言 申请认证

信用网址: 18974069.11315.com   

股份有限公司(非上市) 成立历史第22 

基于LRU策略最大化提升显存利用率的模型加载方法【异议或纠错】

档案编号: CQ-126-6585-7634
档案文号:
专利权人: 申请人 
发布时间: 发布时间 
档案分类: 专利权 
分 类 号: 第G06T1/20;G06K9/00;G06F9/50类
授权状态: 已授权
档案内容: 本发明公开了基于LRU策略最大化提升显存利用率的模型加载方法,该方法包括以下步骤:构建与部署人脸识别、人像对比、人体分析三个模型并配置实例;启动定时任务,每相隔10分钟获取该段时间内GPU的实时利用率,并计算该时间段内的平均GPU利用率;通过最优资源调度策略调度计算滑动平均显存使用率;根据该段时间内的数据信息,通过最优资源调度策略预测得到下一段时间所需的实例数量;根据模型在下一段时间所需的实例数量与模型已使用的实例数量对实例数量进行调整。有益效果:通过LRU调度策略,使模型动态启停,解决了多模型共享显存低利用率的痛点,提升显存的利用率,进而节约资源。
附件下载:  (原始资料备查)

相关专利信息信息

评论

您需要登录后才可以发表评论,请 登录注册

打分

说明:
一、所有信息力求客观、真实:以上信息由全国各级政府职能部门、各行业协会(社团组织)、金融机构、主流媒体、信息主体或实名制下的广大消费者(包括交易对方、员工等)客观提供,不含有本征信平台的任何主观评价;
二、信息异议机制:欢迎大家对有异议的信息及时提出,我们将按照《绿盾全国企业征信管理办法》规定对异议进行核实、修正,确保客观、公平;
三、尊重发布者权益,永不"删贴":对于符合国家法律、法规和本征信平台规定的每一条信息,都将客观记录于企业信用档案,参与信用分值计算,并长期保存。

分享到:
绿盾在线
×
=合作留言=
绿盾业务合作
×
  • 马先生
    15652211315
  • 黄先生
    15652011315