随着生成式AI模型不断拓展AI使用的场景边界,模型在线服务的数量级快速增长,AI推理环节亟需精细化的资源管理。

近日,阿里机器学习渠道PAI宣布全面升级模型服务渠道PAI-EAS,面向文图生成、大言语模型等各类模型供给弹性安稳的推理服务,并推出全新标准GU30,与传统标准比较价格均匀优惠45%。

全新推理标准GU30面世,释放技能红利

在AI工程化链路中,推理服务是打通“模型到使用最终一公里”的重要环节,并继续随同事务生长。

PAI-EAS是PAI推出的弹性推理服务渠道,供给异构硬件(CPU/GPU)模型加载和服务布置,支撑达摩院、淘宝、高德等事务大量级模型服务,并广泛服务阿里云上企业客户。结合推理优化技能和云原生生态,PAI-EAS进一步提高异构资源集群全体利用率,规模化地完成服务效率与功用提高,扩大让利空间。

新推出的PAI-EASGU30系列标准,专用于深度学习异构推理场景,较PAI-EAS平等功用的传统标准价格下降45%。

GU30可适配不同杂乱程度的模型,支撑文图生成、大言语模型、多模态模型、NLP、CV、ASR等的推理需求。付费模式上,EAS同时支撑预付费和灵活的按量付费,用户可以通过弹性扩缩容、弹性资源池等能力精细化地按需管控推理资源。

AI推理服务平台升级,阿里云机器学习PAI推出新规格

Serverless化覆盖多样推理场景

作为云上AI推理服务渠道,PAI-EAS在基础设施层、容器调度层、模型布置层都供给丰厚的产品功用,贴合不同场景的个性化需求。

  • 实时同步推理场景,例如个性化引荐或类ChatGPT对话使用等,用户可通过一键压测得到服务的QPS和时延阈值,并结合灰度发布和蓝绿布置功用,在不影响线上事务的情况下进行功用验证并顺滑切换。

  • 近实时异步推理场景,例如文图生成或视频处理等,涉及较为杂乱模型的推理,单次推理时间从十几秒到几十分钟不等,PAI-EAS在推理服务内部集成服务维度的消息行列,并支撑面向行列长度完成推理的自动弹性扩缩容,满足资源利用率提高及免运维需求。

  • 离线批量推理场景,例如语音数据批量文本转化等时延不敏感的场景,PAI-EAS可通过抢占型资源实例的方法帮助用户控制批量推理本钱。

AI推理服务平台升级,阿里云机器学习PAI推出新规格

PAI-EAS最新活动

从2023年4月中旬起,阿里云产品试用中心将正式开放PAI-EAS平等算力的试用标准,供给最长3个月的模型在线服务免费体会包。点击PAI-EAS产品页官网(链接:www.aliyun.com/activity/bi…