AI推理服务平台升级，阿里云机器学习PAI推出新规格

随着生成式AI模型不断拓展AI使用的场景边界，模型在线服务的数量级快速增长，AI推理环节亟需精细化的资源管理。

近日，阿里云机器学习渠道PAI宣布全面升级模型服务渠道PAI-EAS，面向文图生成、大言语模型等各类模型供给弹性安稳的推理服务，并推出全新标准GU30，与传统标准比较价格均匀优惠45%。

全新推理标准GU30面世，释放技能红利

在AI工程化链路中，推理服务是打通“模型到使用最终一公里”的重要环节，并继续随同事务生长。

PAI-EAS是PAI推出的弹性推理服务渠道，供给异构硬件(CPU/GPU)模型加载和服务布置，支撑达摩院、淘宝、高德等事务大量级模型服务，并广泛服务阿里云上企业客户。结合推理优化技能和云原生生态，PAI-EAS进一步提高异构资源集群全体利用率，规模化地完成服务效率与功用提高，扩大让利空间。

新推出的PAI-EASGU30系列标准，专用于深度学习异构推理场景，较PAI-EAS平等功用的传统标准价格下降45%。

GU30可适配不同杂乱程度的模型，支撑文图生成、大言语模型、多模态模型、NLP、CV、ASR等的推理需求。付费模式上，EAS同时支撑预付费和灵活的按量付费，用户可以通过弹性扩缩容、弹性资源池等能力精细化地按需管控推理资源。

作为云上AI推理服务渠道，PAI-EAS在基础设施层、容器调度层、模型布置层都供给丰厚的产品功用，贴合不同场景的个性化需求。

实时同步推理场景，例如个性化引荐或类ChatGPT对话使用等，用户可通过一键压测得到服务的QPS和时延阈值，并结合灰度发布和蓝绿布置功用，在不影响线上事务的情况下进行功用验证并顺滑切换。
近实时异步推理场景，例如文图生成或视频处理等，涉及较为杂乱模型的推理，单次推理时间从十几秒到几十分钟不等，PAI-EAS在推理服务内部集成服务维度的消息行列，并支撑面向行列长度完成推理的自动弹性扩缩容，满足资源利用率提高及免运维需求。
离线批量推理场景，例如语音数据批量文本转化等时延不敏感的场景，PAI-EAS可通过抢占型资源实例的方法帮助用户控制批量推理本钱。

从2023年4月中旬起，阿里云产品试用中心将正式开放PAI-EAS平等算力的试用标准，供给最长3个月的模型在线服务免费体会包。点击PAI-EAS产品页官网（链接：www.aliyun.com/activity/bi…

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。