近日,阿里云容器服务团队与达摩院数据决策团队合作的论文《RobustScaler: QoS-Aware Autoscaling for Complex Workloads》被数据办理与数据库世界顶级会议 ICDE 2022 长文选用。ICDE 和 SIGMOD、VLDB 并称为数据库范畴的三大世界顶尖学术会议,入选中国计算机学会(CCF)引荐 A 类世界会议列表。

阿里云与达摩院合作 AHPA 弹性预测论文被顶会 ICDE 录用

阿里云容器服务 ACK 办理着海量的 Kubernetes 集群,在集群办理、集群运维等范畴积累了丰厚的经历,并构建了智能运维渠道 CIS(Container Intelligence Service),旨在经过智能化手法解决运维难题。达摩院数据决策团队在时刻序列分析/猜测/反常监测/AIOps 方向深耕多年,数十篇文章发表在 KDD, SIGMOD, ICDE, AAAI 等顶会和多篇中美专利,获得 2022 ICASSP AIOps Challenge 冠军等多个世界奖项。

如今,企业事务流量往往呈现出明显的波峰、波谷形状,假如选用固定实例数会存在极大的资源糟蹋。为使用装备弹性弹性是提升资源利用率的有效方法。

Kubernetes 中现有的弹性弹性战略如 HPA、CronHPA 等都存在弹性触发滞后的问题,导致使用的服务质量下降。如安在保证使用服务质量的前提下,依据使用的历史数据,基于时序算法提前进行扩缩容呢?

为解决该问题,我们在论文中提出了一种基于非齐次柏松过程(NHPP)和随机束缚优化的智能弹性框架 RobustScaler。此外,研发了一种专门的交替方向乘子法 (ADMM) 来有效地练习 NHPP 模型,并证明了基于优化的自动战略能够保证使用的服务质量。 大量试验标明,RobustScaler 在各种实际场景中优于常见的自动弹性战略,并且在具有复杂周期性的使用中也表现优异。

RobustScaler 算法现已使用于智能运维渠道 CIS 的 AHPA 组件中。智能运维渠道 CIS 由反常发现、反常定位、反常修正、反常猜测四大模块组成,包含定时巡检、网络确诊、运行时确诊、CVE 缝隙修正、使用装备优化等众多功用。AHPA 是 CIS 的中心组件之一,组件架构如下图所示,AHPA 弹性战略可分为自动猜测和被迫猜测。自动猜测从历史数据中辨认周期性趋势,自动猜测下个周期使用的实例数量;被迫猜测基于使用实时数据设定实例数量,能够很好的应对突发流量。此外,AHPA 还增加了兜底维护战略,用户能够设置实例数量的上下界。AHPA 算法中最终收效的实例数是自动猜测、被迫猜测及兜底战略中的最大值。

AHPA 组件正在公测中,点击申请白名单[1],欢迎我们试用并提宝贵意见。

阿里云与达摩院合作 AHPA 弹性预测论文被顶会 ICDE 录用

点击此处查看阿里云容器服务 AHPA 弹性猜测产品文档详情。当时 AHPA 已开启用户邀测,欢迎感兴趣的用户点击文档中“提交工单”位置申请白名单,等待您的试用及反应。

相关链接

[1]申请白名单help.aliyun.com/document_de… 发布云原生技术最新资讯、聚集云原生技术最全内容,定期举办云原生活动、直播,阿里产品及用户最佳实践发布。与你并肩探索云原生技术点滴,分享你需求的云原生内容。

重视【阿里巴巴云原生】公众号,获取更多云原生实时资讯!