前一篇文章根据多云构建监控告警体系讲了咱们是怎么构建多云监控告警的,监控告警体系的根底数据来源于云上,也就是说咱们监控体系里一切用到的根底数据云上都有,既然如此,为什么不直接去云控制台上检查,而是要构建自己的监控告警体系呢?这篇文章咱们就来聊下这个话题

之所以会根据多云构建咱们自己的监控告警体系,有两个大的条件,其一是咱们接入的云厂商比较多,一起单个云厂商下还会有多个不同的账号存在,云上资源就散布在众多不同的云账号下,其二就是由于业务关系咱们绝大部分监控都直接运用了云厂商供给的云监控。根据个人的运用体验以及对搭档们运用多云的观察和反应来看,个人觉得咱们自研的多云监控体系至少具有如下几点优势:一致渠道、简化操作、优化展现、权限阻隔、多云交融

一致渠道

全球化的业务布景下,咱们运用了多个云厂商的资源,同一云厂商还有多个不同地区/功用/项目区别的账号,监控检查往往需求在不同云渠道不同云账号之间来回切换,繁琐且费事。我看到小伙伴们想要一起检查同一云渠道多个不同云账号上的资源监控状况,会一起翻开多个不同的浏览器,为此还专门安装了几个不同的浏览器,而咱们一致了监控渠道之后,就不需求再登录云控制台去检查监控了,也就不存在多个账号切换的状况,更不需求再开多个浏览器了,一个体系检查一切资源监控状况,这带来了极大的便利

多云监控告警系统的优势

同样的,关于告警信息咱们也做到了一致,将多云告警会集在一致的体系里做展现,告警大盘能够明晰的看到当时体系的全体运行状况,增强运维对项目的全体把控才能。关于告警,不只能够检查告警信息,还能检查和修正告警策略,项目保护流程也更加简略高效

简化操作

云上监控坐落不同云渠道下,咱们知道每个云渠道关于监控的定义和操作都不同,乃至是同一云渠道下不同云服务之间监控的检查途径和展现方法都不同,且云资源监控检查途径冗长,非常不便。咱们的监控体系隐藏了云厂商与云资源的监控差异,一起简化资源监控检查操作,供给一致的监控进口和途径,运用起来更便利。以一个云主机的监控查询为例,能够简略对比下之前经过云控制台检查与现在经过咱们自己的监控体系检查之间的差异

多云监控告警系统的优势

咱们的监控体系操作过程数,以及每一步所运用的时间都要优于云上监控,提高运用便捷性

优化展现

云上资源监控图表款式杂乱,不同云厂商不同云资源的监控图表展现款式都不一致,这些不一致不只存在不同云厂商之间,乃至是一致云厂商的不同云资源之间图表展现款式都不一样,咱们不只对监控的检查途径做了优化,也对监控图表的款式做到了一致

多云监控告警系统的优势

不只一致了图表展现款式,图表的检索方法也做到了一致,展现次序也做了优化,咱们普遍重视的要点目标靠前放,一屏之内重要目标的变化状况尽收眼底,一起页面与图表的加载速度也做了优化,云上监控页面杂乱,动辄上百个恳求,而咱们除了并发加载外,仅加载必要的资源,做到了最小化恳求,图表展现速度乃至比直接控制台检查还要快

权限阻隔

云渠道上的权限装备非常杂乱,关于细粒度的资源权限阻隔几乎无从下手,而咱们的业务又比较杂乱,所运维的项目不只或许来自于不同的部门,乃至还有或许来自于不同的公司,所以云控制台的权限是不授权给研制,这就造成了一旦研制需求查询云上资源的监控,就需求运维在中间支撑。咱们的监控体系天生的支撑以项目为维度进行资源阻隔,授权粒度也比较灵敏,能够直接授权给研制自己检查,这样大大提高了交流效率,加速了问题的处理

多云监控告警系统的优势

以一次杂乱问题的排查为例,经过咱们的监控体系大大降低了交流成本,加快了问题的修复速度

多云交融

以上说的几点优势,很大程度上都依赖咱们监控体系与多云体系的深度交融,这也是咱们自研监控体系的最大优势,多云+监控几乎是天生一对,多云为监控供给根底数据,监控为多云供给最重要的使用场景。凭借于多云能够便利的以项目为维度查找资源的监控数据,而无需再考虑资源坐落哪个云厂商的哪个云账号下,这样杂乱的多云也变得通明。一起在告警中,凭借与多云体系也能够直接定位告警资源所属的项目,加快告警的响应速度

多云监控告警系统的优势

更为重要的是凭借于多云体系的服务树,能够便利快速的自动生成以项目服务/人物为维度的监控大盘,而无需再在云上进行繁琐的监控Dashboard装备。监控大盘下的资源也会跟着云资源的生命周期变动而自动改变,运用非常便利,以往或许需求至少量小时的监控Dashboard装备,经过监控体系也就分分钟生成

多云监控告警系统的优势

根据多云和监控的交融,很便利的生成监控报表,为项目日常运营也供给了重要的支撑,或许正是得益于便利的监控大盘构建,检查项目监控大盘已然成为许多小伙伴的习惯,真的做成了有用又好用的体系