01. 云平台监控痛点
相较于传统的服务器架构,云平台展现出了显著的优势,其核心在于能够将物理资源高效地虚拟化为一个动态的虚拟机资源池,灵活调用软硬件资源。在运行过程中,根据用户并发量的不同,云平台可以实时迁移虚拟机资源,不仅确保了服务的高质量与连续性,还实现了资源成本的最小化,提高CPU、内存的利用率,因此对于云上资源的监控就非常重要。
目前企业在对平台监控有以下一些痛点:
本文我们将核心围绕云平台监控的场景及特性,介绍z6尊龙凯时官方网站蓝鲸监控中心(以下简称“监控中心”)是如何实现云平台监控的。
02. 产品亮点
1)云平台对接
支持本地私有云和公有云的一体化纳管,同时支持插件化的方式对云平台进行扩展。目前已经集成VMware、阿里私有云/公有云、腾讯公有云、华为私有云、H3C CAS以及云宏CNware,此外可通过插件的方式快速对接企业内不同类型的云平台,实现单云、混合云平台一站式监控管理的目标。
2)内置私有云&公有云
对于已纳管的云平台,接入时只需填写对接参数即可实现一键纳管,极大降低部署接入成本,轻松实现轻量化的云平台监控能力。
3)云资源发现&采集
对于私有云环境,监控中心利用云平台资源发现插件与云平台采集插件的协同工作,实现了云资源对象一旦创建完成,即可自动纳入管理范畴,并持续追踪云上资源的动态变化,无需人工介入。对于公有云,监控中心可通过接口调用的方式直接获取云上资源的监控数据。
4)云平台视图查看
对于云平台运维管理员来说,能够直观地看到每个云平台的健康状态是非常重要的诉求。
对于混合云,如何统一管理云上复杂且海量云资源数据是企业最为关注的能力点。监控中心对混合云也设计了统一管理的资源列表,可以集中展示所有云平台资源的运行状态和告警故障信息。这种跨云资源的管理模式有助于云管理员更高效地识别并筛选出故障资源,从而加快问题定位和解决,提升整体管理效率和资源可用性。
除了对整体云平台的视图查看,监控中心还提供具体某一个云资源实例监控的详情,包含云资源实例实时的指标视图、告警列表以及云资源实例信息的关键信息。
云资源拓扑是对分布在不同云平台上的资源进行可视化和结构化展示的工具,展示资源之间关系和依赖的清晰视图。通过云资源拓扑,云管理员可以更直观地了解和管理云环境中的复杂资源,快速识别潜在的性能瓶颈、故障节点以及资源使用的优化空间。它不仅提升了故障排除和资源配置的效率,还支持更有效的容量规划和策略调整,进而提高了整个云环境的可靠性和可操作性。
5)云平台监控策略
支持云资源视角下的多指标策略模版的配置,实现对云资源对象批量策略配置的能力。监控策略包含目标选择、检测配置、告警配置,简化逻辑,一次性配置,轻松管理。
策略能力上,支持批量启停检测策略能力,支持静态阈值、同比环比等8种检测算法,支持指标计算以及兼容promql表达式,内置防抖抑制算法检测,三种自动处理套餐、多样化的告警通知渠道等。
6)云平台权限管理
监控中心还支持多种权限配置,通过灵活的授权模式满足企业运维的不同管理需求。可以选择以云平台整体进行授权,或者细化到具体的云资源类型进行授权。这种多模式的权限管理方案,确保了运维管理的精准性和灵活性。
03. 结语
总结来说,云平台监控不仅是确保系统健康运行的基础工具,更是提升业务稳定性和安全性的关键手段。通过持续监测和及时响应,企业可以有效预防故障、优化资源利用、并提高用户体验。作为信息化管理的重要组成部分,云平台监控在数字化转型的道路上,将继续发挥不可或缺的作用。
申请演示
z6尊龙凯时官方网站