我打开新看板,发现它不再让我看数据了
最近一直忙于新工作没怎么登录云哨兵。今天上去看了一眼发现它新上了一个界面叫“驾驶舱”。点进去的第一反应是这跟之前那个技术大屏完全不是同一个东西。一、原来那个大屏很好偏技术型云哨兵一直有个监控大屏图表齐全、数据详细、实时刷新。成功率趋势、检测次数、响应时间、告警列表该有的都有。但说实话那个大屏是给技术人员看的。业务、老板打开之后看不了几秒就会问“所以现在到底稳不稳”他不需要知道平均响应时间是多少毫秒他只需要一个结论。这次新上的驾驶舱解决的恰好就是这个问题。二、圆环、圆点、一眼看结论驾驶舱的设计思路很清晰用颜色说话不用数字说话。页面正中央是一个大的健康度圆环。一切正常的时候它是绿色的缓慢呼吸闪烁环里两个大字“正常”。有服务异常的时候它变成红色快速脉冲中间显示“异常”和异常服务数量。你站在屏幕前不需要读任何文字光看颜色和运动就知道系统状态。圆环周围是四个核心指标整体可用率、故障次数、SSL证书状态、活跃任务数。每个指标只有三样东西大号数字、标签、趋势箭头。不堆砌数据只看结论。再往下是服务状态矩阵。每个监控任务是一个小圆点正常的是绿色异常的是红色脉冲。几十个任务排成几行一眼扫过去就知道整体情况——绿色海洋中突然冒出两个红点比任何告警列表都直观。三、最有意思的设计会呼吸的红色边缘最让我印象深刻的是一个细节。我试了一下把某个任务的监控地址故意写错想看看它会怎么告警。结果整个屏幕边缘泛起了红光像呼吸一样一闪一闪的。圆环也从绿色变成了红色中间的字变成了“异常”。不是某个数字变红是整个页面在告诉你“出事了”。看了一下说明这个红色边缘光晕会根据故障数量自动调节深度和频率。轻度异常1个服务挂了是低频浅红光3秒一个周期。中度异常2-4个服务挂了是中频中红光2秒一个周期。重度异常5个以上服务挂了是高频深红光1秒一个周期。从视觉上就能判断问题有多严重不用看数字。四、两个看板各取所需驾驶舱和技术大屏共用同一套API数据不需要额外配置。两个看板只是展示方式不同技术大屏图表、趋势线、详细告警列表适合深入分析和排查问题驾驶舱圆环、圆点、呼吸光效适合一眼看结论技术人员看图表决策者看圆环。同一个产品两种表达。五、写在最后监控工具不应该只是给运维看的。它应该让每个关心服务稳定的人——不管是写代码的、管项目的、还是签合同的——都能一眼看懂自己的数字世界。