AWS的cli还是挺好用的,文档也比较全面,其实看个文档就可以使用,但是我毕竟是我,记下来,减少查询搜索的时间也是挺赚的,不是么。。话说“懒人使世界进步”,其实有个很重要的前提就是你这个懒人做出了可以帮你出色完成原定任务的东西,这时你才有资格懒。很显然,我没有。。。But我一直在实现这个前提的路上前进
记ARDB频繁崩溃错误
open-falcon业务监控实践
上一篇已经写了falcon的基础安装配置以及简单的使用说明,现在来记录下一些业务相关的监控如何做,截图居多。心疼流量三秒…其实实现方法都不难,设计一个良好的命名规范以及科学的分组,实际上对监控来说是十分必要的。还有就是要对监控指标的判断做个性化设置,最好就是看图的话一眼就概览全局(要让图清晰直观的反应状况),报警的话做到真实有效人性化。这篇里面只涉及如何对常见服务进行配置。
- 对于基础监控:cpu、内存、IO、网络适合折线图;而磁盘使用量这些其实设置多维度报警即可(如磁盘使用率>80%且小于20G报警)
- 对于服务和端口:监控出数字显示服务总数量,服务正常数量、服务异常数量,然后配置报警即可
- 对于业务监控:对业务指标使用折线图一般都是适用的