中小规模互联网平台的系统监控体系 2018-09-13 | DevOps | 本文是最近对监控体系认识的总结。系统监控是通过技术手段发现服务异常,并持续优化业务可用性与用户体验的行为。它有监控体系和模型、监控平台、人员与组织等方面组成。本文试图对各方面的思路、设计和实践进行梳理。 但是由于时间关系,很多认识还不是很深入、细致,希望在后续章节中不断补充。 Read more »
Kibana日志分析(一)基础概念与常用查询 2018-09-05 | DevOps | 这是一个系列教程,期望从浅入深,让大家逐步掌握ELK。本文为此系列教程的第1篇,主要介绍ELK的总体结构和用途,以及Kibana的基础功能和查询语法。 Read more »
Flink 原理与实现:架构和拓扑概览 2018-09-03 | 数据技术 | 要了解一个系统,一般都是从架构开始。我们关心的问题是:系统部署成功后各个节点都启动了哪些服务,各个服务之间又是怎么交互和协调的。 Read more »