4006-998-758
先见者明先行者力
张观石
《SRE原理与实践:构建高可靠性互联网应用》作者。 拥有20年软件开发、架构、运维、SRE经验。曾在虎牙直播担任资深运维专家和架构师,历任项目研发负责人、SRE负责人、架构师,事故管理委员会委员、基础保障部架构师委员会委员。
任资深运维专家 架构师
  • 访问次数

    755
  • 咨询好评

    0
资历背景

《SRE原理与实践:构建高可靠性互联网应用》作者。

拥有20年软件开发、架构、运维、SRE经验。曾在虎牙直播担任资深运维专家和架构师,历任项目研发负责人、SRE负责人、架构师,事故管理委员会委员、基础保障部架构师委员会委员。

为虎牙基于微服务架构的直播业务、音视频业务、海外直播业务建立了稳定性保障体系,在混合多云架构、可观测性、预案、变更管控、AIOps等SRE领域有深入研究和丰富经验。多次担任虎牙“英雄联盟全球总决赛直播”稳定性保障负责人。

同时,他也是中国信通院分布式系统稳定性实验室高级技术专家,参与编写了信通院《信息系统稳定性保障能力建设指南》。《SRE体系建设及职能转型指南》联合作者、《运维前线》一书的联合作者。多次参与GOPS、MSUP、GDevops/XOPS、51CTO WOT、GTC技术大会分享。


客户评价

1、决定马上开始团队转型的事情,之前喊了几年,没有执行,参与培训后决定马上启动。

2、消减琐事:马上开始统计大家的琐事,老板早就想统计琐事,原本怕有抵触,借培训所讲直接安排落地。消减损失是有价值的,琐事在高层领导看是没价值的。

3、可观测性:本质讲到位了,领导要求组内同学都深入理解

客户反馈2:

领导听了一部分,现场call没来的人来听;

培训后,开展SLO梳理和制定目标的工作。

客户反馈3:

买书集体学习,已经安排了半年学习计划;