职位描述
职位描述
1. 负责平台监控系统的架构设计和开发工作;
2. 构建全面、精准的运维监控体系,覆盖基础设施,应用服务,业务指标等多个层面,实时采集、分析计算各类监控数据;
3. 持续优化现有监控体系,提供实时、可定制、多视角的监控能力,提升故障发现和定位效率。
职位要求
职位要求
1. 掌握至少一种主流编程语言(Java、Python、Go)
2. 有大中型监控系统架构设计和开发经验,大规模数据采集和处理经验
3. 熟悉流式计算,有Spark/Flink相关开发经验者优先;
4. 对监控理念有较深理解,了解国内外先进的监控解决方案,熟悉主流的监控告警系统,如Promethues、AlertMananger、Zabbix、open-falcon等,有开源监控系统二次开发经验者优先;
5. 良好的逻辑思维能力、沟通协调能力、团队协作能力,勤奋踏实好学,能承受一定的工作强度

