工作经历
开云/亚博 技术中心
2023.11 — 至今
资深高级架构师
- 跨部门协同:统筹运维、域名、业务、安全、运维开发等多组协作,推动需求工具化、工具平台化
- 平台研发:主导自研CMDB、域名管理系统(150万+域名)、CDN系统、SSO统一平台、审批系统等核心基础设施
- 自建CDN系统:自研CDN开发,设计实现缓存系统架构、多级缓存预热流程,支撑大规模内容分发
- 自建WAF安全防护:自研WAF系统,集成常见WAF规则,自研慢攻击/CC攻击识别库,JA3指纹逻辑,结合AI实现自动封禁
- 智能监控:设计开发边缘节点拨测系统,实时检测域名可用性,第一时间排查域名被墙、业务故障等问题,保障业务连续性
- 自研打包/发布系统:整合替代Jenkins/Ansible/ArgoCD等工具,集成审计与权限管理,大幅降低维护成本
- AIOps落地:基于Amazon Q构建企业AI平台,实现业务数据观测、故障分析、性能诊断;部署Thanos+AI实现多集群监控与异常预测
- 内部风控体系:研发操作日志分析系统,结合AI Agent实时分析异常操作日志,监控内部员工操作行为
VimWorld (美企远程)
2021.9 — 2023.11
架构师
- 区块链节点运维:负责VeChain、ETH、TRON等多链节点的部署、维护与监控,保障区块链服务稳定运行
- ELK日志系统:搭建ELK日志系统与监控中心,实现全链路日志采集、分析与可视化
- 自研钱包维护:负责自研区块链钱包与生产业务维护,快速定位排查线上故障
- CICD设计实施:基于GitLab CI + ArgoCD设计实施完整CI/CD流程,实现自动化部署
- 架构规划:主导制定运维SOP及技术基础架构标准,负责中间件选型与验收
哈啰出行
2019.8 — 2021.9
SRE 工程师 P7
- 规模化运维:负责5000+台服务器运维,支撑日请求4000万次的高并发业务
- 自研运维平台:主导自动化平台开发,实现服务器自动化初始化、应用一键部署、组件批量管理、CMDB资产自动同步等功能
- CI/CD流水线:完善CI/CD流程,实现代码自动构建、镜像推送、滚动灰度发布,显著提升自动化覆盖率
- 成本控制:基于数据指标执行精准扩容/缩容,有效控制公司IT成本
- K8S与云原生:维护300+节点K8S集群,结合CEPH存储,对接自动化需求
日日煮
2016.8 — 2019.8
高级运维工程师
- K8S集群建设:自建Kubernetes集群部署与维护,实现容器化编排与管理
- 生产业务运维:负责生产环境业务维护,快速定位分析解决故障及突发情况
- CICD流程设计:设计实施完整CI/CD流程,推动程序架构优化与容器化落地
- 中间件运维:负责Canal、Redis、MySQL、ClickHouse、RocketMQ、Kafka等中间件部署与维护
- DevOps平台:负责DevOps平台基础组件构建,推进自动化运维平台开发 (Golang/Vue)
GoldenTek Inc.
2014 — 2016.7
业务运维工程师组长
- 自动化运维平台:开发自动化运维平台 (Python + Element UI),实现发版、回滚、重启等管控功能
- 数据库运维:负责MySQL、MongoDB、PostgreSQL等数据库集群部署、主从复制、备份恢复与性能优化
- 中间件运维:负责Redis集群、RabbitMQ、Memcached等中间件部署与维护
- 监控与安全:部署细颗粒度监控系统(Zabbix/Nagios),负责异常流量与网络攻击处理
新浪 Show
2011.4 — 2014
业务运维工程师
- 负责华东华北5大机房日常巡检与服务器维护
- 负责直播业务的高并发流量应对与故障处理
- 编写Shell/Python脚本实现细颗粒度监控告警
- 推进虚拟化技术并交付业务使用