我是一名软件工程师,常驻中国广州🌊,在软件行业拥有5年以上的经验。我过去的重点领域是使用 Golang 进行后端开发(3年golang),还有两年的 Python 经验,同时也学习了一点Rust。
☎️ 联系方式
📧 Email address alal1995@hotmail.com
🔗 Github ray1888 (https://github.com/ray1888)
☎️ +86 15622321518
👩🏻💻 工作经验
后端工程师
字节跳动, 广东, 广州 – (Mar 2021 - Dec 2022)
-
飞书人事初始化系统
📌项目介绍
飞书人事初始化系统旨在缩短飞书人事的部署时间,帮助客户快速接入,并快速为售前开通新的演示租户系统。
负责工作
- 本人独自设计和编码实现了从零到一的方案,在一个月内完成,代码量含测试约1.5万行。该系统的端到端测试覆盖率达到了70%
- 对接超过7个上下游系统,制定技术方案并进行对接
- 负责与上下游沟通开发及上线排期,并且成功推动所有上下游按时上线
取得成绩
- 成功帮助团队将飞书人事基础版的部署时间从1周缩短到1天,并支持多个租户同时开通,从而提高了解决方案团队的效率。
- 开发完成后,支持多个客户的部署,并获得多个用户及内部业务方的好评。
-
飞书绩效
📌项目介绍
飞书绩效是面向飞书租户的绩效管理SaaS系统。
负责工作
📌 飞书绩效报表优化专项
- 负责压测场景的划分和压测,为后续的优化提供数据基础。
- 处理数据同步和对账逻辑的Review,确保ETL后的报表数据符合预期。
📌飞书绩效快照同步
- 从零开始进行设计到开发,支持了多个租户的需求,并成功上线,而且上线后没有出现任何Bug。
取得成绩
- 飞书绩效报表优化专项对原有架构进行了修改,大部分场景的性能提升达到了5倍,因此获得了团队Spot Bonus。
- 快照需求成功支持业务一年半,且无任何修改。
-
字节调级调薪系统
📌项目介绍
本项目是支持字节跳动公司内部调级调薪功能的系统。它能够辅助输入薪酬、人力、绩效信息,为管理者提供更好的晋升和调薪管理。
此系统之前已经被 3 个团队维护过,每个团队的维护时间都不超过 8 个月。接手时代码量达到了 40 万行,业务复杂度和历史负担都较高。
📌负责工作
-
处理系统历史包袱
- 作为用户角色,负责输出业务流程图,并在一个月内接手3个核心模块(调级、调薪、报表),负责后续模块的Oncall和开发工作。
- 使用Lidar工具(字节内部的Golang辅助定位问题工具)定位并修复历史代码中OOM问题,提高系统稳定性。
- 参与系统演练和造数工作,帮助团队将系统Fatal数量降至0。
- 为系统的调级、调薪和报表模块编写稳定性预案和预案演练,为故障快速恢复提供可操作的支持。
- 添加By场景的QPS埋点监控,为压测提供场景QPS数据。
-
业务需求及支持
- 接手系统后共开发了5个P0复杂度和3个P1复杂度的需求,并且上线时没有出现Bug。
- 支持公司内部的用户Oncall,并解决了10个以上的问题。
- 支持BI团队获取数据,输出通用的对接方案并编写BI业务接入数据SOP,最终成功地接入了2个不同的BI团队,涉及不同的维度取数。
-
性能优化相关
- 修复了历史代码中修改死锁的问题,使得系统同步上游绩效数据的功能速度提高 50%(13 万人数据,从一个半小时降到 40 分钟)
- 负责系统压测,全链路从场景梳理,核心链路及场景区分,数据构造及多轮数据压测及优化。使得系统在2周时间内,满足了系统接入3倍流量的容灾要求。
📌取得成绩
- 帮助团队成功接手调级调薪系统,并且稳定支持了一年半,成为维护调级调薪系统最长时间的团队。
- 支持核心模块开发,并且给团队同学提供设计相关需求开发的修改点意见
- 确保系统稳定,降低风险。在接手一年半以来,未发生任何Fatal。(在上一个团队移交系统之前,Fatal 为3个P0和2个P1,现在为0个Fatal。)
- 进行摸底系统,并对系统容量进行预估和扩容工作。
📌使用技术栈
- Golang
- Kubernetes
- Redis,ByteHtap,Mysql
- Git
- ByteCI
-
处理系统历史包袱
后端工程师
星火教育, 广东, 广州 – (Oct 2019- Jan 2021)
-
星火在线教育运营及上课系统
📌项目简介
本项目旨在支撑星火在线一对一的在线直播业务,包含排课平台、订单、直播、运营增长等多个平台,以支持业务线的发展。
📌负责工作
-
业务相关开发
- 负责运营系统功能的开发和设计,包括签单、退款、支付、增长模型、多省区数据权限功能和微信公众号等
- 开发上课系统业务系统(课件模块)
-
团队工具开发
- 开发 Migration 命令行迁移工具,方便数据迁移和迁移记录审计
- 制定代码分支规范和上线操作SOP,规范化上线代码流程
- 结合日志系统,实现链路追踪功能,提高团队的debug效率
- 添加代码静态检查,减少代码错误的可能性
- 接入Go Module,更好地管理Go相关的依赖包
-
性能优化
- 通过重构部分逻辑,优化业务系统的某些复杂接口和 SQL 查询,将原本耗时超过 1 秒的接口减少到 100 毫秒,提升了 90% 的性能。
- 进行性能压力测试并进行扩容,两周内将系统多个模块的容量扩大了两倍。这使得系统能够支持公司在疫情开始时的业务快速增长
📌取得成绩
- 在疫情开始时期进行系统扩容,使得系统可以支撑公司业务快速增长
- 团队的线上 Bug 率从每个版本 5 个下降到每个版本 2 个,严重 Bug 率下降了 60%
- Migration 工具提升了部署和运维效率。部署版本的数据迁移时间从原来超过 30 分钟,到目前每个版本约为 6 分钟
- 我们的团队用户量从 2019 年每天 200 次一对一课程上课次数增加到 2020 年中每天高达 700 次的总课程峰值
📌使用技术栈
- Golang
- Posgresql,Redis
- Jenkins
- AliCloud Suite(Ali Kubernetes Service,Ali Monitor & logging system, objectStorage)
-
业务相关开发
后端工程师
杉岩数据, 广东, 深圳– (Aug 2018 - Jul 2019)
📌项目简介
本项目旨在提供一个更易于使用的运维管理平台,用于管理 Ceph 存储。
📌负责工作
-
业务需求及Oncall
- 开发监控Ceph多协议存储(iSCSI、NFS、CIFS)性能的工具
- 开发易于使用的Cephx功能,使用户可以轻松加密Ceph存储
- 开发批量安装工具
- 在私有云部署中,Oncall同事遇到了不同版本软件的问题
-
性能提升
- 重构磁盘管理功能,使得磁盘管理初始化速度提高了50%。
📌取得成绩
- 重构了磁盘管理的功能,实现了对用户层存储介质 (HDD、SSD、NVME SSD) 的屏蔽,使用户更加易用。
- 成功支持售前同事和解决方案同事在多种公有云和私有云上的部署。
📌使用技术栈
- Python,Shell
- RabbitMQ,MariaDB
- graphite
- AliCloud Suite(Ali Kubernetes Service,Ali Monitor & logging system, objectStorage)
后端工程师
优亿科技, 广东, 广州 – (Jul 2017- May 2018 )
📌项目简介
该项目旨在提供全面的监控。它提供基础架构级别、应用级别和分布式追踪级别的监控。此外,它还利用机器学习技术来调整用户设定规则的警报阈值并降低告警误报率。。
📌负责工作
-
业务相关开发
- 基于 sklearn 的算法,编写了适用于项目的 AI 训练流程,包括数据切片,模型训练,模型认证和模型输出。
- 实现了告警核心模块的开发,包括告警规则配置及解析、告警通知和告警计算。
- 支持公司项目的开源化,并编写相关技术文档以及 Docker 打包。
-
算法相关
- 与算法同事一起参加第一届AIOPs竞赛,支持算法同事的工程化实现,提高训练模型的执行性能。
📌取得成绩
- 成功打入第一届 AIOPs 竞赛(由清华大学主办),并获得第 10 名。
- 该系统成功支持中国电信广东省研究院对信号的监控。
📌技术栈
- Python,Shell
- OpenTSDB,Redis,Mysql,MongoDB
🛠 技能
编程语言
Rust ⭐️⭐️⭐️
Golang ⭐️⭐️⭐️⭐️⭐️
Shell ⭐️⭐️⭐️
Python ⭐️⭐️⭐️
容器
Kubernetes⭐️⭐️⭐️⭐️
Docker ⭐️⭐️⭐️⭐️
持续集成及代码管理
Jenkins ⭐️⭐️⭐️
Git ⭐️⭐️⭐️⭐️⭐️
监控系统
Grafana ⭐️⭐️⭐️⭐️
OpenTSDB ⭐️⭐️⭐️⭐️
Prometheus ⭐️⭐️⭐️
软技能
Technical writing ⭐️⭐️⭐️
🗣 语言技能
普通话& 粤语🇨🇳
母语
英语🇺🇸
熟练
📜 Articles and Talks
📚 Education
物联网本科学位(广东工业大学)
2013-2017
广东 - 中国