关于Tigo
Tigo组件级电力电子设备 组件 Power Electronics)领域的全球领导者,其创新解决方案可显著提升光伏(PV)系统的安全性、增加发电量并降低运营成本。Tigo 的 TS4 平台能最大限度地发挥光伏系统的效益,为客户提供目前市场上最具扩展性、多功能性和组件级电力电子设备 。
Tigo 于 2007 年在硅谷成立,旨在加速全球太阳能能源的应用。Tigo 系统遍布七大洲,每天生产数十亿千瓦时的可靠、清洁、经济且安全的太阳能。
我们正在寻找顶尖人才,他们热衷于解决复杂问题,并致力于将可再生能源带给大众。 团队成员不仅享有丰厚的薪酬和优渥的福利,更能在开放包容的工作氛围中,体验到助力减少全球对化石燃料依赖所带来的成就感。我们深知,自己的努力将直接影响清洁可再生能源系统的可负担性、可靠性和安全性,因此始终全力以赴。
工作内容
助力推动能源智能的未来发展,通过构建并运营Tigo人工智能/机器学习预测系统(Predict⁺)及全球太阳能监测平台(Tigo EI)的基础设施。我们仍是规模相对较小的全球团队,秉持初创企业精神运作:决策迅速、责任明确、跨职能紧密协作。
你将负责的工作内容
您将加入一个精干的实践型DevOps团队,负责管理以下基础设施:
- Predict⁺——基于人工智能/机器学习的能源生产与消耗预测系统。
- Tigo能源智能(EI)——一款应用于100多个国家的监测与分析平台。
- 我们运行着混合环境:Azure云与裸机(Hetzner + 本地机房)相结合,采用Talos Kubernetes、现代可观测性技术及GitOps。
角色概述
作为一名中高级DevOps工程师,您将:
- 运行并演进我们的Kubernetes平台(裸机上的Talos,Azure上的AKS)。
- 自主基础设施即代码与GitOps驱动的交付。
- 提升生产系统的可靠性、可观察性(OTEL)、安全性及成本效益。
- 在完全远程、全球化、高度异步的团队中工作,拥有充分的自主权和责任感。
职责
Kubernetes 与基础设施
- 操作并优化基于Talos的裸金属集群和Azure AKS。
- 处理部署、升级、扩展、备份/恢复及故障排除。
- 参与安全强化工作(基于角色的访问控制、网络策略、镜像/密钥卫生管理)。
云与裸机(Azure + Hetzner + 本地部署)
- 帮助管理 Azure 订阅、网络、身份和安全基线。
- 管理裸机服务器(Hetzner + 本地部署)及其与 Azure 之间的连接(VPN、路由)。
- 支持容量规划和成本感知设计。
基础设施即代码、自动化与交付
- 将Terraform作为基础设施的权威数据源。
- 使用Ansible进行配置和可重复的资源配置。
- 使用自托管的 GitLab CI 和 Azure DevOps 构建并维护持续集成/持续交付(CI/CD)管道。
- 使用Argo CD和自管GitLab实施并运行GitOps。
可观测性、数据与事件响应
- 扩展并维护Prometheus、Grafana、Zabbix和OpenTelemetry(OTEL)以支持指标、日志和追踪功能。
- 支持自托管的PostgreSQL和ClickHouse,以及Kafka、Redis和发布/订阅/高级队列。
- 协助制定警报、服务水平目标(SLOs)和运行手册;参与值班工作及事后复盘。
安全与合规
- 实施符合ISO27001标准的DevOps实践(包括访问控制、日志记录、变更管理和备份)。
- 助力机密管理、最小权限访问以及镜像/基础设施强化。
所需经费
你未必需要每一样东西,但应该能在大多数这些物品中看到自己的影子:
- Azure使用经验(订阅、基础网络、身份验证、安全概念)。
- 4年以上DevOps/SRE/基础设施岗位经验,具备实际生产环境管理职责。
- 在Kubernetes(自托管和/或AKS)方面拥有丰富的实践经验。
- 在Terraform和Ansible方面拥有扎实的经验。
- 具备使用GitLab CI和/或Azure DevOps构建和运行持续集成/持续交付(CI/CD)的经验。
- 扎实的Linux基础知识和故障排除技能。
- 对网络技术有深入理解(包括TCP/IP协议、域名系统、虚拟专用网络、负载均衡器及防火墙)。
- 接触过Prometheus/Grafana/Zabbix或类似监控工具。
- 使用Bash和/或Python进行脚本编写。
- 出色的沟通能力,以及非常扎实的英语书面和口语能力。
- 能够在完全远程、异步协作的全球化团队中高效工作,并能在最小指导下独立负责工作。
- 愿意参与生产值班轮换。
有则更好
- 运行全球分布式、面向客户的SaaS或能源/物联网系统。
- OpenTelemetry(OTEL)及现代可观测性技术栈的实际应用。
- 亲身体验 Talos Kubernetes 及混合 Azure + 裸机环境配置。
- 基于Argo CD和自管式GitLab(包含SCM、运行器和注册表)实现大规模GitOps。
- 大规模运行ClickHouse(备份/恢复、性能、数据保留)。
- Keycloak/OIDC/SAML、ELK/Wazuh、SAST/DAST或其他安全工具。
- 具备裸机操作经验(服务器、存储、虚拟化、网络)。
为什么你会喜欢在这里工作
- 影响:您的工作直接支持着全球清洁能源生产监测、优化与预测的平台。
- 环境:纳斯达克上市公司(股票代码:TYGO)的稳定性,结合小团队的初创企业式执行力与所有权。
- 技术栈:现代工具(Kubernetes、Talos、Terraform、GitOps、OTEL、Kafka、ClickHouse、Redis),并有空间塑造发展方向。