ThoughtWorks Logo

ThoughtWorks

Machine Learning Engineer(Ops方向)

🌎

Shenzhen

1d ago
👀 2 views
📥 0 clicked apply

Job Description

 

岗位职责

  •  MLOps平台和AI应用的维护:
    • 对部署的AI应用进行维护管理,例如AI应用本身和基础设施的监控和管理,确保应用高可用的运行。
    • 对机器学习所需的IAAS资源进行维护和管理,例如GPU虚拟化,GPU分配等操作,确保资源利用率达到最高。
  • 模型服务的维护:对本地部署的模型服务进行维护,例如提供负载均衡,缓存等多种优化方案,确保本地模型可提供高可用的服务。
  • 与数据科学家合作,理解业务需求并将其转化为运维所需要的技术解决方案。
  • 编写技术文档,保障运维解决方案的体系化。
  • 为团队成员提供技术培训,提升整体技术水平。

我们的要求

技术技能

  • 计算机科学、软件工程,或相关领域的统招本科及以上学历。
  • 有云原生架构的运维经验。
  • 有大规模机器学习模型部署和优化的实际经验。
  • 理解微服务解决方案,熟悉云原生的技术,例如K8S,具备独立运维K8S集群的能力,熟练使用K8S相关操作,能独立完成故障的处理。
  • 熟悉机器学习应用部署所需要的硬件资源,软件生态,例如ML Flow,Kubeflow等。
  • 熟悉云计算平台(如AWS、Azure、GCP)及其AI服务。
  • 具备基本的编写脚本能力,例如shell,terraform,  ansible等。
  • 了解底层资源管理,例如CPU/GPU虚拟机等技术。
  • 加分项:
    • 有机器学习领域的开发经验,例如从事过模型训练,微调以及应用开发等。
    • 有基于容器化技术(如Docker、Kubernetes)的大型微服务架构下的运维经验。
    • 有相关领域的开源项目贡献或技术社区活跃经历。

专业技能

  • 能够与非技术人员有效沟通复杂的技术概念,能够与多方一线业务、周边数据IT团队进行高效沟通,并牵引业务针对 AI平台提出有效诉来,井向业务传达AI 理念,同时带领AI技术团队和周边IT团队协同进行设计落地。
  • 强大的问题解决能力和创新思维。
  • 具备团队合作精神,能够在跨职能团队中高效工作。

其它你可以了解的

学习与发展

在 Thoughtworks 没有一刀切的职业道路您的职业发展完全取决于您个人。同时我们也会平衡自主权与我们的文化。您的职业生涯也会有互动工具、众多发展计划和愿意帮助您成长的同事的支持。我们认为互相帮助是我们最好的价值,这是我们的员工职业生涯中赋予他们权力。

关于Thoughtworks

Thoughtworks 是一个充满活力且包容的社区,汇聚了才华横溢、彼此支持的同事,共同推动科技的变革。作为一家领先的技术咨询公司,我们通过富有意义且具有深远影响的工作不断突破边界。30多年来,我们与客户携手合作,利用技术作为差异化优势,帮助他们解决复杂的业务难题,创造非凡的影响。将你的卓越专业知识和对持续学习的承诺带到 Thoughtworks,让我们一起成就非凡!

#LI-Onsite

Latest Jobs

More Jobs at ThoughtWorks