您当前的位置:首页 > 电脑百科 > 程序开发 > 编程百科

顶级ML后端工程师“进化”指南

时间:2023-10-30 13:37:06  来源:51CTO  作者:

作者丨Alexei Bochkarev

译者 | 晶颜

审校 | 重楼

出品 | 51CTO技术栈(微信号:blog51cto)

在当今瞬息万变的技术世界中,机器学习(ML)后端工程师惊觉自身正处于进步的最前沿,被迫不断适应和加速创新。在竞争激烈的技术市场中,产品质量是成功的核心,寻找产品改进的新方法是ML后端工程师的责任。在本文中,我们将介绍帮助您成为优秀ML后端工程师的五种策略。

1、策略1:持续学习ML基础知识

在ML后端工程师能够创新复杂的应用程序之前,他们必须首先了解机器学习的基础知识。理论基础、经典算法和已确立的最佳实践不仅仅是学术练习;它们还是后续每一层知识和专业技能的基础。

案例研究:改进电子商务聚合器的查询分类算法

确定用户查询或搜索短语背后意图的过程称为查询分类(Query Classification)。这对电子商务聚合器来说至关重要,这些聚合器会将来自不同零售商的产品整合到一个平台上。例如,客户在销售书籍、电子产品和服装的电子商务聚合器中输入查询“Harry”,该聚合器可以指向“Harry Potter”(书籍或电影)和“Harry Styles商品”(服装)等结果。在这种情况下,精确的查询分类对于确保用户找到他们所需的产品至关重要,这可以带来更高的转化率和用户满意度。   

虽然基于规则的分类系统可能难以处理这样的查询,但经过大量数据训练的ML模型可以对用户正在寻找的内容做出有根据的猜测。如果您不了解基本的算法和方法,如基于规则的分类、决策树、朴素贝叶斯分类器(Nave Bayes Classifier)、神经网络和深度学习等,那么您成功的机会几乎是渺茫的。

掌握ML基础知识的关键要点和技巧

通过定期回顾和加强机器学习基础知识,您可以巩固自己的知识,更好地了解趋势,并在竞争中保持领先地位。以下是一些建议:

  • 把时间和资源投入到基础课程、讲习班和研讨会上。虽然“重返校园”似乎有些奇怪,但这些途径往往为旧概念提供了新的视角。
  • 参与实践项目和挑战,使您能够应用基本的机器学习概念。这不仅加强了理解,而且揭示了理论可能遗漏的细枝末节。

2、策略2:内部测试(Dogfooding)自己的产品

Dogfooding表面看是“吃自己的狗粮”,现在也被译为“内部测试”,指的是作为最终用户使用您自己的产品,以深入了解其优点、缺点和需要改进的地方。这个概念的基本思想简单而深刻:通过亲自体验自己的产品,您将能获得宝贵的见解,这些见解可以帮助您识别问题、痛点和创新机会,否则这些问题可能会被忽视。

案例研究:帮助一家土耳其搜索引擎提高搜索质量

例如,一家土耳其公司在决定从头开始构建一个新的搜索引擎时,尽管拥有一支称职的QA团队,并利用了BERT和Neural.NETworks等先进算法,但他们仍然很可能会面临搜索结果相关性和准确性方面的偏差。“内部测试策略”(Dogfooding Strategy)——所有公司员工开始专门使用自己的搜索引擎来满足在线搜索需求——可能会有所帮助。它将有助于定义和解决查询分类、词嵌入、UI实现和广告放置等方面的缺陷。“内部测试”方法将为技术团队提供必要的数据,以实现更适合土耳其语言和用户行为细微差别的算法。   

Dogfooding的最佳实践:

  • 定期使用:将您的产品集成到您的日常工作中,确保您在各种场景和上下文中使用它。
  • 多样化的团队参与:鼓励所有部门的成员使用产品,而不仅仅是工程师和产品经理。不同的视角可以突出不同的问题。
  • 反馈渠道:创建简单的内部反馈渠道。当一个想法或问题在脑海中迸发时,它是最强大的。
  • 快速迭代:当获得的见解触发及时响应时,Dogfooding效果最好。根据反馈确定优先级并采取行动以不断改进产品。

3、策略3:产品差距的定量分析

在产品开发过程中,如果没有定量分析,有时很难确定需要改进的特定领域。它使企业能够准确地识别差距,并通过可测量的数字数据剖析产品性能,将用户行为、反馈和产品指标转化为有形的数字,从而执行有针对性的改进。

案例研究:提高地图搜索服务的排名质量

以一个全球流行的地图搜索服务为例,它不断收到关于搜索结果排名质量的投诉,用户声称特定的地标应该得到更多的可见性。该公司可以通过定量分析来检查用户搜索模式、点击率、用户粘性持续时间和重新查询频率,从而获得有价值的数据。获悉这些数据可以帮助定义为什么著名的地标经常被忽视,并改进排名算法,以改进关键的“以用户为中心”的指标。   

快速分析产品质量并得出可操作性见解的技术:

  • A/B测试:将您的用户群分成两组,测试不同版本的产品。比较性能指标,看看哪个版本更受用户欢迎。
  • 热图:利用生成用户交互热图的工具。这张图描述了用户在哪些地方花费了大部分时间,哪些功能被忽略了。
  • 用户流分析:发现用户如何浏览您的产品。确定瓶颈或下降点,以帮助优先考虑需要改进的领域。
  • 带有定量问题的反馈调查:设计带有数字评级的调查,而不是开放式问题。这为分析提供了更精确的基线。
  • 实时监控工具:部署提供实时洞察用户行为的工具,使团队能够快速识别和解决任何意外问题或差距。

4、策略4:加快开发周期

ML模型开发周期是一个迭代过程,包括构思、训练、测试和部署。这个循环的每一个循环都旨在建立一个更精细、更准确、更有效的模型。在日益激烈的市场竞争中,缩短周期是绝对必要的,快速迭代也是必要的。

案例研究:减少自动驾驶汽车项目的模型推理时间

在自动驾驶汽车行业中,驾驶模型的推理时间至关重要,因为较长的推理时间可能导致道路上的反应延迟。通过整合一些真正有效的策略来简化开发周期,可以让自动驾驶汽车更快地实时反应,同时也允许团队更频繁地迭代和改进模型,从而进一步提高性能。

加快开发周期的策略包括:

  • 使用更小的模型/更小的池进行实验:在扩大规模以进行更快的实验和假设验证之前,先从更小、更易于管理的模型或数据子集开始。
  • 构建自动化培训和评估管道:自动化耗时的任务(如培训和评估管道)以释放工程师的时间进行改进和创新。
  • 在线测试之前利用Dogfooding和离线测试:在启动全面的在线测试之前,先在内部使用您的产品并运行离线测试来检测主要问题,以尽早解决潜在问题,从长远来看,这样做更加节省时间和资源。

5、策略5:构建示范性原型

示范性原型(Demonstrative Prototype)是一个非常有用的工具,可以增加创造成功最终产品的机会。它将抽象概念与具体的产品实现联系起来。

示范性原型在产品开发中所扮演的角色包括:

  • 可视化:原型将想法变为现实,让所有利益相关者(无论他们是开发者、投资者还是潜在客户)都能与之互动并更好地理解概念。
  • 收集反馈:用户可以测试原型,并为进一步的设计改进提供反馈,以确保最终产品与用户的需求和期望紧密匹配。   
  • 降低成本:与在全面生产后进行检测相比,在原型阶段识别设计缺陷或效率低下可以节省大量资源。
  • 获得利益相关者的支持:一个可行的原型可以向潜在的投资者或高层管理人员证明这个想法的可行性。
  • 改进用户体验(UX):与原型交互可以提供对用户旅程的见解,允许设计师改进用户体验,以获得更大的直观性和用户满意度。
  • 降低风险:通过在真实场景中测试原型,可以及早识别和解决潜在的风险或缺点。

6、结语

在本文中,我们研究了如何在这个蓬勃发展的行业中成为优秀机器学习(ML)后端工程师。他们专注于持续学习机器学习基础知识,使用Dogfooding方法和定量分析,加速开发周期的技术,以及构建示范性原型。

如果您选择ML后端工程师的职业路径,那么将这些策略应用于您的日常工作可以帮助您提高绩效,将自身水平达到新的高度,并推动整个技术领域向前发展!         

参考链接:https://hackernoon.com/five-strategies-to-become-top-ml-backend-engineer



Tags:后端   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
网站开发中的前端和后端开发有什么区别
前端开发和后端开发都是干什么的?有哪些区别?通俗地讲,前端干的工作是用户可以直接看得见的,而后端开发的工作主要在服务端,用户不太能直接看到。虽然前端开发和后端开发的工作有...【详细内容】
2024-02-21  Search: 后端  点击:(31)  评论:(0)  加入收藏
网站程序开发中的前后端分离技术
随着互联网的快速发展和技术的不断创新,传统的网站开发模式已经难以满足日益增长的业务需求。为了提高开发效率、增强系统的可维护性和可扩展性,前后端分离技术逐渐成为了网站...【详细内容】
2024-01-31  Search: 后端  点击:(23)  评论:(0)  加入收藏
一段微信小程序前端与后端连接的代码,带注解
微信小程序的前端和后端连接通常涉及到使用微信小程序提供的网络请求API与后端服务器进行通信。以下是一个简单的示例,展示如何使用微信小程序的前端代码向后端发送请求并处...【详细内容】
2024-01-24  Search: 后端  点击:(55)  评论:(0)  加入收藏
Java后端+Java大数据+前端
web前端开发主要涉及创建网页或网站的用户界面,包括布局、样式、动画、交互等。web前端开发需要掌握HTML、CSS、JavaScript等基础语言,以及各种框架和库,如React、Vue、Bootstr...【详细内容】
2023-12-28  Search: 后端  点击:(93)  评论:(0)  加入收藏
前端请求到后端API的中间件流程解析
在前端请求到后端API的典型流程中,经过一系列中间件的处理,确保请求的顺利处理和安全性。以下是中间件的详细解析:1. 前端请求用户在前端发起请求,包括请求的URL、参数、以及其...【详细内容】
2023-12-06  Search: 后端  点击:(122)  评论:(0)  加入收藏
运动规划之搜索算法:前端规划、后端轨迹生成到状态求解
背景:16-18年做过一阵子无人驾驶,那时候痴迷于移动规划;然而当时可学习的资料非常少,网上的论文也不算太多。基本就是Darpa的几十篇无人越野几次比赛的文章,基本没有成系统的文章...【详细内容】
2023-11-30  Search: 后端  点击:(116)  评论:(0)  加入收藏
Java后端开发需要学什么?这篇干货送给你
在现如今的互联网时代,掌握了编程技术,机遇就会变多,Java作为应用广泛的编程语言,在编程届有着很高的名气,如果你想学习Java,就先要了解Java后端开发需要学习什么!Java后端开发需要...【详细内容】
2023-11-24  Search: 后端  点击:(231)  评论:(0)  加入收藏
2024年不容错过的后端与网页开发新动态
在数字创新不断变化的领域中,作为开发者,你可能会感到自己处于一场永无止境的竞赛之中,面临着挑战和机遇的旋风。开发产品的压力、保持竞争力、跟上用户期望的演变,这些都可能让...【详细内容】
2023-11-24  Search: 后端  点击:(214)  评论:(0)  加入收藏
为什么Go是后端开发的未来
近年来,Go 编程语言的流行度迅速增加。Go 最初由 Google 开发,迅速成为后端开发中最受欢迎的语言之一,特别是在分布式系统和微服务的开发中。本文将讨论为什么 Go 是后端开发的...【详细内容】
2023-11-21  Search: 后端  点击:(203)  评论:(0)  加入收藏
Spring Boot + Vue3 前后端分离 实战wiki知识库系统
下栽の地止:https://www.itwangzi.cn/2508.html Spring Boot + Vue3 前后端分离 实战wiki知识库系统在当今的Web应用开发中,前后端分离已经成为了一种主流的开发模式。Spring...【详细内容】
2023-11-18  Search: 后端  点击:(143)  评论:(0)  加入收藏
▌简易百科推荐
即将过时的 5 种软件开发技能!
作者 | Eran Yahav编译 | 言征出品 | 51CTO技术栈(微信号:blog51cto) 时至今日,AI编码工具已经进化到足够强大了吗?这未必好回答,但从2023 年 Stack Overflow 上的调查数据来看,44%...【详细内容】
2024-04-03    51CTO  Tags:软件开发   点击:(5)  评论:(0)  加入收藏
跳转链接代码怎么写?
在网页开发中,跳转链接是一项常见的功能。然而,对于非技术人员来说,编写跳转链接代码可能会显得有些困难。不用担心!我们可以借助外链平台来简化操作,即使没有编程经验,也能轻松实...【详细内容】
2024-03-27  蓝色天纪    Tags:跳转链接   点击:(12)  评论:(0)  加入收藏
中台亡了,问题到底出在哪里?
曾几何时,中台一度被当做“变革灵药”,嫁接在“前台作战单元”和“后台资源部门”之间,实现企业各业务线的“打通”和全域业务能力集成,提高开发和服务效率。但在中台如火如荼之...【详细内容】
2024-03-27  dbaplus社群    Tags:中台   点击:(8)  评论:(0)  加入收藏
员工写了个比删库更可怕的Bug!
想必大家都听说过删库跑路吧,我之前一直把它当一个段子来看。可万万没想到,就在昨天,我们公司的某位员工,竟然写了一个比删库更可怕的 Bug!给大家分享一下(不是公开处刑),希望朋友们...【详细内容】
2024-03-26  dbaplus社群    Tags:Bug   点击:(5)  评论:(0)  加入收藏
我们一起聊聊什么是正向代理和反向代理
从字面意思上看,代理就是代替处理的意思,一个对象有能力代替另一个对象处理某一件事。代理,这个词在我们的日常生活中也不陌生,比如在购物、旅游等场景中,我们经常会委托别人代替...【详细内容】
2024-03-26  萤火架构  微信公众号  Tags:正向代理   点击:(10)  评论:(0)  加入收藏
看一遍就理解:IO模型详解
前言大家好,我是程序员田螺。今天我们一起来学习IO模型。在本文开始前呢,先问问大家几个问题哈~什么是IO呢?什么是阻塞非阻塞IO?什么是同步异步IO?什么是IO多路复用?select/epoll...【详细内容】
2024-03-26  捡田螺的小男孩  微信公众号  Tags:IO模型   点击:(8)  评论:(0)  加入收藏
为什么都说 HashMap 是线程不安全的?
做Java开发的人,应该都用过 HashMap 这种集合。今天就和大家来聊聊,为什么 HashMap 是线程不安全的。1.HashMap 数据结构简单来说,HashMap 基于哈希表实现。它使用键的哈希码来...【详细内容】
2024-03-22  Java技术指北  微信公众号  Tags:HashMap   点击:(11)  评论:(0)  加入收藏
如何从头开始编写LoRA代码,这有一份教程
选自 lightning.ai作者:Sebastian Raschka机器之心编译编辑:陈萍作者表示:在各种有效的 LLM 微调方法中,LoRA 仍然是他的首选。LoRA(Low-Rank Adaptation)作为一种用于微调 LLM(大...【详细内容】
2024-03-21  机器之心Pro    Tags:LoRA   点击:(12)  评论:(0)  加入收藏
这样搭建日志中心,传统的ELK就扔了吧!
最近客户有个新需求,就是想查看网站的访问情况。由于网站没有做google的统计和百度的统计,所以访问情况,只能通过日志查看,通过脚本的形式给客户导出也不太实际,给客户写个简单的...【详细内容】
2024-03-20  dbaplus社群    Tags:日志   点击:(4)  评论:(0)  加入收藏
Kubernetes 究竟有没有 LTS?
从一个有趣的问题引出很多人都在关注的 Kubernetes LTS 的问题。有趣的问题2019 年,一个名为 apiserver LoopbackClient Server cert expired after 1 year[1] 的 issue 中提...【详细内容】
2024-03-15  云原生散修  微信公众号  Tags:Kubernetes   点击:(5)  评论:(0)  加入收藏
站内最新
站内热门
站内头条