您当前的位置:首页 > 电脑百科 > 程序开发 > 编程百科

大模型开发栈已成!

时间:2023-09-14 13:59:39  来源:51CTO  作者:

作者 | Richard macManus

策划 | 言征

Web3未能颠覆掉Web2,但新兴的大模型开发栈正在让开发者从“云原生”时代迈向新的AI技术栈。

提示工程师或许不能触动开发者奔赴大模型的神经,但产品经理或者领导的一句:能不能开发一个“agent”,能不能实现一条“chain”,“使用哪款向量数据库”,却成为了目前各大主流大模型应用公司中驱动技术同学攻克生成AI开发的难点所在。

那么,新兴的技术栈究竟分哪几层?哪里最为棘手?本文带大家一探究竟。

1、技术栈需要更新了开发者迎来AI工程师时代

在过去一年,LangChain和LlamaIndex等工具的出现,使得AI应用程序的开发者生态系统开始成熟。甚至,现在还有一个术语来形容专注于人工智能的开发人员:“AI工程师”,根据其倡导者Shawn@swyx Wang的说法,这是“提示工程师”的下一步。他还创建了一张坐标图,形象展示了AI工程师在更广泛的人工智能生态系统中的位置:

图源:swyx图源:swyx

大型语言模型(LLM)是AI工程师的核心技术。LangChain和LlamaIndex都是扩展和补充LLM的工具,这绝非巧合。但是,对于这类新的开发人员来说,还有什么其他工具可用呢?

到目前为止,我看到的LLM堆栈的最佳图表来自风险投资公司Andreessen Horowitz(a16z)。以下是它对“LLM App stack”的看法:

图源:a16z图源:a16z

2、没错,最顶层的还是数据

很明显,LLM技术栈中最重要的是数据。在a16z的图中,这是最顶层。“嵌入模型”是LLM的用武之地——你可以从OpenAI、Cohere、Hugging Face或其他几十种LLM选项中进行选择,包括越来越流行的开源LLM。

但即使在使用LLM之前,还需要建立一个“数据管道”——它将Databricks和Airflow列为两个示例,或者可以对数据进行“非结构化”处理。这也适合数据周期,可以帮助企业在将数据输入自定义LLM之前“清理”或简单地整理数据。像Alation这样的“数据智能”公司,就提供这种类型的服务——听起来,有点像IT技术栈中更为人知的“商业智能”等工具。

数据层的最后一部分则是近期名声大噪的向量数据库,来存储和处理LLM数据。根据微软的定义,这是“一种将数据存储为高维向量的数据库,高维向量是特征或属性的数学表示。”数据通过一种名为“embedding”的技术存储为向量。

领先的向量数据库供应商Pinecone在一次媒体交谈时指出,Pinecone的工具经常与数据管道工具(如Databricks)一起使用。在这种情况下,数据通常位于其他地方(例如,数据湖),然后通过机器学习模型将其转换为嵌入。在对数据进行处理和分块后,生成的向量被发送到Pinecone。

3、提示和查询

接下来的两层可以概括为提示和查询——这是人工智能应用程序与LLM和(可选)其他数据工具接口的地方。A16z将LangChain和LlamaIndex定位为“编排框架”,这意味着开发人员一旦知道自己使用的是哪种LLM,就可以使用这些工具。

根据a16z的说法,像LangChain和LlamaIndex这样的编排框架“抽象掉了提示链接的许多细节”,这意味着在应用程序和LLM之间查询和管理数据。这个编排过程包括与外部API接口,从矢量数据库检索上下文数据,以及在多个LLM调用中维护内存。a16z图表中最有趣的方框是“游乐场”,其中包括OpenAI、nat.dev和Humanloop。

A16z在博客文章中没有确切定义,但我们可以推断,“游乐场”工具可以帮助开发人员施展A16z所说的“提示柔术”。在这些地方,开发人员可以尝试各种提示技术。

Humanloop是一家英国公司,其平台的一个功能是“协作提示工作区”。它进一步将自己描述为“用于生产LLM功能的完整开发工具包”。因此,基本上,它允许您尝试LLM的东西,然后将其部署到应用程序中(如果它有效的话)。

4、流水线作业:LLMOps

大模型生产的流水线目前正在逐渐清晰。编排框的右侧是许多操作框,包括LLM缓存和验证。还有一系列与LLM相关的云和API服务,包括Hugging Face等开放的API存储库,以及OpenAI等专有的API提供商。

这可能是我们在“云原生”时代习惯的开发人员技术栈中最相似的地方,许多DevOps公司将人工智能添加到了他们的产品列表中,这绝非巧合。5月,我与Harness首席执行官Jyoti Bansal进行了交谈。Harness运行一个“软件交付平台”,专注于CI/CD流程的“CD”部分。

Bansai告诉我,人工智能可以减轻软件交付生命周期中涉及的繁琐和重复的任务,从基于现有功能生成规范到编写代码。此外,他还表示,人工智能可以自动化代码审查、漏洞测试、错误修复,甚至为构建和部署创建CI/CD管道。根据我在五月份的另一次对话,人工智能也在改变开发人员的生产力。来自构建自动化工具Gradle的Trisha Gee告诉我,人工智能可以通过减少重复任务(如编写样板代码)的时间来加速开发,并使开发人员能够专注于大局,如确保代码满足业务需求。

5、Web3凉了,大模型开发栈来了

在新兴的LLM开发技术栈中,我们看到了一系列新的产品类型,例如编排框架(LangChain和LlamaIndex)、向量数据库和Humanloop等“游乐场”平台。所有这些都扩展和/或补充了这个时代的底层核心技术:大型语言模型。

一如前几年Spring Cloud、Kube.NETes等云原生时代工具的兴起。只不过当下,几乎所有云原生时代的大、小、顶流企业都在极力将其工具适应AI工程化,这就会对LLM技术栈的未来发展非常有利。

没错,这一次的大模型俨然“站在巨人的肩膀上”,计算机技术中最好的创新总是建立在以前的基础上。也许这就是“Web3”革命失败的原因——与其说它是建立在上一代的基础上,不如说它试图篡夺它。

很明显,LLM技术栈似乎做到了,它是从云开发时代到更新的、基于AI的开发者生态系统的桥梁。

参考链接:https://thenewstack.io/llm-app-ecosystem-whats-new-and-how-cloud-native-is-adapting/



Tags:大模型   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除。
▌相关推荐
作者 | Richard MacManus策划 | 言征Web3未能颠覆掉Web2,但新兴的大模型开发栈正在让开发者从“云原生”时代迈向新的AI技术栈。提示工程师或许不能触动开发者奔赴大模型的神...【详细内容】
2023-09-14  Tags: 大模型  点击:(0)  评论:(0)  加入收藏
9月13日,阿里云宣布通义千问大模型已首批通过备案,并正式向公众开放。在此前近半月时间里,百度、腾讯等大厂的国产大模型相继正式上线,国产AI大模型“百模大战”时刻或将到来。...【详细内容】
2023-09-14  Tags: 大模型  点击:(3)  评论:(0)  加入收藏
新华财经北京9月14日电(记者 陈宇轩)近日,腾讯公司的人工智能大模型“混元”在2023腾讯全球数字生态大会上正式亮相,该大模型在中文创作、复杂语境下的逻辑推理、可靠的任务执行...【详细内容】
2023-09-14  Tags: 大模型  点击:(2)  评论:(0)  加入收藏
我们知道在使用 GPT 和 LLaMA 等大型语言模型时,输入的 prompt 存在字符数限制,比如 ChatGPT 目前的输入字符限制是 4096 个字符。这会限制上下文学习和思维链等技术的发挥空...【详细内容】
2023-09-13  Tags: 大模型  点击:(3)  评论:(0)  加入收藏
明敏 发自 凹非寺量子位 公众号 | QbitAI专为AI而来的新语言Mojo,推理LLaMA2性能比Python提升250倍!比C语言也要快上20%。上周五才开放下载,Mojo这么快就自证实力了。要知道,之...【详细内容】
2023-09-13  Tags: 大模型  点击:(3)  评论:(0)  加入收藏
Meta参展2022年在上海举行的进博会(来源:钛媒体App编辑拍摄)过去半年,为了追赶OpenAI的研发脚步,科技巨头Meta公司(前Facebook)接连发布免费开源大语言模型LLaMA、Llama 2以及编程...【详细内容】
2023-09-13  Tags: 大模型  点击:(2)  评论:(0)  加入收藏
新浪科技讯 9月13日上午消息,阿里云宣布通义千问大模型已首批通过备案,并正式向公众开放,广大用户可登录通义千问官网体验,企业用户可以通过阿里云调用通义千问API。通义千问在...【详细内容】
2023-09-13  Tags: 大模型  点击:(2)  评论:(0)  加入收藏
腾讯在9月7日召开的数字生态大会上,正式发布了“混元大模型”。在大模型竞赛风起云涌的上半场,腾讯的动作并不算快。最早发布大模型的巨头是百度。今年3月16日,百度宣布正式推...【详细内容】
2023-09-12  Tags: 大模型  点击:(3)  评论:(0)  加入收藏
今年以来,以ChatGPT为代表的大语言模型和生成式人工智能成为全球科技热点,并影响到人类的生活和生产方式。不过全球用户也很快发现,在与大语言模型交互的过程中,会碰到它“一本...【详细内容】
2023-09-09  Tags: 大模型  点击:(8)  评论:(0)  加入收藏
9月7日,在2023腾讯全球数字生态大会上,腾讯首次公开了完全自主研发的通用大语言模型——腾讯混元大模型。得益于全链路自研技术,腾讯混元大模型能够理解上下文的含义...【详细内容】
2023-09-09  Tags: 大模型  点击:(4)  评论:(0)  加入收藏
▌简易百科推荐
作者 | Richard MacManus策划 | 言征Web3未能颠覆掉Web2,但新兴的大模型开发栈正在让开发者从“云原生”时代迈向新的AI技术栈。提示工程师或许不能触动开发者奔赴大模型的神...【详细内容】
2023-09-14    51CTO  Tags:大模型   点击:(0)  评论:(0)  加入收藏
编译器是将源代码转换为目标代码的关键工具,而IR 是编译器中的核心数据结构。IR的作用是将源代码转换为目标代码,并在此过程中执行各种优化,以提高目标代码的质量和性能。在编...【详细内容】
2023-09-12  小老头哦    Tags:编译器   点击:(1)  评论:(0)  加入收藏
分布式跟踪可以帮助查看整个请求过程中服务之间的交互,并可以让我们深入了解系统中请求的整个生命周期。它帮助我们发现应用程序中的错误、瓶颈和性能问题。OpenTelemetry 可...【详细内容】
2023-09-11  k8s技术圈  微信公众号  Tags:OpenTelemetry   点击:(5)  评论:(0)  加入收藏
热部署是软件开发中一个非常有用的功能,它允许我们在不重新启动整个应用的情况下,依旧能够使我们修改的代码生效。现在Java Web 开发应该都是使用的 SpringBoot,那么本篇文章就...【详细内容】
2023-09-11  Java技术指北  微信公众号  Tags:pringBoot   点击:(6)  评论:(0)  加入收藏
JPA 与 DDD 的==聚合写== 是绝配,但在 “读” 场景 往往会引发各种性能问题。这也是很多公司弃用 JPA 而选择 MyBatis 的主要原因,就其本质并不是框架的错,而是将框架用在了错...【详细内容】
2023-09-11  geekhalo    Tags:DDD   点击:(5)  评论:(0)  加入收藏
译者 | 刘汪洋反馈就像一块牛排 - 如果太生,没有人喜欢;但如果过熟,难以下咽。(ChatGPT)通过不断审查他人代码,你不仅可以提升自己的技能,对你的职业发展也有很大好处。不仅可以...【详细内容】
2023-09-11    51CTO  Tags:代码审查   点击:(3)  评论:(0)  加入收藏
什么是Selenium01模拟浏览器:Selenium我们知道,网页会使用Java加载数据,对应于这种模式,可以通过分析数据接口来进行直接抓取,这种方式需要对网页的内容、格式和Java代码有所研究...【详细内容】
2023-09-11    书圈  Tags:Selenium   点击:(5)  评论:(0)  加入收藏
在现代软件开发中,团队合作是不可或缺的一部分。为了确保代码质量、减少错误以及促进知识共享,代码审查和合并请求成为了开发团队中的关键实践。在本文中,我们将深入探讨代码审...【详细内容】
2023-09-09  高级互联网架构  今日头条  Tags:代码   点击:(10)  评论:(0)  加入收藏
在现代软件开发中,应用程序的性能是一个至关重要的因素,直接影响用户体验和业务成功。为了确保应用的高性能和稳定性,性能监测与优化成为了不可或缺的环节。本文将深入探讨性能...【详细内容】
2023-09-09  在现代软件开发中,应用程序的性能是一个至关重要的因素,直接影  今日头条  Tags:性能监测   点击:(10)  评论:(0)  加入收藏
译者 | 李睿审校 | 重楼API可以返回大量的数据,这使得开发人员很难只检索他们需要的信息。这就是API的过滤和排序功能的用武之地。过滤和排序是API设计的两个基本功能,它们允...【详细内容】
2023-09-09    51CTO  Tags:API   点击:(7)  评论:(0)  加入收藏
站内最新
站内热门
站内头条