您当前的位置:首页 > 电脑百科 > 人工智能

ChatGPT之外,美国大模型搞到什么程度了?

时间:2023-12-26 09:44:49  来源:华商韬略  作者:
ChatGPT之外,美国大模型搞到什么程度了?

年初以来,AI target=_blank class=infotextkey>OpenAI以ChatGPT在全球掀起AI大模型热潮。但美国的AI大模型,远不止于OpenAI的ChatGPT。

ChatGPT之外,美国大模型搞到什么程度了?

综合各种数据,虽然中国发展势头迅猛,但美国依然是全球发布大模型最多的国家,到2023年5月,其10亿级参数规模以上的基础大模型就已突破100 个。

经济学人》报道,美国2022年大模型投资总额达474亿美元,是第二名中国(134亿美元)的约3.5倍,且仍保持激增态势。高盛则进一步预测,美国2025年大模型相关投资可达千亿美元,约全球的1/2。

高盛的调查显示,罗素3000指数公司中有16%的公司在2023年的财报会议中提到了大模型,其经济学家估计,大模型将在十年内提高1%的整体劳动生产率,并为标普500指数带来约14%的增长。

除了ChatGPT,美国如今具有代表性的通用大模型公司还包括:Anthropic、Cohere以及google等。

其中,由OpenAI前高管Dario和Daniela Amodei等人于2021年自立门户创办的Anthropic,目前估值已达300亿美元,是仅次于OpenAI(约860亿美元估值)的通用大模型企业。

Anthropic拥有多位参与过GPT-2与GPT-3研发的前OpenAI核心员工,其大模型产品Claude2也被认为是仅次于ChatGPT-4的经典力作,甚至有分析师认为,Claude2的性能优于ChatGPT-4。

ChatGPT之外,美国大模型搞到什么程度了?

比如,Claude2可以处理多达约75000个单词的数据集,而ChatGPT大约是3000个,这意味着它可以处理和输出更复杂的内容,也被应用到更有挑战性的领域,比如生成数千字的长文内容。

更让Claude2积攒人气的是,它直接免费向公众开放,而不是像GPT-4一样需要付费使用。

优秀的创始团队和强大的产品性能,让Anthropic备受资本追捧,谷歌、韩国最大移动运营商之一SK Telecom(SKT)、亚马逊都已成为其投资者,其中仅亚马逊的投资就高达40亿美元。

在Anthropic之外,还有一家令人称道的公司便是Cohere。

今年6月,2019年创立的Cohere获得NVIDIA、Oracle、Salesforce Ventures等投资的2.7亿美元,成为估值20亿美元的独角兽,也是估值仅次于OpenAI和Anthropic的基础大模型公司。

Cohere同样以强大创始团队备受业内瞩目,其创始人之一Aidan Gomez是大语言模型领域开创性论文《Attention is All You Need》的最年轻作者,正是这篇文章首次提出了著名的Transformer架构,成为通用大模型发展的基础模型,ChatGPT就是在这一架构的基础上诞生。

ChatGPT之外,美国大模型搞到什么程度了?

▲Cohere推出的第一个生成式AI应用Coral

Cohere与OpenAI提供的产品类似,但它看到了“数据隐私”这个市场机会,将自己与OpenAI的定位区分开来,选择了ToB赛道,坚定地走商用大模型的路线。其产品基础能力包括三大类:文本检索,文本生成和文本分类,并且可针对客户需求,强调安全性,隐私以及定制化服务。

Cohere的另一大卖点是,不受任何云端平台限制,进而保障资料的私密安全性。它提供灵活性存储和资料隐私保护路径,可使用户实现本地部署,以满足客户资料存储不同位置的需求。

Cohere能迅速转向,找到自己的差异化定位,离不开Aidan及其联合创始人独特的人才观和创业哲学。

Aidan曾表示,Cohere寻找不同背景但对AI非常感兴趣并富有雄心的人:他不一定有大公司的漂亮履历,但是一定要对自己专注的领域有非常高的兴趣和热情,而且不光会写论文,还要有实际动手的能力。

差异化的产品战略,与众不同的团队背景,让Cohere成为通用大模型领域的一股清流。

日前,Cohere发布了全球首个公开可用的多语言理解模型,该模型基于来自母语人士的真实数据进行训练,能够阅读和理解全球超过100种最常用的语言。

再来看巨头Google 。

12月6日,Google DeepMind重磅推出了多模态AI模型Gemini,可以同时横跨文字、图片、影音、程式码等多模态进行学习与理解。

以客服机器人的应用为例,使用Gemini作为模型不仅能够从对话的字面意思上理解客户,更能同时从表情、声调接收到客户话语中的意图,能处理包括音讯、程式码、图像、视讯等内容。

ChatGPT之外,美国大模型搞到什么程度了?

据实测结果,Gemini是第一个在大模型多任务语言理解上超越人类专家的模型,且在32项AI测试中,有30项测验结果超过GPT-4。

凭借强大的性能,Gemini迅速出圈,并且为其母公司Alphabet创造巨大声量。12月7日,Google 母公司Alphabet股价涨幅5.31%,收于136.93美元,总市值达到1.72万亿美元。Google 则计划逐步将这一模型融合进其搜索、广告等其他服务中。

但谈到美国大模型,更值得重视的还是其在产业中的应用进展以及未来想象。

ChatGPT之外,美国大模型搞到什么程度了?

斯坦福大学发布的《2023年人工智能索引报告》中显示,2022年,美国的35个大模型中,只有3个大模型来自于实验室,32个都诞生于产业中。今年,也仍然保持着这一趋势。

2023年3月30日,当外界还沉浸在通用大模型涌现的狂欢中,彭博社凭一己之力将众人的注意力集中到行业新赛道。当天,它对外宣称,自己已构建出迄今为止最大的金融领域数据集,训练了专门用于金融领域大语言模型的LLM,并开发了拥有500亿参数的语言模型——BloombergGPT。

ChatGPT之外,美国大模型搞到什么程度了?

顶着全球首个金融大模型的光环,BloombergGPT依托彭博社大量的金融数据源,构建了一个3630亿个标签的数据集。高金智库分析,它可极大提高金融机构的工作效率及稳定性,协助降本增效。

在降本层面,BloombergGPT可以在投研、研发编程、风险控制及流程管理等方面减少人员投入;增效层面,它既可以通过给定的主题和语境,自动生成高质量的金融报告、财务分析报告及招股书,同时辅助会计和审计方面的工作,还可提炼梳理财经新闻或者财务信息,释放专业人力到更需要人工专业的领域。

天风证券则在报告中指出,由于BloombergGPT比ChatGPT拥有更专业的训练语料,它将在金融场景中表现出强于通用大模型的能力,进而也标志着金融领域的GPT革命已经开始。

BloombergGPT只是一个典型案例,目前,美国金融大模型已呈现出明显的三个“流派”:一是独立全栈自研,强调自主可控;二是在他人的基础上结合自身数据与场景微调,形成契合自身的金融大模型;三是从云端调用,按需接入各类大模型API做私有化部署,科技基础薄弱的中小型金融公司多采用这类方式。

据有关统计数据,美国金融AI约占整体AI领域融资的6.7%。

医疗行业,是美国大模型落地应用的另一片热土,谷歌、微软等科技巨头, Sensely、Enlitic等医疗科技公司,AbSci、Exscientia等生物医药初创企业,以及赛纽仕等CXO(医药外包)企业,都已参与其中。

化合物合成、靶点发现等新药研发业务,电子病历、辅助问诊等医院诊疗业务,则是美国医疗大模型应用的常用场景,CT(电脑断层扫描)、MRI(磁共振成像)等医疗器械在大模型赋能下进一步增强。

众多医疗大模型中,谷歌的Med-PaLM2是被关注的重点。它是第一个在美国医师执照考试(USMLE)的MEDQA数据集上达到“专家”考生水平的大模型,其准确率达85分以上;也是第一个在包括印度AIIMS和NEET医学考试问题的MEDMCQA数据集上达到及格分数的人工智能系统,得分为72.3分。

ChatGPT之外,美国大模型搞到什么程度了?

Med-PaLM2也正对行业带来变革性影响。

通过Med-PaLM2,可以分析大规模的生物医药数据,发现与疾病相关的基因、蛋白质和代谢途径,识别潜在的靶点,帮助筛选具有潜在活性的药物分子,从而缩小候选药物的范围,并优先选择具有较高活性的化合物进行后续实验验证。备受时间煎熬的新药研发,则将因此缩短研发周期,降低研发成本。

Med-PaLM2的成功,还刺激谷歌在医疗大模型领域投入更多。

如:与医疗软件公司Epic合作,开发了一种基于ChatGPT的,可向患者自动发送专业医疗信息的工具;谷歌的合作方、护理供应商Carbon Health也基于GPT-4推出了一种AI工具Carby,它可以根据医生病人之间的对话,自动生成诊断记录,大大提高医生的效率和诊断体验。目前Carby已经被130+家诊所、超过600名医疗人员使用,旧金山的一家诊所表示,使用了Carby后,其就诊病人数量增加了30%。

在谷歌之外,AI芯片巨头英伟达也在医疗大模型领域布局多年。

2021年,英伟达宣布与Schrodinger(美医疗资讯技术公司)建立战略合作关系,通过提升其计算平台的速度和精确度,实现快速、准确的评估,加速开发新的治疗方法。

2022年9月,英伟达发布了用于训练和部署超算规模的大型生物分子语言模型——BioNeMo,帮助科学家更好地了解疾病并寻找治疗优解,BioNeMo还提供云API服务支持预训练AI模型。今年7月,英伟达又向生物技术公司Recursion投资5000万美元,支持开发和训练在生物和化学领域的AI基础模型。

教育领域也是美国大模型应用落地的重要场景之一,其核心应用主要集中于语言学习、在线课程与辅助学习三个层面。其标志性案例是美国在线教育组织Khan Academy于4月发布的基于GPT-4模型,具有辅导教学、教案生成、写作训练、编程练习等功能的AI助教Khanmigo。

ChatGPT之外,美国大模型搞到什么程度了?

目前,Khan Academy已经实现商业化运作,付费标准为9美元/月或者99美元/年。其中,辅导教学可以为学生进行一对一辅导。Khanmigo会主动解释答题思路,并引导学生进行答题的思维训练,直至学生自己计算出正确答案;此外,Khanmigo还可以作为写作指导老师,根据人物特征、故事背景等具体细节,提示和建议学生以不同的切入点进行写作、辩论等,释放学生的创造力。

强大的意图理解和自然语言交流能力,以及文本和图像生成能力,让Khanmigo可以真正理解学生,有针对性地给学生提供个性化的学习建议,并且大幅提升教材的供给,包括寓教于乐的课件、丰富的课外资料等,这让教育的“千人千面”有了实现的可能,也正对行业产生重要影响。

综合来看,美国大模型还在加速与产业的融合发展,新的产业革命也正因此发生。

ChatGPT之外,美国大模型搞到什么程度了?

从全球范围来看,中美两国引领着大模型的发展。

根据《中国人工智能大模型地图研究报告》,目前全球累计发布大模型202个,其中中美两国大模型数量占全球大模型总数量的近80%。全球大模型之争实际上是中美两国的竞赛。

中国大模型的参与者同样众多,头部科技企业(阿里、百度、腾讯、华为等)、新创公司(智谱AI、百川智能等)、传统AI企业(科大讯飞、商汤科技等)以及高校研究院(清华、复旦、中科院等)均已深度布局,并正逐渐形成互联网巨头通用模型领跑、AI厂商、创业公司及科研院所百花齐放的格局。

虽然目前美国在大模型领域呈现出领跑态势,而且对中国采取了诸如禁止美国企业向中国提供云计算以及大模型训练服务等打压措施,中国大模型依然有着巨大发展机遇,并具备超越美国的基础。

首先是,中国从政府到业界都在力推大模型的发展与赶超。据《金融时报》报道,中国已在全球前十的大模型研发机构中占据四席,分别是百度、BAAI智源研究院、清华大学以及阿里巴巴研究院。百度的“文心一言”、阿里巴巴的“通义千问”等都是我国自研的大模型,其性能足以与美国的大模型一较高下。

Leonis Capital报告分析表示,相较于美国企业更加重视底层研发能力,中国百度、阿里等领先巨头之外的绝大多数企业,更偏框架、行业应用层面的研发,而这种差异将为中国带来巨大机会,让中国在生成式AI应用和大模型行业解决方案应用领域超越美国,最终以应用领先倒逼或支持基础端的赶超。

因为,中国虽然在底层研发技术上相较于美国略显逊色,但却具有超大的市场规模以及丰富的应用场景,可以为大模型的落地应用提供广阔的空间和条件,进而通过行业应用先行来带动整体的突破。

大模型一个很重要的特征是,应用和技术的双轮驱动。也就是说,消费者在使用大模型的时候,并不仅仅是贡献利润,还可以通过数据回环,使大模型获得更多的反馈,从而提升神经网络的能力。丰富的场景可以让大模型更加突出实用性,并匹配需求取得更好的效果,也带动更快的技术发展。

基于这一特征,中国若能依托巨大的市场规模以及丰富的场景,把握住应用这个关键,尊重市场规律,持续从市场应用中获得利润,再反馈给资金和人才的积累,最终在底层技术上突破将是水到渠成的事。

作为国内AI大模型领军者的李彦宏近日也在极客公园创新大会2024上表示,“大模型时代的来临,真正的价值在于原生应用。”

李彦宏认为,大模型本身并不是大多数人的创新和创业机会,原生应用才是。无论对于大厂,还是中小企业,创业者,原生应用都是很大的机会。

李彦宏说,看到媒体、社会、公众主要的兴奋点还在基础模型上,没有转到AI原生应用上,“我多多少少有点着急。”最近几次公开发言,也括公司内部讲话,他也都是在不停的强调。“我们一定要去卷AI的原生应用,要把这个东西做出来了,你的模型才有价值。”

事实上,中国已经在互联网与移动互联网领域,通过丰富的场景以及应用创新取得领先的发展,并最终带动整个科技产业的进步,在大模型领域,这一趋势也正在继续。但对比中美在互联网领域的发展,有一点倒是值得中国大模型企业现在就高度重视:更早地在海外布局,朝向全球化发展。

如今的中国企业,也更有基础出海,在全球市场找到更加广阔的发展空间。



Tags:大模型   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
AI程序员上岗 垂类大模型应用迎来井喷期
能自动写代码的“AI员工”、逐渐告别不够好用的智能客服,无需费时费力开发的工业AI控制器……随着人工智能大模型能力开始深入多个行业,IT、工业生产、金融、服务...【详细内容】
2024-04-08  Search: 大模型  点击:(4)  评论:(0)  加入收藏
AI程序员上岗 垂类大模型应用迎来井喷期
能自动写代码的“AI员工”、逐渐告别不够好用的智能客服,无需费时费力开发的工业AI控制器……随着人工智能大模型能力开始深入多个行业,IT、工业生产、金融、服务...【详细内容】
2024-04-07  Search: 大模型  点击:(3)  评论:(0)  加入收藏
AI干掉声优?音频大模型追逐“图灵时刻”
七十年前,“人工智能之父”图灵提出,如果人无法判断屏幕的另一侧究竟是人还是机器,就证明机器具备了人一样的智能。这一经典的图灵测试如同北斗星一般,指引着AI行业的工作者们不...【详细内容】
2024-04-03  Search: 大模型  点击:(5)  评论:(0)  加入收藏
大模型Kimi火了,长文本“卷”出新高度
近日,AI智能助手Kimi宣布支持200万字无损上下文,在长上下文窗口技术上再次取得突破,引燃人工智能领域新一轮投资热情。  摄影/宁颖OpenAI官方去年11月发布的GPT-4 Turbo,支持1...【详细内容】
2024-03-29  Search: 大模型  点击:(13)  评论:(0)  加入收藏
大模型应用的 10 种架构模式
作者 | 曹洪伟在塑造新领域的过程中,我们往往依赖于一些经过实践验证的策略、方法和模式。这种观念对于软件工程领域的专业人士来说,已经司空见惯,设计模式已成为程序员们的重...【详细内容】
2024-03-27  Search: 大模型  点击:(13)  评论:(0)  加入收藏
超长文本是AI大模型的能力突破口吗?
◎记者 刘怡鹤近日,能“一口气读完20万字小说”的AI大模型应用Kimi再次为国内AI产业添了一把火。业内认为,国产大模型能力提升或成今年国内AI领域最核心的主线。超长上下文是...【详细内容】
2024-03-26  Search: 大模型  点击:(8)  评论:(0)  加入收藏
百度AI“咬”了一口苹果 大模型商用有戏了?
百度3月25日突传利好。据知情人士透露,百度将为苹果今年发布的iPhone16、Mac系统和ios18提供AI功能。消息人士称,苹果曾与阿里以及另外一家国产大模型公司进行过洽谈,最后确定...【详细内容】
2024-03-26  Search: 大模型  点击:(17)  评论:(0)  加入收藏
Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
从ChapGPT到Sora,从数千亿参数到千万长文本,大模型浪潮下,永远不缺热点。近日,“Kimi概念股暴涨”“Kimi为宕机道歉”等词条先后冲上微博热搜,让月之暗面这家刚成立一年的人工智...【详细内容】
2024-03-25  Search: 大模型  点击:(15)  评论:(0)  加入收藏
Kimi爆了 国产大模型应用元年还远吗?
国产大模型应用Kimi近日可谓横空出世。根据Similarweb数据,Kimi智能助手的周度访问量由23年12月初的15万提升至近期(3.10-3.16)的超过200万,APP端下载量也快速提升,从2月初的效率...【详细内容】
2024-03-22  Search: 大模型  点击:(14)  评论:(0)  加入收藏
国产大模型开卷“比谁长”?Kimi爆火点燃长文本竞争赛道
来源:财联社近日,又一现象级AI应用Kimi爆火出圈,在用户端和资本市场都掀起波澜,引发多个Kimi相关概念股异常波动。海天瑞声(688787.SH)、中广天择(603721.SH)等上市公司纷纷回应“无...【详细内容】
2024-03-22  Search: 大模型  点击:(5)  评论:(0)  加入收藏
▌简易百科推荐
多方热议人工智能产业新机遇
编者按  从前沿科技展会到高层对话平台,从上海、重庆到博鳌,从线上到线下……一场场高规格、大规模的盛会中,人工智能正在成为各界热议的高频词。赋能千...【详细内容】
2024-04-08    中国家电网  Tags:人工智能   点击:(4)  评论:(0)  加入收藏
​人形机器人时代来了吗
日前,由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】
2024-04-08    中国青年报  Tags:​人形机器人   点击:(4)  评论:(0)  加入收藏
AI重塑社交:腾讯与字节跳动的新赛场
文|新火种 一号编辑|美美最近,腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品,尽管腾讯和字节跳动在前段时间刚刚“破冰”,但这一举措不仅意味着这两大巨头之...【详细内容】
2024-04-07    蓝鲸财经  Tags:AI   点击:(7)  评论:(0)  加入收藏
第一批用 Kimi 做内容的网红已经杀疯了
作者:王东东 文章来自:斗战圣佛小组技术信仰派 VS 市场信仰派 朱啸虎和月之暗面老板杨植麟在前几天有一场不算 battle 的 battle。battle 的争论点是:大模型有没有戏。技术派...【详细内容】
2024-04-04    斗战圣佛小组  Tags:Kimi   点击:(4)  评论:(0)  加入收藏
昆仑万维发布面向人工智能时代的六条人才宣言
过去的一年多,是人工智能取得非凡进步的一年。在这充满突破性技术飞跃和备受争议的一年里,我们见证了人工智能的快速发展和广泛的影响,人工智能已经迅速地融入了我们的生活,深刻...【详细内容】
2024-04-03    砍柴网  Tags:昆仑万维   点击:(7)  评论:(0)  加入收藏
AI干掉声优?音频大模型追逐“图灵时刻”
七十年前,“人工智能之父”图灵提出,如果人无法判断屏幕的另一侧究竟是人还是机器,就证明机器具备了人一样的智能。这一经典的图灵测试如同北斗星一般,指引着AI行业的工作者们不...【详细内容】
2024-04-03    第一财经网  Tags:AI   点击:(5)  评论:(0)  加入收藏
生成式人工智能有哪些新趋势?
相较于去年,当下我们所能体验的人工智能技术的范围已经大幅提升。从搜索引擎、电商平台再到社媒平台,只要是以搜索结果为导向的内容,都会出现它的身影。但其实,人工智能的应用场...【详细内容】
2024-04-03  品谈教师帮    Tags:人工智能   点击:(6)  评论:(0)  加入收藏
AI世界的新难题:互联网的信息不够用了!
高质量数据的紧缺正成为AI发展的重要障碍。4月1日,据媒体报道,随着OpenAI、Google等企业不断深入发展AI技术,科技巨头们遇到了一个新问题:现有的互联网信息量可能不足以支撑他们...【详细内容】
2024-04-02  硬AI    Tags:AI   点击:(6)  评论:(0)  加入收藏
今天起,ChatGPT无需注册就能用了!
 来源:量子位    金磊 克雷西 发自 凹非寺  就在刚刚,OpenAI狠狠地open了一把:从今天起,ChatGPT打开即用,无需再注册帐号和登录了!  像这样,直接登录网站,然后就可以开启对...【详细内容】
2024-04-02    量子位   Tags:ChatGPT   点击:(7)  评论:(0)  加入收藏
AI时代,面对死亡有了第二种选择?
今年春节期间,罗佩玺瞒着妈妈用AI技术“复活”了外婆,她将妈妈现在的模样和外婆留下的老照片合成在一起。时隔60多年,妈妈和外婆终于又“见面”了,这是她送给妈妈的生日礼物。收...【详细内容】
2024-04-02    中国青年报  Tags:AI时代   点击:(7)  评论:(0)  加入收藏
站内最新
站内热门
站内头条