您当前的位置:首页 > 电脑百科 > 人工智能

混元大模型终于亮相,全链路自研降低大模型幻觉,腾讯慢工出细活

时间:2023-09-08 16:33:34  来源:时代在线网  作者:
图源:视觉中国

备受市场期待的腾讯自研通用大模型“混元”,终于浮出水面。

在9月7日举办的2023腾讯全球数字生态大会上,腾讯混元大模型正式亮相,并宣布通过腾讯云对外开放。

据腾讯集团高级执行副总裁、腾讯云与智慧产业事业群CEO汤道生介绍,混元大模型拥有超千亿参数规模,预训练语料超2万亿tokens,具有强大的中文理解与创作能力、逻辑推理能力,以及可靠的任务执行能力,并在解决大模型常见的“幻觉”问题上取得了明显进步。

混元大模型与其他大模型的效果对比,图片来源:腾讯方面提供

此时国内首批大模型应用刚刚通过备案上线,更大规模的市场终于向这一新兴技术开放,国产大模型的混战因此开始进入全新的竞争阶段,卷应用而不是卷技术,成为业界共识。

混元大模型,同样以“实用级”大模型自居。腾讯方面指出,混元大模型从实践中来,其技术积累来自腾讯丰富的应用场景,且经过多个业务场景充分磨炼,是多次迭代之后的通用技术底座,更能满足应用需要。

并要向实践中去。据汤道生透露,目前,腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等超过50个腾讯业务和产品,已经接入腾讯混元大模型测试,并取得初步效果。

与此同时,汤道生指出,混元大模型还将作为腾讯云MaaS服务的底座,客户不仅可以直接通过API调用混元,也可以将混元作为基底模型,开发不同产业场景的应用。

从这个角度来看,腾讯再一次展露出它的狡黠。在一场又一场激烈的战役之中,这家互联网大厂或许并不会在第一个抵达战场,但它会花更长的时间排兵布阵、筹备军粮,在最关键的时刻,用最好的状态冲向沙场。

慢工出细活

在大模型战场上,混元大模型似乎来得有些迟。

早在6个月前,百度就曾发布文心一言。阿里通义千问、科大迅速星火、华为盘古等一众大模型紧跟百度的步伐,在接下来的两三个月时间内密集发布。赛迪顾问数据显示,截至 2023 年 7 月,中国累计已经有130个大模型问世。

市场因此担心,腾讯会错失先发优势,在后续竞争中处于被动地位。

但在腾讯内部,有着完全不一样的看法。早在今年5月,腾讯董事会主席马化腾就曾对外指出,我们认为这是几百年不遇的、类似发明电的工业革命一样的机遇。我们也一样在埋头研发,但是并不急于早早做完,把半成品拿出来展示。

“对于工业革命来讲,早一个月把电灯泡拿出来在长的时间跨度上来看是不那么重要的。关键还是要把底层的算法、算力和数据扎扎实实做好。”

相比国内部分厂商直接调用国外开源模型进行训练的方法,腾讯自研大模型因此走向一条更难但更为正确的道路。

据腾讯集团副总裁蒋杰介绍,混元大模型从第一个token开始从零训练,掌握了从模型算法到机器学习框架,再到AI基础设施的全链路自研技术。

腾讯集团副总裁蒋杰,图片来源:腾讯方面提供

冷启动、从零开始,腾讯自研大模型所需时间因此被大大拉长。但也正是得益于此,腾讯才能在一些困扰业界的问题上找到突破口。

如此前不断被讨论的大模型“幻觉”问题。正是因为正确率无法保证,大模型实际的应用场景才会被局限在容错率高、任务简单的休闲场景,无法进一步深入。腾讯为此在算法层面进行了一系列自研创新,提高了模型可靠性和成熟度。

如针对大模型容易“胡言乱语”的问题,腾讯优化了预训练算法及策略,让混元大模型的幻觉相比主流开源大模型降低了30%至50%;通过强化学习的方法,让模型学会识别陷阱问题,可以拒绝回答不恰当的用户问题;通过位置编码优化,提高了超长文的处理效果和性能。

此外,腾讯的研发团队还提出了思维链的新策略,能够让大模型能够像人一样结合实际的应用场景进行推理和决策。

与此同时,蒋杰指出,腾讯的自研机器学习框架Angel让训练速度相比业界主流框架提升1倍,推理速度比业界主流框架提升1.3倍。

混元大模型因此更能理解上下文的含义,并且有长文记忆能力,可以流畅地进行专业领域的多轮对话。而在文学创作、文本摘要、角色扮演等内容创作上,混元大模型做到充分理解用户意图,并高效、准确的给出有时效性的答复。

在发布会上,蒋杰用中国信通院《大规模预训练模型技术和应用的评估方法》的标准符合性测试结果,来展现混元大模型的能力水平。

在该项评测中,混元大模型共测评66个能力项,在“模型开发”和“模型能力”两个重要领域的综合评价均获得了当前的最高分。在主流的评测集MMLU、CEval和AGI-eval上,混元大模型均有优异的表现。

全面拥抱大模型

在互联网江湖内,腾讯一直以对产品的精细化调整闻名。这家以社交产品起家的大厂,愿意为一些极其细致的问题做长期持续的投入,将产品做到极致。在国产大模型这场混战之中,腾讯再度展现出其“产品经理”的底色。

“我们研发大模型的目标不是在评测上获得高分,而是将技术应用到实际场景中。腾讯将全面拥抱大模型。”蒋杰如此表示。

腾讯将要全面拥抱大模型,图片来源:腾讯方面提供

目前,腾讯已经在丰富的内部场景和应用上,对混元大模型进行了反复锤炼。目前,腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等超过50个腾讯业务和产品,已经接入腾讯混元大模型测试,并取得初步效果。

发布会上,蒋杰具体展示了腾讯会议、腾讯文档、腾讯广告等多个业务接入腾讯混元大模型后的实际应用情况。

比如腾讯会议基于混元大模型打造了AI小助手,只需要简单的自然语言指令,就能完成会议信息提取、内容分析等复杂任务,会后还能生成智能总结纪要。据实测,在指令理解、会中问答、会议摘要、会议待办项等多个方面,混元大模型均获得较高的用户采纳率。

在文档处理方面,腾讯混元大模型支持数十种文本创作场景,在腾讯文档推出的智能助手功能中已有应用。同时,混元还能够一键生成标准格式文本,精通数百种Excel公式,支持自然语言生成函数,并基于表格内容生成图表,目前这些功能正在内测阶段,将在成熟后面向用户开放。

在广告业务场景,腾讯混元大模型支持智能化的广告素材创作,能够适应行业与地域特色,满足千人千面的需求,实现文字、图片、视频的自然融合。此外,基于混元大模型的能力,广告智能导购能够帮助商家在企业微信等场景,提升服务质量和服务效率。

与此同时,微信的腾讯混元助手小程序也已经开放内测申请,目前正在排队审核期。该助手支持AI问答,可以回答各类问题,也能处理多种任务,如获取知识、解决数学问题、翻译、提供旅游攻略、工作建议等,可以看作是小程序版的“ChatGPT”。

不过在会后群访环节中,蒋杰透露,混元大模型已经向相关部门备案,且已获批。但目前混元大模型的C端基本还是以内部应用和结合一定场景做尝试为主。

基于行业场景的B端需求,仍是混元大模型目前落地的主要方向。今年6月,腾讯云推出了MaaS解决方案,提供涵盖模型预训练、模型精调、智能应用开发等一站式的行业大模型服务。

近期,腾讯云也全面接入Llama 2、Bloom等20多个主流模型,和混元大模型一样,都支持直接部署调用。客户可以根据实际需求,基于混元大模型或开源大模型,打造自己专属的行业大模型。



Tags:混元大模型   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入
揭开大模型“混元”的面纱两个月后,10月26日,腾讯混元迎来第一次“批量上新”,并且对外开放。首先,通过测试申请的用户,都能够在“混元”上画画了——从生成图像的准确...【详细内容】
2023-10-30  Search: 混元大模型  点击:(183)  评论:(0)  加入收藏
搜狐科技实测腾讯混元大模型:能模仿鲁迅、林黛玉,还会玩梗换算“花西子币”
出品 | 搜狐科技作者 | 潘琭玙比百度晚了半年、比阿里晚了5个月,腾讯混元大模型虽迟但到。此前称“不急于把半成品拿出来展示”,但发布后腾讯也坦言,目前只是“可用、可实践”...【详细内容】
2023-09-14  Search: 混元大模型  点击:(356)  评论:(0)  加入收藏
迟来的混元大模型,能为腾讯带来多大能量?
腾讯在9月7日召开的数字生态大会上,正式发布了“混元大模型”。在大模型竞赛风起云涌的上半场,腾讯的动作并不算快。最早发布大模型的巨头是百度。今年3月16日,百度宣布正式推...【详细内容】
2023-09-12  Search: 混元大模型  点击:(263)  评论:(0)  加入收藏
腾讯混元大模型亮相:全链路自主研发
9月7日,在2023腾讯全球数字生态大会上,腾讯首次公开了完全自主研发的通用大语言模型——腾讯混元大模型。得益于全链路自研技术,腾讯混元大模型能够理解上下文的含义...【详细内容】
2023-09-09  Search: 混元大模型  点击:(206)  评论:(0)  加入收藏
混元大模型终于亮相,全链路自研降低大模型幻觉,腾讯慢工出细活
图源:视觉中国备受市场期待的腾讯自研通用大模型“混元”,终于浮出水面。在9月7日举办的2023腾讯全球数字生态大会上,腾讯混元大模型正式亮相,并宣布通过腾讯云对外开放。据腾讯...【详细内容】
2023-09-08  Search: 混元大模型  点击:(261)  评论:(0)  加入收藏
腾讯混元大模型首次亮相,50多个业务进入测试期
摘要:腾云大模型姗姗来迟,但绝对来势汹汹,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等多个腾讯内部业务和产品都开启测试,似乎...【详细内容】
2023-09-07  Search: 混元大模型  点击:(77)  评论:(0)  加入收藏
▌简易百科推荐
藏在AI背后的“吃电狂魔”
人工智能时代的能耗黑洞据估算,到2027年,人工智能行业每年将消耗85~134太瓦时的电力,相当于瑞典或荷兰一年的总用电量。马斯克判断,电力缺口最早可能会在2025年发生,“明年你会看...【详细内容】
2024-04-09    雪豹财经社  Tags:AI   点击:(1)  评论:(0)  加入收藏
OpenAI和谷歌再起纷争:AI的尽头是内容
日前,纽约时报的一篇报道称,人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频,也...【详细内容】
2024-04-09  小编也疯狂  新浪网  Tags:AI   点击:(1)  评论:(0)  加入收藏
AI产业的灰色暗面:OpenAI、谷歌、META如何搞训练语料
财联社4月7日讯(编辑 史正丞)种种迹象显示,目前站在全世界AI领域潮头浪尖的这些公司,早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】
2024-04-09    财联社  Tags:AI产业   点击:(1)  评论:(0)  加入收藏
和“数字人”交朋友,当心隐私被出卖......
在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验?如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点?《中国消费者报》记者就此展开了调查APP里有个...【详细内容】
2024-04-09    中国消费者报  Tags:数字人   点击:(2)  评论:(0)  加入收藏
AI“复活”成产业链:成本可降至数百元
大模型应用落地,带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳 实习生 孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前,预估会有需求的庞立...【详细内容】
2024-04-09    中国企业家  Tags:AI“复活”   点击:(2)  评论:(0)  加入收藏
多方热议人工智能产业新机遇
编者按  从前沿科技展会到高层对话平台,从上海、重庆到博鳌,从线上到线下……一场场高规格、大规模的盛会中,人工智能正在成为各界热议的高频词。赋能千...【详细内容】
2024-04-08    中国家电网  Tags:人工智能   点击:(4)  评论:(0)  加入收藏
​人形机器人时代来了吗
日前,由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】
2024-04-08    中国青年报  Tags:​人形机器人   点击:(5)  评论:(0)  加入收藏
AI重塑社交:腾讯与字节跳动的新赛场
文|新火种 一号编辑|美美最近,腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品,尽管腾讯和字节跳动在前段时间刚刚“破冰”,但这一举措不仅意味着这两大巨头之...【详细内容】
2024-04-07    蓝鲸财经  Tags:AI   点击:(8)  评论:(0)  加入收藏
第一批用 Kimi 做内容的网红已经杀疯了
作者:王东东 文章来自:斗战圣佛小组技术信仰派 VS 市场信仰派 朱啸虎和月之暗面老板杨植麟在前几天有一场不算 battle 的 battle。battle 的争论点是:大模型有没有戏。技术派...【详细内容】
2024-04-04    斗战圣佛小组  Tags:Kimi   点击:(4)  评论:(0)  加入收藏
昆仑万维发布面向人工智能时代的六条人才宣言
过去的一年多,是人工智能取得非凡进步的一年。在这充满突破性技术飞跃和备受争议的一年里,我们见证了人工智能的快速发展和广泛的影响,人工智能已经迅速地融入了我们的生活,深刻...【详细内容】
2024-04-03    砍柴网  Tags:昆仑万维   点击:(7)  评论:(0)  加入收藏
站内最新
站内热门
站内头条