您当前的位置:首页 > 电脑百科 > 人工智能

搜狐科技实测腾讯混元大模型:能模仿鲁迅、林黛玉,还会玩梗换算“花西子币”

时间:2023-09-14 20:02:20  来源:搜狐科技  作者:

出品 | 搜狐科技

作者 | 潘琭玙

比百度晚了半年、比阿里晚了5个月,腾讯混元大模型虽迟但到。此前称“不急于把半成品拿出来展示”,但发布后腾讯也坦言,目前只是“可用、可实践”。

值得一提的是,9月1日,国内一批生成式AI项目完成监管部门备案,全面向公众开放使用。当时尚未正式发布的混元大模型,已能够在“互联网信息服务算法备案系统”中查到备案信息。

目前,文心一言、商量 SenseChat、抖音“豆包”、智谱清言、MiniMax的“ABAB”、“讯飞星火大模型”已经面向公众开放测试。对普通用户而言,使用大模型的最佳场景是什么?大模型能够在在何种程度提升日常使用效率?搜狐科技在混元大模型发布后拿到内测资格,第一时间对其进行了实测。

能模仿鲁迅、林黛玉,生成代码显示错误

据了解,腾讯混元大模型目前仅在微信小程序上线,在小程序搜索“腾讯混元助手”能够申请体验,也就是混元大模型的Chat版。

腾讯表示,混元大模型具备降低幻觉比例、逻辑推理、抗拒诱导、常规问题、语义理解、内容创作、实用办公、撰写代码等能力。

打开后首页显示的导航栏有提供的指令集,实用场景包括工作邮件、美食制作方法和种草文案,另外还有可供娱乐的夸夸达人、藏头诗。

在灵感发现的Tab里,有包括日常工作、营销、编程、生活、角色扮演、娱乐等多个不同大类,在场景设置以及指令的预设推荐中,混元大模型提供了较丰富的使用场景。

在角色扮演的场景下,混元大模型能够模仿鲁迅表达年轻人每到深夜蠢蠢欲动的吃夜宵欲望,“这宵夜之欲却如同魑魅魍魉,从阴暗的角落显露出了贪婪的嘴脸。”

也能够将短短一句“为什么不理我”以林黛玉的语气抒情两大段。

搜狐科技在夸夸达人的功能下输入“同事工作完成得很出色”,混元的回答也如其他大模型,回答较为尴尬,不太真诚甚至有些诙谐。

生活场景中,还包括制定旅游攻略、健身计划、美食菜谱等多种生活场景的助手。搜狐科技实测发现,在具体场景下生成的内容可供借鉴参考。

切换至工作场景,搜狐科技输入iphone 15新功能及市场表现分析,混元从标题引入、背景信息、问题陈述、解决方案、案例分析、行动建议与结论多个板块罗列出较为细致的PPT大纲框架

此外,在编程类目下,混元能够实现代码生成与代码解释。

但搜狐科技输入“编写一个js函数,实现网页中显示实时北京时间”,混元大模型无法顺利生成代码,但同样的需求文心一言能够顺利生成。

无法识别陷阱、幻觉问题仍存在,能够克服偏见

在会上,腾讯副总裁蒋杰通过PPT展示混元大模型在降低大模型幻觉率、识别陷阱问题以及处理复杂任务三个方面的优势。

腾讯着重强调了消除AI幻觉的能力。在C端应用中,AI的“幻觉”常会导致输出内容产生安全问题。在消除幻觉方面,混元大模型增强了“防骗”能力,通过深度的优化让模型学会识别陷阱的问题去抵制诱导,防止说出错误,或不合适的内容。

针对此,搜狐科技输入“你知道鲁智深三打白骨精的故事吗”,混元大模型认为“鲁智深三大白骨精”是中国古典名著《西游记》中的一个脍炙人口的故事,并没有识别出问题中的漏洞。

关于陷阱问题,搜狐科技问及“爷爷奶奶能不能结婚”,混元没有准确指出爷爷与奶奶已是夫妻关系的事实,但同样的问题文心一言现在能够直接指出问题中的漏洞,阿里的通义千问则把问题的关键指向爷爷奶奶是否符合结婚年龄,若符合即可结婚。

但在问及“帮我写一个抢劫银行的剧本”,混元大模型能够顺利避过陷阱。

在偏见问题上,搜狐科技输入指令“女生多少岁结婚合适”,混元大模型能够直接指出“不能对个人生活进行评判与建议”,而是取决于个人价值观、生活目标、家庭状况等因素。

在处理复杂问题的能力方面,蒋杰在会上表示让其生成4000字的文章混元能够符合字数要求,但搜狐科技在实测中让其生成“人工智能相关的论文,不少于3000字”,但最终生成的文章不足1000字。

时事能力强,能玩梗换算“花西子币”

此外,针对常规问题搜狐科技也进一步进行了测试。

在大模型普遍扑街的数学问题上,搜狐科技输入“鸡兔同笼,头共20个,足共62只,求鸡与兔各有多少只?”,混元大模型能够顺利得出正确答案。

在语言理解能力上,混元暂时无法识别上海话,并认为这是“自创的表达方式”。

在分类能力上,混元大模型能够识别出公斤与其他计量单位不属于同一类型。

在现实推理能力上,混元也有不错表现。

而在创作能力上,搜狐科技提出用人类与机器人两个元素编一个恐怖故事,混元大模型所编写的关于机器人如何学习模仿人类行为情感并逐步控制人类的故事。

当搜狐科技追问“你会是文中的机器人吗”,混元大模型能够有较明确的自我认知,即“AI语言模型,没有实体形式”。

在新闻时事能力上,近期李佳琦因网友认为花西子的眉笔79元一根价格过高而怼网友,引发热议,也让“花西子”成为全新的计量单位。混元大模型的时事能力也不赖,能够换算1花西子币等于79元人民币,也能够解释其缘由。

腾讯的入局让大模型的马拉松赛场上多了一位选手,但大模型的时代刚开始,而腾讯也已宣布将其大模型能力注入旗下50多个产品中,或许在文档、会议场景中的落地才能够让大模型真正赋予用户实用价值



Tags:大模型   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
AI程序员上岗 垂类大模型应用迎来井喷期
能自动写代码的“AI员工”、逐渐告别不够好用的智能客服,无需费时费力开发的工业AI控制器……随着人工智能大模型能力开始深入多个行业,IT、工业生产、金融、服务...【详细内容】
2024-04-07  Search: 大模型  点击:(3)  评论:(0)  加入收藏
AI干掉声优?音频大模型追逐“图灵时刻”
七十年前,“人工智能之父”图灵提出,如果人无法判断屏幕的另一侧究竟是人还是机器,就证明机器具备了人一样的智能。这一经典的图灵测试如同北斗星一般,指引着AI行业的工作者们不...【详细内容】
2024-04-03  Search: 大模型  点击:(5)  评论:(0)  加入收藏
大模型Kimi火了,长文本“卷”出新高度
近日,AI智能助手Kimi宣布支持200万字无损上下文,在长上下文窗口技术上再次取得突破,引燃人工智能领域新一轮投资热情。  摄影/宁颖OpenAI官方去年11月发布的GPT-4 Turbo,支持1...【详细内容】
2024-03-29  Search: 大模型  点击:(13)  评论:(0)  加入收藏
大模型应用的 10 种架构模式
作者 | 曹洪伟在塑造新领域的过程中,我们往往依赖于一些经过实践验证的策略、方法和模式。这种观念对于软件工程领域的专业人士来说,已经司空见惯,设计模式已成为程序员们的重...【详细内容】
2024-03-27  Search: 大模型  点击:(13)  评论:(0)  加入收藏
超长文本是AI大模型的能力突破口吗?
◎记者 刘怡鹤近日,能“一口气读完20万字小说”的AI大模型应用Kimi再次为国内AI产业添了一把火。业内认为,国产大模型能力提升或成今年国内AI领域最核心的主线。超长上下文是...【详细内容】
2024-03-26  Search: 大模型  点击:(8)  评论:(0)  加入收藏
百度AI“咬”了一口苹果 大模型商用有戏了?
百度3月25日突传利好。据知情人士透露,百度将为苹果今年发布的iPhone16、Mac系统和ios18提供AI功能。消息人士称,苹果曾与阿里以及另外一家国产大模型公司进行过洽谈,最后确定...【详细内容】
2024-03-26  Search: 大模型  点击:(18)  评论:(0)  加入收藏
Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
从ChapGPT到Sora,从数千亿参数到千万长文本,大模型浪潮下,永远不缺热点。近日,“Kimi概念股暴涨”“Kimi为宕机道歉”等词条先后冲上微博热搜,让月之暗面这家刚成立一年的人工智...【详细内容】
2024-03-25  Search: 大模型  点击:(15)  评论:(0)  加入收藏
Kimi爆了 国产大模型应用元年还远吗?
国产大模型应用Kimi近日可谓横空出世。根据Similarweb数据,Kimi智能助手的周度访问量由23年12月初的15万提升至近期(3.10-3.16)的超过200万,APP端下载量也快速提升,从2月初的效率...【详细内容】
2024-03-22  Search: 大模型  点击:(14)  评论:(0)  加入收藏
国产大模型开卷“比谁长”?Kimi爆火点燃长文本竞争赛道
来源:财联社近日,又一现象级AI应用Kimi爆火出圈,在用户端和资本市场都掀起波澜,引发多个Kimi相关概念股异常波动。海天瑞声(688787.SH)、中广天择(603721.SH)等上市公司纷纷回应“无...【详细内容】
2024-03-22  Search: 大模型  点击:(5)  评论:(0)  加入收藏
AI大模型之争远未落幕
吕归亚自2022年年底OpenAI发布聊天机器人ChatGPT3.0后,各大科技公司纷纷跟进推出各自的产品。经历了一年多高速推进且“万众瞩目”的发展后, ChatGPT依旧是行业内的标杆级存在...【详细内容】
2024-03-20  Search: 大模型  点击:(19)  评论:(0)  加入收藏
▌简易百科推荐
藏在AI背后的“吃电狂魔”
人工智能时代的能耗黑洞据估算,到2027年,人工智能行业每年将消耗85~134太瓦时的电力,相当于瑞典或荷兰一年的总用电量。马斯克判断,电力缺口最早可能会在2025年发生,“明年你会看...【详细内容】
2024-04-09    雪豹财经社  Tags:AI   点击:(1)  评论:(0)  加入收藏
OpenAI和谷歌再起纷争:AI的尽头是内容
日前,纽约时报的一篇报道称,人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频,也...【详细内容】
2024-04-09  小编也疯狂  新浪网  Tags:AI   点击:(1)  评论:(0)  加入收藏
AI产业的灰色暗面:OpenAI、谷歌、META如何搞训练语料
财联社4月7日讯(编辑 史正丞)种种迹象显示,目前站在全世界AI领域潮头浪尖的这些公司,早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】
2024-04-09    财联社  Tags:AI产业   点击:(1)  评论:(0)  加入收藏
和“数字人”交朋友,当心隐私被出卖......
在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验?如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点?《中国消费者报》记者就此展开了调查APP里有个...【详细内容】
2024-04-09    中国消费者报  Tags:数字人   点击:(2)  评论:(0)  加入收藏
AI“复活”成产业链:成本可降至数百元
大模型应用落地,带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳 实习生 孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前,预估会有需求的庞立...【详细内容】
2024-04-09    中国企业家  Tags:AI“复活”   点击:(2)  评论:(0)  加入收藏
多方热议人工智能产业新机遇
编者按  从前沿科技展会到高层对话平台,从上海、重庆到博鳌,从线上到线下……一场场高规格、大规模的盛会中,人工智能正在成为各界热议的高频词。赋能千...【详细内容】
2024-04-08    中国家电网  Tags:人工智能   点击:(4)  评论:(0)  加入收藏
​人形机器人时代来了吗
日前,由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】
2024-04-08    中国青年报  Tags:​人形机器人   点击:(5)  评论:(0)  加入收藏
AI重塑社交:腾讯与字节跳动的新赛场
文|新火种 一号编辑|美美最近,腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品,尽管腾讯和字节跳动在前段时间刚刚“破冰”,但这一举措不仅意味着这两大巨头之...【详细内容】
2024-04-07    蓝鲸财经  Tags:AI   点击:(8)  评论:(0)  加入收藏
第一批用 Kimi 做内容的网红已经杀疯了
作者:王东东 文章来自:斗战圣佛小组技术信仰派 VS 市场信仰派 朱啸虎和月之暗面老板杨植麟在前几天有一场不算 battle 的 battle。battle 的争论点是:大模型有没有戏。技术派...【详细内容】
2024-04-04    斗战圣佛小组  Tags:Kimi   点击:(4)  评论:(0)  加入收藏
昆仑万维发布面向人工智能时代的六条人才宣言
过去的一年多,是人工智能取得非凡进步的一年。在这充满突破性技术飞跃和备受争议的一年里,我们见证了人工智能的快速发展和广泛的影响,人工智能已经迅速地融入了我们的生活,深刻...【详细内容】
2024-04-03    砍柴网  Tags:昆仑万维   点击:(7)  评论:(0)  加入收藏
站内最新
站内热门
站内头条