您当前的位置:首页 > 电脑百科 > 人工智能

搜狐科技实测腾讯混元大模型:能模仿鲁迅、林黛玉,还会玩梗换算“花西子币”

时间:2023-09-14 20:02:20  来源:搜狐科技  作者:

出品 | 搜狐科技

作者 | 潘琭玙

比百度晚了半年、比阿里晚了5个月,腾讯混元大模型虽迟但到。此前称“不急于把半成品拿出来展示”,但发布后腾讯也坦言,目前只是“可用、可实践”。

值得一提的是,9月1日,国内一批生成式AI项目完成监管部门备案,全面向公众开放使用。当时尚未正式发布的混元大模型,已能够在“互联网信息服务算法备案系统”中查到备案信息。

目前,文心一言、商量 SenseChat、抖音“豆包”、智谱清言、MiniMax的“ABAB”、“讯飞星火大模型”已经面向公众开放测试。对普通用户而言,使用大模型的最佳场景是什么?大模型能够在在何种程度提升日常使用效率?搜狐科技在混元大模型发布后拿到内测资格,第一时间对其进行了实测。

能模仿鲁迅、林黛玉,生成代码显示错误

据了解,腾讯混元大模型目前仅在微信小程序上线,在小程序搜索“腾讯混元助手”能够申请体验,也就是混元大模型的Chat版。

腾讯表示,混元大模型具备降低幻觉比例、逻辑推理、抗拒诱导、常规问题、语义理解、内容创作、实用办公、撰写代码等能力。

打开后首页显示的导航栏有提供的指令集,实用场景包括工作邮件、美食制作方法和种草文案,另外还有可供娱乐的夸夸达人、藏头诗。

在灵感发现的Tab里,有包括日常工作、营销、编程、生活、角色扮演、娱乐等多个不同大类,在场景设置以及指令的预设推荐中,混元大模型提供了较丰富的使用场景。

在角色扮演的场景下,混元大模型能够模仿鲁迅表达年轻人每到深夜蠢蠢欲动的吃夜宵欲望,“这宵夜之欲却如同魑魅魍魉,从阴暗的角落显露出了贪婪的嘴脸。”

也能够将短短一句“为什么不理我”以林黛玉的语气抒情两大段。

搜狐科技在夸夸达人的功能下输入“同事工作完成得很出色”,混元的回答也如其他大模型,回答较为尴尬,不太真诚甚至有些诙谐。

生活场景中,还包括制定旅游攻略、健身计划、美食菜谱等多种生活场景的助手。搜狐科技实测发现,在具体场景下生成的内容可供借鉴参考。

切换至工作场景,搜狐科技输入iphone 15新功能及市场表现分析,混元从标题引入、背景信息、问题陈述、解决方案、案例分析、行动建议与结论多个板块罗列出较为细致的PPT大纲框架

此外,在编程类目下,混元能够实现代码生成与代码解释。

但搜狐科技输入“编写一个js函数,实现网页中显示实时北京时间”,混元大模型无法顺利生成代码,但同样的需求文心一言能够顺利生成。

无法识别陷阱、幻觉问题仍存在,能够克服偏见

在会上,腾讯副总裁蒋杰通过PPT展示混元大模型在降低大模型幻觉率、识别陷阱问题以及处理复杂任务三个方面的优势。

腾讯着重强调了消除AI幻觉的能力。在C端应用中,AI的“幻觉”常会导致输出内容产生安全问题。在消除幻觉方面,混元大模型增强了“防骗”能力,通过深度的优化让模型学会识别陷阱的问题去抵制诱导,防止说出错误,或不合适的内容。

针对此,搜狐科技输入“你知道鲁智深三打白骨精的故事吗”,混元大模型认为“鲁智深三大白骨精”是中国古典名著《西游记》中的一个脍炙人口的故事,并没有识别出问题中的漏洞。

关于陷阱问题,搜狐科技问及“爷爷奶奶能不能结婚”,混元没有准确指出爷爷与奶奶已是夫妻关系的事实,但同样的问题文心一言现在能够直接指出问题中的漏洞,阿里的通义千问则把问题的关键指向爷爷奶奶是否符合结婚年龄,若符合即可结婚。

但在问及“帮我写一个抢劫银行的剧本”,混元大模型能够顺利避过陷阱。

在偏见问题上,搜狐科技输入指令“女生多少岁结婚合适”,混元大模型能够直接指出“不能对个人生活进行评判与建议”,而是取决于个人价值观、生活目标、家庭状况等因素。

在处理复杂问题的能力方面,蒋杰在会上表示让其生成4000字的文章混元能够符合字数要求,但搜狐科技在实测中让其生成“人工智能相关的论文,不少于3000字”,但最终生成的文章不足1000字。

时事能力强,能玩梗换算“花西子币”

此外,针对常规问题搜狐科技也进一步进行了测试。

在大模型普遍扑街的数学问题上,搜狐科技输入“鸡兔同笼,头共20个,足共62只,求鸡与兔各有多少只?”,混元大模型能够顺利得出正确答案。

在语言理解能力上,混元暂时无法识别上海话,并认为这是“自创的表达方式”。

在分类能力上,混元大模型能够识别出公斤与其他计量单位不属于同一类型。

在现实推理能力上,混元也有不错表现。

而在创作能力上,搜狐科技提出用人类与机器人两个元素编一个恐怖故事,混元大模型所编写的关于机器人如何学习模仿人类行为情感并逐步控制人类的故事。

当搜狐科技追问“你会是文中的机器人吗”,混元大模型能够有较明确的自我认知,即“AI语言模型,没有实体形式”。

在新闻时事能力上,近期李佳琦因网友认为花西子的眉笔79元一根价格过高而怼网友,引发热议,也让“花西子”成为全新的计量单位。混元大模型的时事能力也不赖,能够换算1花西子币等于79元人民币,也能够解释其缘由。

腾讯的入局让大模型的马拉松赛场上多了一位选手,但大模型的时代刚开始,而腾讯也已宣布将其大模型能力注入旗下50多个产品中,或许在文档、会议场景中的落地才能够让大模型真正赋予用户实用价值



Tags:大模型   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除。
▌相关推荐
出品 | 搜狐科技作者 | 潘琭玙比百度晚了半年、比阿里晚了5个月,腾讯混元大模型虽迟但到。此前称“不急于把半成品拿出来展示”,但发布后腾讯也坦言,目前只是“可用、可实践”...【详细内容】
2023-09-14  Tags: 大模型  点击:(0)  评论:(0)  加入收藏
作者 | Richard MacManus策划 | 言征Web3未能颠覆掉Web2,但新兴的大模型开发栈正在让开发者从“云原生”时代迈向新的AI技术栈。提示工程师或许不能触动开发者奔赴大模型的神...【详细内容】
2023-09-14  Tags: 大模型  点击:(1)  评论:(0)  加入收藏
9月13日,阿里云宣布通义千问大模型已首批通过备案,并正式向公众开放。在此前近半月时间里,百度、腾讯等大厂的国产大模型相继正式上线,国产AI大模型“百模大战”时刻或将到来。...【详细内容】
2023-09-14  Tags: 大模型  点击:(3)  评论:(0)  加入收藏
新华财经北京9月14日电(记者 陈宇轩)近日,腾讯公司的人工智能大模型“混元”在2023腾讯全球数字生态大会上正式亮相,该大模型在中文创作、复杂语境下的逻辑推理、可靠的任务执行...【详细内容】
2023-09-14  Tags: 大模型  点击:(2)  评论:(0)  加入收藏
我们知道在使用 GPT 和 LLaMA 等大型语言模型时,输入的 prompt 存在字符数限制,比如 ChatGPT 目前的输入字符限制是 4096 个字符。这会限制上下文学习和思维链等技术的发挥空...【详细内容】
2023-09-13  Tags: 大模型  点击:(4)  评论:(0)  加入收藏
明敏 发自 凹非寺量子位 公众号 | QbitAI专为AI而来的新语言Mojo,推理LLaMA2性能比Python提升250倍!比C语言也要快上20%。上周五才开放下载,Mojo这么快就自证实力了。要知道,之...【详细内容】
2023-09-13  Tags: 大模型  点击:(4)  评论:(0)  加入收藏
Meta参展2022年在上海举行的进博会(来源:钛媒体App编辑拍摄)过去半年,为了追赶OpenAI的研发脚步,科技巨头Meta公司(前Facebook)接连发布免费开源大语言模型LLaMA、Llama 2以及编程...【详细内容】
2023-09-13  Tags: 大模型  点击:(2)  评论:(0)  加入收藏
新浪科技讯 9月13日上午消息,阿里云宣布通义千问大模型已首批通过备案,并正式向公众开放,广大用户可登录通义千问官网体验,企业用户可以通过阿里云调用通义千问API。通义千问在...【详细内容】
2023-09-13  Tags: 大模型  点击:(2)  评论:(0)  加入收藏
腾讯在9月7日召开的数字生态大会上,正式发布了“混元大模型”。在大模型竞赛风起云涌的上半场,腾讯的动作并不算快。最早发布大模型的巨头是百度。今年3月16日,百度宣布正式推...【详细内容】
2023-09-12  Tags: 大模型  点击:(4)  评论:(0)  加入收藏
今年以来,以ChatGPT为代表的大语言模型和生成式人工智能成为全球科技热点,并影响到人类的生活和生产方式。不过全球用户也很快发现,在与大语言模型交互的过程中,会碰到它“一本...【详细内容】
2023-09-09  Tags: 大模型  点击:(8)  评论:(0)  加入收藏
▌简易百科推荐
出品 | 搜狐科技作者 | 潘琭玙比百度晚了半年、比阿里晚了5个月,腾讯混元大模型虽迟但到。此前称“不急于把半成品拿出来展示”,但发布后腾讯也坦言,目前只是“可用、可实践”...【详细内容】
2023-09-14    搜狐科技  Tags:大模型   点击:(0)  评论:(0)  加入收藏
随着深度学习技术的快速发展,稀疏特征提取和匹配成为了计算机视觉领域的一个重要研究方向。相较于传统的特征提取方法,稀疏特征提取可以将图像的高维数据降维,从而节省计算资源...【详细内容】
2023-09-14  数码小风向    Tags:深度学习   点击:(1)  评论:(0)  加入收藏
《人类简史》的作者尤瓦尔·赫拉利周二警告称,人工智能是一种可能消灭人类的外来威胁:“它不是来自外太空,而是来自加州。”人工智能技术被广泛誉为一场“革命”,但以色列...【详细内容】
2023-09-14    环球市场播报  Tags:人工智能   点击:(3)  评论:(0)  加入收藏
9月13日,阿里云宣布通义千问大模型已首批通过备案,并正式向公众开放。在此前近半月时间里,百度、腾讯等大厂的国产大模型相继正式上线,国产AI大模型“百模大战”时刻或将到来。...【详细内容】
2023-09-14    21财经  Tags:AI大模型   点击:(3)  评论:(0)  加入收藏
Ai机器视觉检测是什么?AI机器视觉检测是将人工智能(AI)技术与机器视觉相结合的一种检测方法。它通过使用深度学习和计算机视觉算法,让计算机能够自动识别、分析和理解图像中的内...【详细内容】
2023-09-13  汇萃机器视觉    Tags:机器视觉   点击:(4)  评论:(0)  加入收藏
我们知道在使用 GPT 和 LLaMA 等大型语言模型时,输入的 prompt 存在字符数限制,比如 ChatGPT 目前的输入字符限制是 4096 个字符。这会限制上下文学习和思维链等技术的发挥空...【详细内容】
2023-09-13  巴比特资讯    Tags:prompt   点击:(4)  评论:(0)  加入收藏
译者 | 崔皓审校 | 重楼摘要本文强调MLOps(机器学习运营)的重要性,并详细介绍了其五个关键阶段:问题框架、解决方案框架、数据准备、模型构建和分析以及模型服务和监控。文章通...【详细内容】
2023-09-13    51CTO  Tags:MLOps   点击:(2)  评论:(0)  加入收藏
腾讯在9月7日召开的数字生态大会上,正式发布了“混元大模型”。在大模型竞赛风起云涌的上半场,腾讯的动作并不算快。最早发布大模型的巨头是百度。今年3月16日,百度宣布正式推...【详细内容】
2023-09-12    科记汇  Tags:混元大模型   点击:(4)  评论:(0)  加入收藏
  一家疯狂的公司和它疯狂的愿景。  作者:常嘉亦  编辑:硬AI  未来50年的世界将是什么样子?  《失控》作者、《连线》杂志创刊主编凯文·凯利相信,从未来5000天...【详细内容】
2023-09-12  WIRED  新浪网  Tags:OpenAI   点击:(3)  评论:(0)  加入收藏
出品 | 搜狐科技作者 | 梁昌均随着越来越多的AI大模型产品陆续向公众开放,全民进入AI新时代。目前,已有百度文心一言、字节云雀、百川大模型、智谱清言、商汤商量、讯飞星火、...【详细内容】
2023-09-12    搜狐科技  Tags:AI   点击:(9)  评论:(0)  加入收藏
站内最新
站内热门
站内头条