您当前的位置:首页 > 新闻资讯 > 科技

英伟达最强AI超算再升级,CEO黄仁勋:大模型运行成本将大幅降低

时间:2023-08-09 10:48:12  来源:腾讯科技  作者:

腾讯科技讯 8月9日消息,美国当地时间周二晚间,英伟达创始人兼首席执行官黄仁勋在2023年度计算机图形学大会(SIGGRAPH)上发表演讲,讨论该公司最新的人工智能和3D图形领域的创新。

演讲中,黄仁勋发布了用于生成式 AI 的 GH200 Grace Hopper 超级芯片、桌面AI工作站GPU系列、NVIDIA AI Workbench 以及通过生成式 AI 和 OpenUSD 升级的 NVIDIA Omniverse。

据估计,目前英伟达在AI芯片市场占据了超过80%的市场份额。该公司的专长是图形处理单元(GPU),已成为支撑生成式人工智能软件(如谷歌的Bard和OpenAIChatGPT)的大型AI模型的首选芯片。但由于科技巨头、云服务提供商和初创企业争夺GPU容量来开发自己的AI模型,英伟达的芯片供应短缺。

英伟达最强AI超算再升级

英伟达最新发布的芯片GH200,与该公司目前最高端的AI芯片H100采用相同的GPU。但GH200还配备了141GB的尖端内存和一个72核的ARM中央处理器。

相比前代平台,新GH200 Grace Hopper平台的双芯片配置将内存容量提高3.5倍,带宽增加三倍,一个服务器就有144个Arm Neoverse高性能内核、8 petaflops 的 AI 性能和282GB的最新HBM3e内存技术。

HBM3e是一种高带宽内存,带宽达每秒5TB。该内存比当前的HBM3快50%,可提供总共每秒10TB的组合带宽,使新平台能运行比前代大3.5倍的模型,同时通过快三倍的内存带宽提高性能。

英伟达CEO黄仁勋在周二的演讲中表示:“我们给这个处理器加了一些提升。”他补充说:“这个处理器是为全球数据中心的规模而设计的。”

据黄仁勋透露,这款新芯片将于明年第二季度在英伟达的经销商处上市,并计划在年底前提供样品。英伟达的代表拒绝透露价格。

通常,处理AI模型的过程至少分为两个部分:训练和推理。

首先,使用大量数据对模型进行训练,这个过程可能需要数月时间,有时需要数千个GPU,例如英伟达的H100和A100芯片。

然后,该模型将在软件中用于进行预测或生成内容,这个过程称为推理。与训练类似,推理需要大量的计算资源,并且每次软件运行时都需要大量的处理能力,例如生成文本或图像时。但与训练不同,推理是几乎持续进行的,而训练只在需要更新模型时才需要进行。

黄仁勋表示:“你可以将几乎任何大型语言模型放入其中,它将进行疯狂的推理。大型语言模型的推理成本将大幅降低。”

英伟达的新芯片GH200专为推理而设计,因为它具有更大的内存容量,可以容纳更大的AI模型在单个系统中。英伟达副总裁伊恩·巴克在与分析师和记者的电话会议上表示,英伟达的H100具有80GB的内存,而新的GH200则有141GB的内存。英伟达还宣布推出了一种将两个GH200芯片组合到一台计算机中的系统,以支持更大的模型。

巴克表示:“更大的内存使得模型可以常驻在单个GPU上,而不需要多个系统或多个GPU来运行。”

此次宣布正值英伟达的主要GPU竞争对手AMD推出面向AI的芯片MI300X,该芯片支持192GB的内存,并被市场推广为适用于AI推理。谷歌和亚马逊等公司也正在设计自己的定制AI芯片用于推理。

RTX工作站:4款显卡齐上新

除了GH200,英伟达的桌面AI工作站GPU系列也全面上新,一口气推出了4款新品:RTX 6000、RTX 5000、RTX 4500和RTX 4000。针对企业客户,英伟达还准备一套一站式解决方案—— RTX Workstation,支持最多4张RTX 6000 GPU。

作为旗舰级专业卡,RTX 6000的性能参数毫无疑问是4款新品中最强的。

凭借着48GB的显存,18176个CUDA核心,568个Tensor核心,142个RT核心,和高达960GB/s的带宽,它可谓是一骑绝尘。

基于新发布的4张新的GPU,针对企业客户,老黄还准备一套一站式解决方案—— RTX Workstation。

支持最多4张RTX 6000 GPU,可以在15小时内完成8.6亿token的GPT3-40B的微调。

还能让Stable Diffusion XL每分钟生成40张图片,比4090快5倍。

OVX服务器:搭载L40S,性能小胜A100

针对数据中心市场,英伟达推出了最多可搭载8张L40S GPU的OVX服务器。据介绍,对于具有数十亿参数和多种模态的生成式AI工作负载,L40S相较于老前辈A100可实现高达1.2倍的推理性能提升,以及高达1.7倍的训练性能提升。

AI Workbench:加速定制生成式AI应用

除了各种强大的硬件之外,英伟达还发布了全新的AI Workbench,来帮助开发和部署生成式AI模型。AI Workbench为开发者提供了一个统一且易于使用的工具包,能够快速在PC或工作站上创建、测试和微调模型,并扩展到几乎任何数据中心、公有云或英伟达的云服务DGX Cloud上。

具体而言,AI Workbench具备易于使用、集成AI开发工具和存储库、增强协作、访问加速计算资源等优势。

五年前悄然押注AI获得丰厚回报

黄仁勋表示,英伟达在2018年做出了一个攸关公司生死存亡的商业决定,但却很少有人意识到这个决定将对英伟达乃至整个半导体行业的重大意义。当然,这一押注为英伟达带来了丰厚的回报,但黄仁勋表示,这只是人工智能驱动的未来的开端,一个主要由英伟达硬件驱动的未来。

黄仁勋回忆说,五年前的分水岭时刻是选择采用以光线追踪(RTX)还是智能升级(DLSS)形式的人工智能图像处理方案。“我们意识到栅格化正在达到极限,”他说,他指的是传统的、被广泛使用的3D场景渲染方法。“2018年是一个‘押注公司’的时刻。这需要我们重新发明硬件、软件和算法。在我们用人工智能重塑CG的同时,我们也在为人工智能重塑GPU。”

虽然光线跟踪和DLSS仍在消费者GPU和游戏多样化等领域被采用,但他们为实现它而创建的架构却是不断增长的机器学习开发社区的完美合作伙伴。

训练越来越大的生成式模型所需的大量计算,不再由某些具有GPU功能的传统数据中心提供,而是从一开始就设计用于执行必要大规模操作的系统支持,如H100。公平地说,人工智能的发展在某些方面只是受到这些计算资源可用性的限制。英伟达从人工智能热潮中受益,其服务器和工作站的销量始终处于供不应求的状态。

但黄仁勋坚称,这只是个开始。新的模型不仅需要训练,还需要数百万甚至数十亿用户的实时运行支持。他说:“大语言模型在未来几乎处于一切事物的前沿:从视觉效果到快速数字化的制造市场、工厂设计和重工业,一切都将在某种程度上采用自然语言界面。整个工厂将由软件控制的机器人操控,他们将制造的汽车本身也将是机器人。所以这是机器人设计机器人,并负责建造机器人。”

有些人可能不同意黄仁勋的观点,这虽然看似合理,但碰巧也非常有利于英伟达的利益。

但是,尽管我们对大语言模型的依赖程度尚不确定,但很少有人敢说不使用它们,甚至对谁将使用它,以及在什么情况下需要在新的计算资源上进行重大投资方面也是如此。

在以CPU为核心的机架等上一代计算资源上投资数百万美元已经没有意义,因为像GH200这样的硬件,可以用不到十分之一的成本和电力需求来完成同样的工作。GH200是英伟达新推出的、专用于数据中心的人工智能开发硬件。

黄仁勋还播放了一段视频,展示了由多个Grace Hopper计算单元组成的乐高积木般的组件,它们先是组成了刀片,然后是机架,最后是成排的GH200,所有这些计算单元都被高速连接在一起,成为“世界上最大的单个GPU”,它拥有完整的ML专业计算能力。

黄仁勋提出,这些将成为未来人工智能主导的数字行业的基本单位。他说:“我不知道是谁说的,但你买的越多,省的钱就越多。如果我能让你们记住我今天演讲中的一件事,那就是它了。”

黄仁勋在演讲中没有提到人工智能面临的诸多挑战、监管,也没有谈到人工智能的整体概念在发生变化, 就像它在去年已经多次经历过的那样。当然,这是一种乐观的世界观,就像在淘金热期间出售镐和铲子等工具的商人,他们同样赚得盆满钵满。

延展阅读:

在发布这新GPU的时候,现场还出现了一个意外的小花絮。老黄从后台拿出第一块GPU的时候,似乎不小心在镜面面板上沾了指纹。老黄发现后很不好意思地和现场观众说对不起,如此可爱的老黄,也惹得在场观众不断发笑,点击阅读更多发布会细节:老黄深夜炸场,AIGC进入iphone时刻,神秘显卡胜过A100

黄仁勋依然不改金牌销售的风格,英伟达“核弹工厂”上线,更多关于OpenUSD 升级的 NVIDIA Omniverse信息可参阅:黄仁勋:「核弹工厂」即将上线,要让所有人用上生成式 AI



Tags:英伟达   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
英伟达CEO黄仁勋预测:十年内AI将能实时生成游戏中的所有像素
IT之家 3 月 21 日消息,在英伟达 GTC 2024 大会上发布了全新 Blackwell GPU 架构之后,黄仁勋在问答环节中对游戏领域的 AI 未来做出了大胆预测。据 Tom's Hardware 报道,这...【详细内容】
2024-03-21  Search: 英伟达  点击:(17)  评论:(0)  加入收藏
英伟达“算力核弹”强在哪里?
训练万亿参数级别的大模型,需要多大规模的算力?在今日凌晨进行的Nvidia GTC 2024主旨演讲中,英伟达创始人兼首席执行官黄仁勋在现场做了一道数学题。以OpenAI最先进的1.8万亿参...【详细内容】
2024-03-20  Search: 英伟达  点击:(16)  评论:(0)  加入收藏
英伟达发布机器人基础模型,具身智能离现实又进了一步?
·英伟达发布人形机器人通用基础模型Project GR00T和新型计算机 Jetson Thor,希望能让机器人拥有更聪明的大脑。·上海机器人产业技术研究院副院长周梅杰分析认...【详细内容】
2024-03-20  Search: 英伟达  点击:(10)  评论:(0)  加入收藏
世界首款!英伟达重磅发布人形机器人模型
3月19日,在备受瞩目的GTC 2024大会上,英伟达CEO黄仁勋带来了一项震撼人心的发布:世界首款人形机器人模型正式亮相。这一创新成果不仅标志着英伟达在人工智能领域的又一重大突破...【详细内容】
2024-03-19  Search: 英伟达  点击:(15)  评论:(0)  加入收藏
英伟达抛出年度AI杀器:史上最强芯片,还有机器人大模型
作者丨邱晓芬、景霖编辑丨苏建勋3月18日-21日期间,英伟达在美国圣何塞召开GTC大会。作为英伟达一年一度的技术发布会, GTC大会也被誉为AI行业的风向标。创始人黄仁勋在GTC大会...【详细内容】
2024-03-19  Search: 英伟达  点击:(15)  评论:(0)  加入收藏
“我是GR00T”,英伟达放大招
作 者丨赵云帆编 辑丨骆一帆图 源丨图虫、资料图在社交平台“预热”人形机器人的新进展之后,英伟达果然放了一个大招。美国当地时间3月18日,英伟达GTC发布会中,该公司发布了“P...【详细内容】
2024-03-19  Search: 英伟达  点击:(9)  评论:(0)  加入收藏
英伟达、微软等巨头“抱团”,AI有望助推6G时代到来 国内产业如何接招?
新一代信息技术的加速演进,为行业发展带来前所未有的机遇,也推动数据、算力、人工智能成为社会生产力发展的重要支撑。随着5G技术的不断演进,下一轮更替已经蓄势待发。当地时间...【详细内容】
2024-02-28  Search: 英伟达  点击:(22)  评论:(0)  加入收藏
详解AI芯片参数,英伟达凭啥不能被替代?
文 | 产业象限,作者 | 山茶,编辑 | 钱江2月22日,英伟达发布2024财年四季报,营收221亿美元,同比增长265%,净利润123亿美元,同比激增769%,双双大超市场预期。然后,英伟达就杀疯了。一夜...【详细内容】
2024-02-28  Search: 英伟达  点击:(33)  评论:(0)  加入收藏
英伟达市值一夜涨了2万亿,约等于一个茅台三个宁德时代,黄仁勋身家超越中国首富钟睒睒
在英伟达靓丽财报的带动下,美股三大指数高开高走,道指、标普双双刷新高,纳指也接近历史最高收盘价。截至当地时间2月22日收盘,英伟达报785.38美元涨16.4%,创历史新高,市值逼近2万...【详细内容】
2024-02-23  Search: 英伟达  点击:(41)  评论:(0)  加入收藏
扎克伯格谈愿景:元宇宙AI 两手抓,预估年底有35万片英伟达 H100
IT之家 1 月 19 日消息,Meta 公司首席执行官马克・扎克伯格(Mark Zuckerberg)近日在 Threads 上发布视频,表示正扩大 AI 团队阵容,推动元宇宙和人工智能发展。IT之家附上视频如下...【详细内容】
2024-01-19  Search: 英伟达  点击:(47)  评论:(0)  加入收藏
▌简易百科推荐
谷歌推出适用于安卓设备的“查找我的设备”网络
IT之家 4 月 9 日消息,谷歌今日推出了适用于安卓设备的“查找我的设备”网络,其功能类似于苹果的“查找”网络,旨在帮助用户定位丢失、被盗的安卓产品。IT之家注意到,与苹果的“...【详细内容】
2024-04-09    IT之家  Tags:安卓   点击:(2)  评论:(0)  加入收藏
你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢
2026年的数据荒越来越近,硅谷大厂们已经为AI训练数据抢疯了。它们纷纷豪掷十数亿美元,希望把犄角旮旯里的照片、视频、聊天记录都给挖出来。不过,如果有一天AI忽然吐出了我们的...【详细内容】
2024-04-09    新智元  Tags:硅谷   点击:(2)  评论:(0)  加入收藏
谷歌搜索史上最大变革!考虑对AI搜索收费
快科技4月7日消息,据国外媒体报道,谷歌正计划对由生成式人工智能驱动的新高级功能收费,这将是谷歌搜索业务历史上最大的一次变革。自2000年以来,谷歌的搜索产品一直依靠广告盈利...【详细内容】
2024-04-08    快科技  Tags:谷歌搜索   点击:(7)  评论:(0)  加入收藏
为训练AI,OpenAI等科技巨头花式淘数据
[环球时报特约记者 甄翔]《纽约时报》6日披露了科技公司训练人工智能的秘密——利用语音识别工具转录视频网站YouTube上的视频,形成对话文本数据,供其最新的AI学习...【详细内容】
2024-04-08    环球网  Tags:AI   点击:(7)  评论:(0)  加入收藏
训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
全网真的无数据可用了!外媒报道称,OpenAl、Anthropic等公司正在努力寻找足够的信息,来训练下一代人工智能模型。前几天,OpenAI和微软被曝出正在联手打造超算「星际之门」,解决算...【详细内容】
2024-04-08    新智元  Tags:GPT-5   点击:(1)  评论:(0)  加入收藏
当“机器人”有了“AI大脑” 人形机器人时代来了吗
数智风向标当“机器人”有了“AI大脑”​人形机器人时代来了吗简单明了的口令下达后,机器人便开始搬箱子、运小球,在各类不同的地形行走……这些身上布满芯片和传...【详细内容】
2024-04-08    中国青年报  Tags:机器人   点击:(3)  评论:(0)  加入收藏
报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
IT之家 4 月 7 日消息,本周早些时候,《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天,《纽约时报》详细介绍了 AI 公司处理此问题的一些方法,其中涉及到...【详细内容】
2024-04-07    IT之家  Tags:OpenAI   点击:(6)  评论:(0)  加入收藏
量子计算会和经典计算一样融入人们的日常生活
作为2024中国网络媒体论坛打造的创新活动之一,“技术赋能·八点见”创新项目发布会于3月30日晚在云南昆明举行。活动现场,本源量子计算科技(合肥)股份有限公司(以下简称“...【详细内容】
2024-04-03    人民网  Tags:量子计算   点击:(8)  评论:(0)  加入收藏
ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
新智元报道编辑:编辑部【新智元导读】OpenAI这份愚人节礼物,实在是太大了:今天起,ChatGPT不用注册,可以直接使用。用户狂欢,竞品颤抖,我们仿佛已经听到,谷歌搜索引擎这位巨人轰然倒...【详细内容】
2024-04-02    新智元  Tags:ChatGPT   点击:(8)  评论:(0)  加入收藏
谷歌为了结集体诉讼,同意删除 Chrome 无痕模式下收集的用户数据
IT之家 4 月 2 日消息,根据华尔街日报报道,谷歌为了结追溯到 2020 年的集体诉讼案,近日同意删除通过 Chrome 浏览器“无痕(Incognito)模式”下收集的用户数据。这起诉讼原告认为,...【详细内容】
2024-04-02    IT之家  Tags:Chrome   点击:(7)  评论:(0)  加入收藏
站内最新
栏目相关
  • · 谷歌推出适用于安卓设备的“查找我的设备”网络
  • · 你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · 为训练AI,OpenAI等科技巨头花式淘数据
  • · 训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
  • · 当“机器人”有了“AI大脑” 人形机器人时代来了吗
  • · 报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
  • · 量子计算会和经典计算一样融入人们的日常生活
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 谷歌为了结集体诉讼,同意删除 Chrome 无痕模式下收集的用户数据
  • · 哥伦比亚大学华人开发「人脸机器人」,照镜子自主模仿人类表情超逼真
  • · 谷歌服务现已支持使用 Windows Hello 人脸和指纹解锁登录
  • · GPT商店热度不尽人意 仅用在写论文和炒股票上较受欢迎
  • · 距实现全球安全量子通信更近一步:量子点源产生近乎完美纠缠光子对
  • · 中国三大运营商共同发布通过GSMA Open Gateway认证的一次性密码 API
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · 国家数据局局长刘烈宏:充分发挥数据要素价值 培育新质生产力
  • · 谷歌Chrome巨变:第三方Cookie的终结将重塑互联网格局
  • · 百度+苹果,“AI手机元年”真的来了?
  • · 百度AI“咬”了一口苹果 大模型商用有戏了?
  • 站内热门
    相关头条
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
  • · 瘫痪8年小哥植入马斯克脑机接口,狂打8小时「文明6」!Neuralink首个人类植入者直播来了
  • · 英伟达“算力核弹”强在哪里?
  • · AI大模型之争远未落幕
  • · 世界首款!英伟达重磅发布人形机器人模型
  • · 全程回顾黄仁勋GTC演讲:Blackwell架构B200芯片登场
  • · 真“Open ” AI?马斯克旗下大模型Grok宣布开源:参数量全球最大
  • · 全球首位AI程序员诞生 人类程序员会失业吗?
  • · 谷歌宣布更新搜索算法:打击AI生成内容,提高搜索结果质量
  • · 英伟达、微软等巨头“抱团”,AI有望助推6G时代到来 国内产业如何接招?
  • · OpenAI Sora已开放对外申请 网友爆料:可能还有其它重磅产品发布
  • · 周鸿祎再谈Sora:真正给人工智能补上了“眼睛”
  • · Sora爆火超100小时:美国狂“卷”算力,国内则卖 AI 课程“捞金”一年5000万|钛媒体AGI
  • · 爆火Sora参数规模仅30亿?谢赛宁等大佬技术分析来了
  • · “AI女友”霸占GPT商店,OpenAI苦不堪言:开发者也难出头!
  • · 从居家到工作,CES 2024上演 AI硬件大秀
  • · OpenAI新年头号重磅!GPT Store上线,企业客户新品也来了
  • 站内头条