您当前的位置:首页 > 新闻资讯 > 科技

分分钟将图像转换成3D模型

时间:2023-12-11 10:46:27  来源:51CTO  作者:

译者 | 布加迪

分分钟将图像转换成3D模型

法国LIGM实验室的研究人员已开发了一种新颖的技术,可以由真实场景周围捕获的图像集合快速创建高度逼真的3D网格模型。他们的方法被称为SuGaR,通过以一种独特的方式采用神经表示和计算几何技术,可以在短短几分钟内重新构建详细的三角形网格模型。这项功能可以为创作者、教育工作者和专业人员提供一种更易于访问的途径,以便在许多应用环境充分利用3D模型。

本文将介绍这种方法的独特之处以及它对其他AI项目意味着什么。

3D重建的挑战

重建真实环境的准确3D模型长期以来一直是一项艰巨的任务,需要专门的设备、精心编排的捕获流程和大量的手动后期处理。激光扫描设备和结构光深相机可以直接捕获几何扫描,但仍存在缓慢、昂贵和笨重的缺点。

基于运动结构的摄影测量方法由相机图像生成稀疏的3D点云,但光由这些点云生成干净、详细的表面模型就非常困难了。虽然质量很出众,但最先进的神经辐射场即使在现代GPU上也需要持续数小时乃至数天的渲染密集型优化周期,才能将其体积场景表示转换成实用的表面网格。

因此,虽然模拟、教育、数字化和创意媒体等领域的许多下游用例都必然会从易于访问的高质量3D场景表示中受益匪浅,但对大多数人来说,捕获和开发方面仍面临极大的障碍。

新颖地结合技术

本文介绍了SuGaR方法。SuGaR方法将新兴的神经场景表示与传统的计算几何算法相结合,克服了这些挑战,并提供了一种独特的快速且易于访问的3D建模途径。

该技术立足于最近一种基于神经粒子的场景表示方法:3D高斯泼溅。通过优化上百万个微小的3D高斯基元的方向、尺寸、放射及其他属性,最准确地再现一组输入相机图像,高斯泼溅可以在短短几分钟内重建生动的场景神经渲染。

经过优化后,独立的高斯粒子仍然是非结构化的。SuGaR的关键创新在于引入了一种新的训练过程,该过程鼓励颗粒在保留细部的同时符合表面。这种对齐便于将粒子当成结构化的点云进行重建。

利用这种点结构,SuGaR随后执行一种名为泊松表面重建的计算技术,直接由对齐的粒子高效地生成网格。同时处理数百万个粒子会得到一个详细的三角模型,而这是传统技术难以实现的。

从本质上讲,SuGaR将大量的计算负载转移到一个快速的、可扩展的前端点云结构中。这将所需的渲染密集型工作负载由最终网格生成转移到别处,从而使快速构建模型成为可能。

验证效果

研究人员通过实验证明了SuGaR在广泛的公共数据集上快速构建高质量模型的效果,这些数据集涉及室内场景、室外景观、详细结构、镜面、照明变化及其他建模挑战。

分分钟将图像转换成3D模型

图1. 使用SuGaR的渲染(a)和重新构建的网格(b)的两个示例。常规地图(c)有助于直观地显示几何形状

示例包括由Mip-NeRF360数据集重建复杂室内环境的建筑模型的详细网格,以及由Tank & Temples数据集生成车辆和建筑物等结构的生动网格。

与现有的最先进的神经和混合重建技术进行定量和定性比较表明,SuGaR提供了显著加快的网格创建速度,渲染质量和几何精度可以媲美所需计算资源多得多的方法。论文作者表示:“我们的方法在由3D高斯泼溅检索3D网格方面要快得多,而3D高斯泼溅本身就比NeRF快得多。正如我们的实验表明的那样,我们通过将高斯函数绑定到网格上所进行的渲染获得了比以前基于网格的解决方案更高的质量。”

论文作者还强调了其方法的速度:“使用我们的方法,检索这样一个可编辑的网格进行逼真的渲染只需几分钟,同时提供了更好的渲染质量,而使用SDF方面最先进的方法也需要数小时。”

结论

SuGaR技术显著改善了3D模型重建。像激光扫描这样的传统方法既昂贵又复杂,虽然神经辐射场具有高质量,但速度慢且耗费大量资源。SuGaR通过将神经场景表示与计算几何相结合改变了这种情况。它先使用一种名为3D高斯泼溅的方法来创建神经渲染,然后它对齐这些粒子,让其行为如同结构化的点云。这是下一步的关键:使用泊松表面重建将这些粒子转换成详细的网格。这个过程更快,因为它将繁重的计算移到了最开始。

SuGaR已经在各种数据集上进行了测试,可处理室内和室外场景等不同的挑战。它不仅比NeRF更快,还保持了高质量和准确性。这使得创建详细的3D模型更快速、更易于访问,这对于模拟、教育和媒体等领域的应用而言很了不起。

原文标题:Turning images into 3D models in minutes, not hours,作者:Mike Young



Tags:3D模型   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
分分钟将图像转换成3D模型
译者 | 布加迪法国LIGM实验室的研究人员已开发了一种新颖的技术,可以由真实场景周围捕获的图像集合快速创建高度逼真的3D网格模型。他们的方法被称为SuGaR,通过以一种独特的方...【详细内容】
2023-12-11  Search: 3D模型  点击:(60)  评论:(0)  加入收藏
用VR手捏3D模型,PS直接与甲方对线,Adobe新技术给设计师炫到了
丰色 羿阁 发自 凹非寺 量子位 | 公众号 QbitAI 细到每根头发丝里的抠图: 一键删除举着冲浪板的小人,并迅速填充好被抠后的海浪背景: 是的,熟悉的味道~一年一度的Adobe Max大会...【详细内容】
2022-10-22  Search: 3D模型  点击:(339)  评论:(0)  加入收藏
谷歌华人研究员发布MobileNeRF,渲染3D模型速度提升10倍
最近谷歌发布了全新的MobileNeRF模型,直接将神经辐射场拉入移动时代,内存需求仅为1/6,渲染3D模型速度提升10倍,手机、浏览器都能用! 2020年,神经辐射场(NeRF)横空出世,只需几张2D的静...【详细内容】
2022-08-07  Search: 3D模型  点击:(278)  评论:(0)  加入收藏
▌简易百科推荐
谷歌搜索史上最大变革!考虑对AI搜索收费
快科技4月7日消息,据国外媒体报道,谷歌正计划对由生成式人工智能驱动的新高级功能收费,这将是谷歌搜索业务历史上最大的一次变革。自2000年以来,谷歌的搜索产品一直依靠广告盈利...【详细内容】
2024-04-08    快科技  Tags:谷歌搜索   点击:(6)  评论:(0)  加入收藏
为训练AI,OpenAI等科技巨头花式淘数据
[环球时报特约记者 甄翔]《纽约时报》6日披露了科技公司训练人工智能的秘密——利用语音识别工具转录视频网站YouTube上的视频,形成对话文本数据,供其最新的AI学习...【详细内容】
2024-04-08    环球网  Tags:AI   点击:(6)  评论:(0)  加入收藏
当“机器人”有了“AI大脑” 人形机器人时代来了吗
数智风向标当“机器人”有了“AI大脑”​人形机器人时代来了吗简单明了的口令下达后,机器人便开始搬箱子、运小球,在各类不同的地形行走……这些身上布满芯片和传...【详细内容】
2024-04-08    中国青年报  Tags:机器人   点击:(3)  评论:(0)  加入收藏
报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
IT之家 4 月 7 日消息,本周早些时候,《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天,《纽约时报》详细介绍了 AI 公司处理此问题的一些方法,其中涉及到...【详细内容】
2024-04-07    IT之家  Tags:OpenAI   点击:(4)  评论:(0)  加入收藏
量子计算会和经典计算一样融入人们的日常生活
作为2024中国网络媒体论坛打造的创新活动之一,“技术赋能·八点见”创新项目发布会于3月30日晚在云南昆明举行。活动现场,本源量子计算科技(合肥)股份有限公司(以下简称“...【详细内容】
2024-04-03    人民网  Tags:量子计算   点击:(8)  评论:(0)  加入收藏
ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
新智元报道编辑:编辑部【新智元导读】OpenAI这份愚人节礼物,实在是太大了:今天起,ChatGPT不用注册,可以直接使用。用户狂欢,竞品颤抖,我们仿佛已经听到,谷歌搜索引擎这位巨人轰然倒...【详细内容】
2024-04-02    新智元  Tags:ChatGPT   点击:(7)  评论:(0)  加入收藏
谷歌为了结集体诉讼,同意删除 Chrome 无痕模式下收集的用户数据
IT之家 4 月 2 日消息,根据华尔街日报报道,谷歌为了结追溯到 2020 年的集体诉讼案,近日同意删除通过 Chrome 浏览器“无痕(Incognito)模式”下收集的用户数据。这起诉讼原告认为,...【详细内容】
2024-04-02    IT之家  Tags:Chrome   点击:(7)  评论:(0)  加入收藏
哥伦比亚大学华人开发「人脸机器人」,照镜子自主模仿人类表情超逼真
【新智元导读】OpenAI 机器人理解力虽强,却无法进行非语言交流。最近,哥伦比亚大学华人团队打造了全新的机器人 Emo,不仅可以提前预测和模拟人类表情,还可以进行眼神交流。此前,...【详细内容】
2024-04-01    IT之家  Tags:哥伦比亚   点击:(17)  评论:(0)  加入收藏
谷歌服务现已支持使用 Windows Hello 人脸和指纹解锁登录
IT之家 3 月 28 日消息,谷歌近日对其账户登录页面进行了重大更新,现在能够在用户登录谷歌账户时,使用 Windows Hello 作为身份验证方法。使用通行密钥,用户将不再局限于使用密码...【详细内容】
2024-03-29    IT之家  Tags:谷歌服务   点击:(15)  评论:(0)  加入收藏
GPT商店热度不尽人意 仅用在写论文和炒股票上较受欢迎
财联社3月28日讯(编辑 赵昊)今年1月,OpenAI推出了定制聊天机器人商店“GPTs”,以期为业务增添新的动力。但两个多月后,GPTs的吸引力仍然有限,很难达到公司CEO山姆·奥尔特曼...【详细内容】
2024-03-29    财联社  Tags:GPT   点击:(13)  评论:(0)  加入收藏
站内最新
站内热门
相关头条
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
  • · 瘫痪8年小哥植入马斯克脑机接口,狂打8小时「文明6」!Neuralink首个人类植入者直播来了
  • · 英伟达“算力核弹”强在哪里?
  • · AI大模型之争远未落幕
  • · 世界首款!英伟达重磅发布人形机器人模型
  • · 全程回顾黄仁勋GTC演讲:Blackwell架构B200芯片登场
  • · 真“Open ” AI?马斯克旗下大模型Grok宣布开源:参数量全球最大
  • · 全球首位AI程序员诞生 人类程序员会失业吗?
  • · 谷歌宣布更新搜索算法:打击AI生成内容,提高搜索结果质量
  • · 英伟达、微软等巨头“抱团”,AI有望助推6G时代到来 国内产业如何接招?
  • · OpenAI Sora已开放对外申请 网友爆料:可能还有其它重磅产品发布
  • · 周鸿祎再谈Sora:真正给人工智能补上了“眼睛”
  • · Sora爆火超100小时:美国狂“卷”算力,国内则卖 AI 课程“捞金”一年5000万|钛媒体AGI
  • · 爆火Sora参数规模仅30亿?谢赛宁等大佬技术分析来了
  • · “AI女友”霸占GPT商店,OpenAI苦不堪言:开发者也难出头!
  • · 从居家到工作,CES 2024上演 AI硬件大秀
  • · OpenAI新年头号重磅!GPT Store上线,企业客户新品也来了
  • 站内头条