扫描打开手机站
随时逛,及时抢!
当前位置:首页>综合资讯>

英特尔研究院发布全新 AI 扩散模型,可根据文本提示生成 360 度全景图

英特尔研究院发布全新 AI 扩散模型,可根据文本提示生成 360 度全景图

时间:2023-06-22 10:07:04 来源:网络整理 作者:bianji123

IT之家6 月 21 日消息,英特尔研究院今日宣布与 Labs 合作发布 LDM3D(Model for 3D)模型,这是一种利用生成式 AI 创建 3D 视觉内容的新型扩散模型。

据介绍,LDM3D是一种业界领先的模型,它使用扩散过程()生成深度图,然后生成逼真且身临其百思特网境的360度全景图。 LDM3D 有望彻底改变内容创建、元宇宙应用和数字体验,从而改变娱乐、游戏、建筑和设计等许多行业。

英特尔表示,LDM3D 是在 LAION-40百思特网0M 数据集的 10,000 个样本子集上进行训练的。 LAION-400M是一个大规模的文本-文本数据集,包含超过4亿个文本-文本对。 在标注训练语料库时,研究团队使用了 百思特网DPT-Large,这是英特尔研究院之前开发的密集深度估计模型,可为图像中的每个像素提供高度准确的相对深度。 LAION-400M 数据集是为研究目的而创建的,以便研究人员和其他感兴趣的社区可以在更大范围内测试模型训练。

LDM3D 模型在搭载英特尔至强处理器和英特尔 Gaudi AI 加速器的英特尔 AI 超级计算机上进行训练。 最终的模型和管道集成了 RGB 图像和深度图,以生成 360 度全景图,带来身临其境的体验。

本文地址:https://www.best73.com/zdmzt/268382.html
特别声明:以上内容来源于编辑整理发布,如有不妥之处,请与我方联系删除处理。
热门资讯
查看更多