虾画怪谈-卡咪卡咪哈-一个博客-第213页

8.6W+1.3W+

虾画怪谈

管理员

这家伙很懒，什么都没有写...

详解DiT—Sora背后的关键技术

介绍在Sora发布后，各路大佬纷纷猜测它的技术细节。例如：谢赛宁就认为Sora是基于他在ICCV 2023发布的DiT（Diffusion Transformer）技术（或思路）构建的。添加图片注释，不超过 140 字（可选...

AI绘画

3个月前

05615

深度学习：读论文《Vision Transformer (ViT)》-2021年

hello，大家好，我是小孟，欢迎来到我的频道，如果喜欢，请三连：关注、点赞、转发。您的支持是我创作的动力源泉。今天我们来读一篇论文，这篇论文的标题是《An Image Is Worth 16x16 Words: Tr...

AI视频

3个月前

05613

分割一切「3D高斯」版来了：几毫秒完成3D分割、千倍加速

机器之心报道编辑：杜伟、蛋酱有了上海交大和华为提出的 SAGA，辐射场中的交互式 3D 分割任务实现起来会更快、效果更好。今年 4 月，Meta 发布「分割一切（SAM）」AI 模型，这项成果不仅成为...

3D成像

3个月前

0507

诺德基金：Sora会带来哪些投资机会？

OpenAI发布的Sora是一个充满倾覆性的AI视频生成模型，它的出现可能对各领域（如广告、电商、影视制作、游戏开发等）产生深远影响。那么Sora对投资有哪些影响，投资者又该如何把握呢？诺德基金...

AI绘画

3个月前

05512

论文解释：Vision Transformers和CNN看到的特征是相同的吗？

近年来，Vision Transformer (ViT) 势头强劲。本文将解释论文《Do Vision Transformers See Like Convolutional Neural Networks?》 (Raghu et al., 2021) 由 Google Research 和 Google Brain...

AI视频

3个月前

04011

HumanGaussian开源：基于Gaussian Splatting的高质量3D人体生成新框架

要点: 结构感知的SDS引入人体结构先验，同时优化外观和几何形状。通过退火的负文本引导，确保真实结果，避免过度饱和和消除浮动伪影。 HumanGaussian框架能够生成多样、逼真的高质量3D人体模型...

3D成像

3个月前

0595

加载更多