虾画怪谈的头像-卡咪卡咪哈-一个博客
管理员
这家伙很懒,什么都没有写...
详解DiT—Sora背后的关键技术-卡咪卡咪哈-一个博客

详解DiT—Sora背后的关键技术

介绍 在Sora发布后,各路大佬纷纷猜测它的技术细节。例如:谢赛宁就认为Sora是基于他在ICCV 2023发布的DiT(Diffusion Transformer)技术(或思路)构建的。 添加图片注释,不超过 140 字(可选...
3个月前
05615
深度学习:读论文《Vision Transformer (ViT)》-2021年-卡咪卡咪哈-一个博客

深度学习:读论文《Vision Transformer (ViT)》-2021年

hello,大家好,我是小孟,欢迎来到我的频道,如果喜欢,请三连:关注、点赞、转发。您的支持是我创作的动力源泉。今天我们来读一篇论文,这篇论文的标题是《An Image Is Worth 16x16 Words: Tr...
3个月前
05613
分割一切「3D高斯」版来了:几毫秒完成3D分割、千倍加速-卡咪卡咪哈-一个博客

分割一切「3D高斯」版来了:几毫秒完成3D分割、千倍加速

机器之心报道 编辑:杜伟、蛋酱 有了上海交大和华为提出的 SAGA,辐射场中的交互式 3D 分割任务实现起来会更快、效果更好。 今年 4 月,Meta 发布「分割一切(SAM)」AI 模型,这项成果不仅成为...
3个月前
0507
诺德基金:Sora会带来哪些投资机会?-卡咪卡咪哈-一个博客

诺德基金:Sora会带来哪些投资机会?

OpenAI发布的Sora是一个充满倾覆性的AI视频生成模型,它的出现可能对各领域(如广告、电商、影视制作、游戏开发等)产生深远影响。那么Sora对投资有哪些影响,投资者又该如何把握呢? 诺德基金...
3个月前
05512
论文解释:Vision Transformers和CNN看到的特征是相同的吗?-卡咪卡咪哈-一个博客

论文解释:Vision Transformers和CNN看到的特征是相同的吗?

近年来,Vision Transformer (ViT) 势头强劲。 本文将解释论文《Do Vision Transformers See Like Convolutional Neural Networks?》 (Raghu et al., 2021) 由 Google Research 和 Google Brain...
3个月前
04011
HumanGaussian开源:基于Gaussian Splatting的高质量3D人体生成新框架-卡咪卡咪哈-一个博客

HumanGaussian开源:基于Gaussian Splatting的高质量3D人体生成新框架

要点: 结构感知的SDS引入人体结构先验,同时优化外观和几何形状。 通过退火的负文本引导,确保真实结果,避免过度饱和和消除浮动伪影。 HumanGaussian框架能够生成多样、逼真的高质量3D人体模型...
3个月前
0595