虾画怪谈的头像-卡咪卡咪哈-一个博客
管理员
这家伙很懒,什么都没有写...
论文解释:Vision Transformers和CNN看到的特征是相同的吗?-卡咪卡咪哈-一个博客

论文解释:Vision Transformers和CNN看到的特征是相同的吗?

近年来,Vision Transformer (ViT) 势头强劲。 本文将解释论文《Do Vision Transformers See Like Convolutional Neural Networks?》 (Raghu et al., 2021) 由 Google Research 和 Google Brain...
4个月前
04411
诺德基金:Sora会带来哪些投资机会?-卡咪卡咪哈-一个博客

诺德基金:Sora会带来哪些投资机会?

OpenAI发布的Sora是一个充满倾覆性的AI视频生成模型,它的出现可能对各领域(如广告、电商、影视制作、游戏开发等)产生深远影响。那么Sora对投资有哪些影响,投资者又该如何把握呢? 诺德基金...
4个月前
05712
分割一切「3D高斯」版来了:几毫秒完成3D分割、千倍加速-卡咪卡咪哈-一个博客

分割一切「3D高斯」版来了:几毫秒完成3D分割、千倍加速

机器之心报道 编辑:杜伟、蛋酱 有了上海交大和华为提出的 SAGA,辐射场中的交互式 3D 分割任务实现起来会更快、效果更好。 今年 4 月,Meta 发布「分割一切(SAM)」AI 模型,这项成果不仅成为...
4个月前
0517
深度学习:读论文《Vision Transformer (ViT)》-2021年-卡咪卡咪哈-一个博客

深度学习:读论文《Vision Transformer (ViT)》-2021年

hello,大家好,我是小孟,欢迎来到我的频道,如果喜欢,请三连:关注、点赞、转发。您的支持是我创作的动力源泉。今天我们来读一篇论文,这篇论文的标题是《An Image Is Worth 16x16 Words: Tr...
4个月前
05713
详解DiT—Sora背后的关键技术-卡咪卡咪哈-一个博客

详解DiT—Sora背后的关键技术

介绍 在Sora发布后,各路大佬纷纷猜测它的技术细节。例如:谢赛宁就认为Sora是基于他在ICCV 2023发布的DiT(Diffusion Transformer)技术(或思路)构建的。 添加图片注释,不超过 140 字(可选...
4个月前
06015
2分钟,单视图3D生成又快又好!北大等提出全新Repaint123方法-卡咪卡咪哈-一个博客

2分钟,单视图3D生成又快又好!北大等提出全新Repaint123方法

编辑:LRS 好困 【新智元导读】将2D扩散模型的强大图像生成能力与再绘策略的纹理对齐能力结合起来,Repaint123能够在2分钟内从零开始生成具有多视角一致性和精细纹理的高质量3D内容。 将一幅图...
4个月前
03515