虾画怪谈的头像-卡咪卡咪哈-一个博客
管理员
这家伙很懒,什么都没有写...
超过ConvNeXt等!上海交大提出Transformer架构新SOTA:SeTformer-卡咪卡咪哈-一个博客

超过ConvNeXt等!上海交大提出Transformer架构新SOTA:SeTformer

作者丨小源 来源丨数源AI 编辑丨极市平台 论文链接:https://arxiv.org/pdf/2401.03540.pdf 引言 Transformer最初是用于自然语言处理(NLP)的技术,在视觉领域得到了显著的流行,这要归功于Vis...
4个月前
05914
超分辨图像无限生成!Diffusion Transformer 任意分辨率上采样-卡咪卡咪哈-一个博客

超分辨图像无限生成!Diffusion Transformer 任意分辨率上采样

作者丨科技猛兽 编辑丨极市平台 本文目录 1 Inf-DiT:Diffusion Transformer 任意分辨率上采样 (来自清华大学,唐杰团队) 1 Inf-DiT 论文解读 1.1 超高分辨率图像生成问题的挑战:GPU 显存需求 ...
4个月前
0617
3D Gaussian Splatting 数据压缩【高斯泼溅】-卡咪卡咪哈-一个博客

3D Gaussian Splatting 数据压缩【高斯泼溅】

在上一篇文章中,我开始研究高斯泼溅(3DGS:3D Gaussian Splatting)。 它的问题之一是数据集并不小。 渲染图看起来不错。 但“自行车”、“卡车”、“花园”数据集分别是一个 1.42GB、0.59GB...
4个月前
05112
脑科学能用Transformer做什么?-卡咪卡咪哈-一个博客

脑科学能用Transformer做什么?

图片来源@视觉中国 文 | 追问nextquestion 自ChatGPT问世以来,“Transformer模型”始终以超高频率出现在各个AI新产品模块当中。比如,大家所熟知的GPT-4、Midjourney、GitHub Copilot等,它们...
4个月前
0469
拒绝信息差!一篇文章说清Stable Diffusion3到底值不值得冲-卡咪卡咪哈-一个博客

拒绝信息差!一篇文章说清Stable Diffusion3到底值不值得冲

就在几天前,Stability AI正式开源了Stable Diffusion 3 Medium(以下简称SD3M)模型和适配CLIP文件。这家身处风雨飘摇中的公司,在最近的一年里一直处于破产边缘,就连创始人兼CEO也顶不住压力...
4个月前
0438
HumanGaussian开源:基于Gaussian Splatting的高质量3D人体生成新框架-卡咪卡咪哈-一个博客

HumanGaussian开源:基于Gaussian Splatting的高质量3D人体生成新框架

要点: 结构感知的SDS引入人体结构先验,同时优化外观和几何形状。 通过退火的负文本引导,确保真实结果,避免过度饱和和消除浮动伪影。 HumanGaussian框架能够生成多样、逼真的高质量3D人体模型...
4个月前
0615