排序
当Swin Transformer遇上DCN,清华可变形注意力模型优于多数ViT
机器之心报道 编辑:小舟 本文中,来自清华大学、AWS AI 和北京智源人工智能研究院的研究者提出了一种新型可变形自注意力模块,其中以数据相关的方式选择自注意力中键值对的位置,使得自注意力...
3D 版 SORA 来了!DreamTech 推出全球首个原生 3D-DiT 大模型 Direct3D
机器之心发布 机器之心编辑部 不支持的音频/视频格式 请试试刷新 重播 播放 00:00 / 00:00 直播 00:00 进入全屏 0 点击按住可拖动视频 2024 年 5 月,DreamTech 官宣了其高质量 3D 生成大模型 D...
超过ConvNeXt等!上海交大提出Transformer架构新SOTA:SeTformer
作者丨小源 来源丨数源AI 编辑丨极市平台 论文链接:https://arxiv.org/pdf/2401.03540.pdf 引言 Transformer最初是用于自然语言处理(NLP)的技术,在视觉领域得到了显著的流行,这要归功于Vis...
超分辨图像无限生成!Diffusion Transformer 任意分辨率上采样
作者丨科技猛兽 编辑丨极市平台 本文目录 1 Inf-DiT:Diffusion Transformer 任意分辨率上采样 (来自清华大学,唐杰团队) 1 Inf-DiT 论文解读 1.1 超高分辨率图像生成问题的挑战:GPU 显存需求 ...
脑科学能用Transformer做什么?
图片来源@视觉中国 文 | 追问nextquestion 自ChatGPT问世以来,“Transformer模型”始终以超高频率出现在各个AI新产品模块当中。比如,大家所熟知的GPT-4、Midjourney、GitHub Copilot等,它们...
拒绝信息差!一篇文章说清Stable Diffusion3到底值不值得冲
就在几天前,Stability AI正式开源了Stable Diffusion 3 Medium(以下简称SD3M)模型和适配CLIP文件。这家身处风雨飘摇中的公司,在最近的一年里一直处于破产边缘,就连创始人兼CEO也顶不住压力...