AI视频共12篇
超过ConvNeXt等!上海交大提出Transformer架构新SOTA:SeTformer-卡咪卡咪哈-一个博客

超过ConvNeXt等!上海交大提出Transformer架构新SOTA:SeTformer

作者丨小源 来源丨数源AI 编辑丨极市平台 论文链接:https://arxiv.org/pdf/2401.03540.pdf 引言 Transformer最初是用于自然语言处理(NLP)的技术,在视觉领域得到了显著的流行,这要归功于Vis...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈5个月前
06014
深度学习:读论文《Vision Transformer (ViT)》-2021年-卡咪卡咪哈-一个博客

深度学习:读论文《Vision Transformer (ViT)》-2021年

hello,大家好,我是小孟,欢迎来到我的频道,如果喜欢,请三连:关注、点赞、转发。您的支持是我创作的动力源泉。今天我们来读一篇论文,这篇论文的标题是《An Image Is Worth 16x16 Words: Tr...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈5个月前
05913
当Swin Transformer遇上DCN,清华可变形注意力模型优于多数ViT-卡咪卡咪哈-一个博客

当Swin Transformer遇上DCN,清华可变形注意力模型优于多数ViT

机器之心报道 编辑:小舟 本文中,来自清华大学、AWS AI 和北京智源人工智能研究院的研究者提出了一种新型可变形自注意力模块,其中以数据相关的方式选择自注意力中键值对的位置,使得自注意力...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈5个月前
0597
用 Vision Transformer 进行图像分类-卡咪卡咪哈-一个博客

用 Vision Transformer 进行图像分类

Transformer 问世后被广泛地用在 NLP 的各种任务中,但是却很少出现在计算机视觉领域中。目前计算机视觉主流的模型依然是 CNN,各种 attention 操作也是在 CNN 结构上进行。本文介绍 Vision Tra...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈5个月前
0596
极智AI | 详解 ViT 算法实现-卡咪卡咪哈-一个博客

极智AI | 详解 ViT 算法实现

欢迎关注我,获取我的更多笔记分享 大家好,我是极智视界,本文详细介绍一下 ViT 算法的设计与实现,包括代码。 ViT 全称 Vision Transformer,是 transformer 在 CV 领域应用表现好的开始,而...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈5个月前
0579
ViT-Vision Transformer 详解-卡咪卡咪哈-一个博客

ViT-Vision Transformer 详解

Hello 小伙伴们大家好,最近在做多模态的工作,然后发现现在NLP和CV的预训练模型结构逐渐趋同,可以说是transformer占据了半壁江山,为了让大家更好的了解这些模型的结构以及实现方法,所以我打...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈5个月前
05612