AI视频共12篇
用 Vision Transformer 进行图像分类-卡咪卡咪哈-一个博客

用 Vision Transformer 进行图像分类

Transformer 问世后被广泛地用在 NLP 的各种任务中,但是却很少出现在计算机视觉领域中。目前计算机视觉主流的模型依然是 CNN,各种 attention 操作也是在 CNN 结构上进行。本文介绍 Vision Tra...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈2个月前
0566
超过ConvNeXt等!上海交大提出Transformer架构新SOTA:SeTformer-卡咪卡咪哈-一个博客

超过ConvNeXt等!上海交大提出Transformer架构新SOTA:SeTformer

作者丨小源 来源丨数源AI 编辑丨极市平台 论文链接:https://arxiv.org/pdf/2401.03540.pdf 引言 Transformer最初是用于自然语言处理(NLP)的技术,在视觉领域得到了显著的流行,这要归功于Vis...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈2个月前
05614
深度学习:读论文《Vision Transformer (ViT)》-2021年-卡咪卡咪哈-一个博客

深度学习:读论文《Vision Transformer (ViT)》-2021年

hello,大家好,我是小孟,欢迎来到我的频道,如果喜欢,请三连:关注、点赞、转发。您的支持是我创作的动力源泉。今天我们来读一篇论文,这篇论文的标题是《An Image Is Worth 16x16 Words: Tr...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈2个月前
05513
ViT-Vision Transformer 详解-卡咪卡咪哈-一个博客

ViT-Vision Transformer 详解

Hello 小伙伴们大家好,最近在做多模态的工作,然后发现现在NLP和CV的预训练模型结构逐渐趋同,可以说是transformer占据了半壁江山,为了让大家更好的了解这些模型的结构以及实现方法,所以我打...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈2个月前
05112
当Swin Transformer遇上DCN,清华可变形注意力模型优于多数ViT-卡咪卡咪哈-一个博客

当Swin Transformer遇上DCN,清华可变形注意力模型优于多数ViT

机器之心报道 编辑:小舟 本文中,来自清华大学、AWS AI 和北京智源人工智能研究院的研究者提出了一种新型可变形自注意力模块,其中以数据相关的方式选择自注意力中键值对的位置,使得自注意力...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈2个月前
0497
视觉AI实战派?场景科技化推进商汤\旷视\微美全息算法升级-卡咪卡咪哈-一个博客

视觉AI实战派?场景科技化推进商汤\旷视\微美全息算法升级

随着经济生活水平的提升和人工智能等新兴技术的发展,各行业场景对服务提质增效提出了新的需求。视觉AI作随着经济生活水平的提升和人工智能等新兴技术的发展,各行业场景对服务提质增效提出了新...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
04714