CrossFormer 实现图像分类以及视觉任务的骨干网络替换
它使用交替的局部和全局注意力击败了 PVT 和 Swin。
全局注意力是在窗口维度上完成的,以降低复杂性,还具有跨尺度嵌入层,被证明是可以改进所有视觉转换器的通用骨干网络。
并设计了动态相对位置偏差,以允许网络推广到更高分辨率的图像。
只限pytorch框架
ID:92100
详询客服 微信shujuqudong1 或shujuqudong6 或 qq68823886 或 27699885
图文详情请查看: http://matup.cn/681596231987.html