[论文翻译]Transformer比CNN更鲁棒吗? Transformer 成为视觉识别的强大工具。除了在广泛的视觉基准测试中展现出有竞争力的性能外,近期研究还认为 Transformer 比卷积神经网络 (CNN) 更加鲁棒。然而,令人惊讶的是,我们发现这些结论源自不公平的实验设置——Transformer 和 CNN 在不同规模下进行比较,并采用了不同的训练框架。 由 shadow发布于 2025-05-26 10:03:39 大模型视觉识别神经网络 阅读次数 308