主要行业

金融服务房地产有色金属

医药生物化工行业机械设备

交通运输农林牧渔电子行业

新能源建筑建材信息服务

汽车行业黑色金属采掘行业

家用电器餐饮旅游公用事业

商业贸易信息设备食品饮料

轻工制造纺织服装新能源汽车

高端装备制造其他行业

以上行业显示为大行业分类，
点击进入可选择细分行业

今日热门

本周热门

本月热门

1.东吴证券-电力设备行业跟踪周报：…

2.天风证券-宏观点评：如何理解经济…

3.慧博智能投研-合成生物学行业深度…

4.东吴证券-新能源行业23年&24Q1报…

5.太平洋证券-4月金融数据点评：时隔…

6.财通证券-科威尔-688551-横向发力…

7.天风证券-电投能源-002128-“煤电…

8.东吴证券-公用事业行业跟踪周报：…

9.天风证券-大类资产风险定价周度观…

更多 >>

精选研报

光大证券-医药生物行业跨市场周报…

平安证券-生物医药行业周报：设备…

民生证券-昊海生科-688366-深度报…

天风证券-长光华芯-688048-多材料…

光大证券-汽车和汽车零部件行业周…

天风证券-消费电子行业研究周报：…

民生证券-社服行业周观点：“低空…

东吴证券-乖宝宠物-301498-宠物食…

开源证券-雅达股份-430556-北交所…

更多 >>

位置：首页 > 金融工程

浙商证券-AI前沿跟踪系列（五）：ConvNets与ViTs对比的启示-231104

日期：2023-11-04 20:44:38 研报出处：浙商证券

研报栏目：金融工程陈冀

(PDF) 7 页 433 KB 分享者：ars****23

PDF阅读器下载

请阅读并同意免责条款

【免责条款】

1. 用户直接或通过各类方式间接使用慧博投研资讯所提供的服务和数据的行为，都将被视作已无条件接受本声明所涉全部内容；若用户对本声明的任何条款有异议，请停止使用慧博投研资讯所提供的全部服务。

2. 用户需知，研报资料由网友上传，所有权归上传网友所有，慧博投研资讯仅提供存放服务，慧博投研资讯不保证资料内容的合法性、正确性、完整性、真实性或品质；

3. 任何单位或个人若认为慧博投研资讯所提供内容可能存在侵犯第三人著作权的情形，应该及时向慧博投研资讯提出书面权利通知，并提供身份证明、权属证明及详细侵权情况证明。慧博投研资讯将遵循"版权保护投诉指引"处理该信息内容；

4.本条款是本站免责条款的附则，其他更多内容详见本站底部《免责声明》；

研究报告内容

　　核心观点

　　本文是基于Smith et al.,2023论文《ConvNets match Vision Transformers at scale》的解读评述。ConvNets与ViTs的对比研究结果强调了计算资源和数据对模型性能的重要性，认为在合理设计的模型中，计算资源和数据的可用性是决定性因素。

　　验证损失与计算预算存在对数缩放关系

　　实验观察到验证损失与用于预训练模型的计算预算之间存在"对数-对数"的缩放规律。在ImageNet上进行微调后，网络与具有相似计算预算的预训练ViTs的性能相匹配。

　　最佳学习率与训练轮次和模型大小相关

　　最佳学习率随训练轮次预算变化。NFNet系列中的所有模型在小的训练轮次预算下都显示出类似的最佳学习率。然而，随着训练轮次预算的增加，最佳学习率会下降，对于较大的模型，最佳学习率下降得更快。

　　NFNets和ViTs性能相似

　　NFNets和ViTs这两种模型架构存在显著差异，但经过大规模预训练后，它们的性能非常相似。两者在ImageNet上的Top-1准确率非常接近。然而，ViTs在特定环境下可能具有实际优势，比如能够在多个模态之间使用相似的模型组件。

　　风险提示

　　本报告依据最新前沿论文进行解读评述，若有理解不当请以原始论文表述为准。且本报告为AI应用方法和框架介绍，并不作为有效投资方法建议，仅供参考。

我要报错

点击浏览报告原文

我要给此报告打分： (带*号为必填)

*我要评分：

当前已有3条点评记录，查看大家的点评记录

主要行业

热门行业

精选研报

浙商证券-AI前沿跟踪系列（五）：ConvNets与ViTs对比的启示-231104