CVPR2023｜清华大学提出GAM：神经网络“一阶平滑优化器”，显著提升模型“泛化能力”

日期：2024-12-26 作者：s3gly 移动：http://mip.riyuangf.com/mobile/quote/55665.html

关注公众号，发现CV技术之美

近年来，神经网络收敛位置的平滑性(flatness)被证明与模型泛化能力有直接的联系，而现有对平滑性的定义仍局限于sharpness-aware minimization(SAM)及其变体的零阶平滑性(zeroth-order flatness)，即收敛位置邻域域内最大损失值与当前损失值的差。清华大学崔鹏教授的CVPR2023 Highlight论文”Gradient norm aware minimization seeks first-order flatness and improves generalization”发现零阶平滑性有一定的局限性，所以提出了一阶平滑性的概念，并进一步提出了可以约束一阶平滑性的优化器GAM，大量实验证明GAM相比于现有优化器有更强的泛化能力。

论文：https://arxiv.org/abs/2303.03108
代码：https://github.com/xxgege/GAM

sharpness-aware minimization(SAM)[3]理论证明了平滑极值点在测试数据上的泛化误差低于尖锐极值点，并进一步提出了优化零阶平滑性，即收敛位置邻域半径（perturbation radius,

加入「计算机视觉」交流群

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

点赞 0举报收藏 0评论 0分享 0

0 条相关评论

相关最新动态

谷歌SEO，如何给竞争关键词排名？

微信清理大师

排行榜：五款免费大头贴制作软件推荐

震惊！新iPhone17丑哭了！iPhone 17外观爆料：模组改为条形跑道

镇江屋顶漏水维修电话〈免费上门〉镇江屋顶防水补漏师傅

社会保险认证人脸识别平台：便捷、高效与安全并重的社保认证新方式

泸县第二人民医院医共体党委书记康健接受纪律审查和监察调查

阿里巴巴和淘宝有什么区别

推荐最新动态

点击排行

1001EV晨报｜ “宝宝巴士”极氪MIX今日上市；花旗预计比亚迪三季度盈利超百亿，11月销量有望突破50万辆

1002SD-WebUI插件推荐-提示词扩展

1003史上最全东丽碳纤维型号与参数

1004艾瑞银行营销报告：把握银行营销数字化底层需求，全面实现技术与业务的深度融合

1005清澈的爱只为人民——大型话剧《张富清》恩施巡演侧记

1006抖音号实名认证怎么找回？抖音实名认证好处有哪些？

1007北京四日游最佳路线北京4天时间怎么玩北京四天三夜旅游攻略

1008哪些人需要粉妍片？玫琳凯怡日健粉妍片多少钱？成份作用有什么效果？2019年1月促销活动！

1009什么是淘宝关键词搜索规则？搞懂淘宝的搜索规则