韦德体育注册

weidetiyuwangzhi

韦德体育网址

普林斯顿大学团队颠覆传统:新方法让AI训练更快更聪明无需复杂标准化韦德体育- 韦德体育官方网站- APP下载步骤

日期:2025-12-31 13:53

  韦德体育,韦德体育官方网站,韦德体育APP下载

普林斯顿大学团队颠覆传统:新方法让AI训练更快更聪明无需复杂标准化韦德体育- 韦德体育官方网站- 韦德体育APP下载步骤

  在AI领域的发展长河中,有一个看似不起眼但极其重要的技术环节——标准化层,它就像是烹饪过程中必不可少的调料,帮助神经网络保持稳定训练。然而,来自普林斯顿大学、纽约大学和卡内基梅隆大学的研究团队却在2024年12月发表了一项突破性研究,彻底改写了这一传统认知。这篇发表在arXiv预印本平台(论文编号:arXiv:2512.10938v1)的研究论文,由普林斯顿大学的陈明志和刘壮等人领衔完成,提出了一种名为动态误差函数(Derf)的创新方法,不仅能够完全取代传统的标准化层,更能让AI模型的表现变得更加优秀。

  测试的第一站是计算机视觉领域,这里使用的是著名的ImageNet-1K数据集,就像视觉AI领域的高考,几乎所有重要的图像识别算法都会在这个数据集上接受检验。研究团队测试了两种规模的视觉变换器(ViT-Base和ViT-Large),结果令人印象深刻。在ViT-Base上,Derf达到了82.8%的准确率,比传统层标准化的82.3%提升了0.5个百分点,比动态双曲正切的82.5%提升了0.3个百分点。在更大的ViT-Large模型上,提升幅度更加明显,Derf达到了83.8%的准确率,比层标准化提升了0.7个百分点。

  接下来的测试涉及图像生成领域,这是一个更具挑战性的任务,就像从学会看图片升级到学会画图片。研究团队使用了三种不同规模的扩散变换器(DiT-B/4、DiT-L/4和DiT-XL/2),评估生成图像的质量。在这个领域,质量评估使用的是FID分数,这个分数越低表示生成的图像质量越好,就像高尔夫球的杆数越少越好。结果显示,Derf在所有三个模型上都取得了显著的改善:在DiT-B/4上FID分数从64.93降低到63.23,在DiT-L/4上从45.91降低到43.94,在DiT-XL/2上从19.94降低到18.92。

  最具挑战性的测试来自生物信息学领域的DNA序列建模。这个任务就像让计算机学会阅读生命的密码,需要理解DNA序列中复杂的模式和规律。研究团队使用了两种专门的模型:HyenaDNA和Caduceus,在GenomicBenchmarks数据集上进行测试。令人惊喜的是,Derf在这个完全不同的领域也表现出色,在HyenaDNA上将准确率从85.2%提升到85.7%,在Caduceus上从86.9%提升到87.3%。

Copyright © 2002-2025 韦德体育- 韦德体育官方网站- 韦德体育APP下载 版权所有 非商用版本