这项研究提出了统一预算感知(UBA)学习率调度器,解决了深度学习训练中的关键问题:如何在有限迭代次数下获得最佳模型性能。北京大学的研究团队通过构建理论框架,推导出一种只需单一超参数φ的学习率调度方法,实现了灵活性与简单性的平衡。实验结果显示,UBA在视觉和语言任务中,跨不同网络架构和训练预算,始终优于现有方法。该研究不仅提供了理论基础,还建立了参数φ与优化难度的关联,为机器学习实践者提供了一个强大且易用的工具。
Nvidia 正在全球数据中心推广 AI 芯片,其最新 Blackwell 架构在 MLPerf 基准测试中获得最高性能,大幅加速下一代 AI 应用的训练与部署。
密歇根大学研究团队开发的HLIP框架为3D医学影像处理提供了突破性解决方案。通过模拟放射科医生的层次化阅读策略,HLIP能高效处理未经筛选的CT和MRI数据,无需昂贵的人工标注。在两个大规模数据集(包含220K患者的脑部MRI和240K患者的头部CT)上训练后,HLIP在多个公开基准测试中显著超越现有模型,如在Pub-Brain-5上提升32.4%准确率。这一创新不仅降低了计算成本,还为临床AI辅助诊断系统铺平了道路。
Nvidia公布2026财年一季度业绩,营收441亿美元,同比增长69%;新AI超算与显卡产品陆续亮相,尽管出口管控对H20业务造成影响,但整体AI市场前景依然乐观。
RankNovo是由上海人工智能实验室和复旦大学等机构联合开发的创新框架,通过列表式重排序方法整合多个肽段测序模型的优势,提出PMD和RMD两种新指标精确评估肽段差异。实验证明它在9-species基准测试中超越所有单一模型,肽段召回率提升至66.0%,并展示出强大的零样本泛化能力,为蛋白质组学分析提供了全新范式。
这篇研究论文提出了一种称为"正交残差更新"的新方法,解决了深度神经网络中标准残差连接的局限性。研究人员发现,在传统残差连接中,模块输出与输入流直接相加可能导致冗余特征学习。他们的创新方法将模块输出分解为平行和正交两个组件,仅保留正交部分进行更新,促使网络学习更丰富的特征表示。在ResNetV2和Vision Transformer等架构上的实验证明,这种简单修改显著提高了模型准确率和训练稳定性,在ImageNet-1k数据集上使ViT-B模型的表现提升了4.3个百分点。
文章探讨了借助 AI 工具实现各类场景增强(如影视中 EDITH 与现实中的 Cluely AI),提升工作与社交表现,同时引发对伦理风险的讨论。
本文汇总了解释 AI 领域常用术语及技术概念,涵盖从 AGI 到神经网络等多个关键内容,帮助读者理解人工智能的基本原理与应用。
本文介绍OpenAI将ChatGPT Pro内Operator工具升级为o3模型,新系统提升了网页任务执行的准确性与安全防护,为企业自动化操作带来显著优势,同时相较于Google服务更具价格吸引力。
本文探讨开放系统在大语言模型优化中的核心作用,详细说明 GPU 调优、编译器修正和网络优化如何推动 AI 性能提升,并以 CentML 平台为例展示开源系统如何降低成本、提升效率。
Aarki 推出的 Encore 平台借助先进 AI 与深度学习,实现全流程精准用户获取和留存,同时保障隐私安全,为移动营销注入全新活力。
本文介绍了 Sakana 针对语言模型提出的全新 CTM 架构,通过内部短时记忆和自适应运算,令模型推理更接近人类思考方式。
本文探讨2025年人机合作新趋势,AI负责处理数据密集型任务,人类侧重创意、情商和伦理决策,企业高层须通过透明与负责任的变革管理,实现人机优势互补。
Waymo公布现拥有逾1500台商用机器人出租车,并与 Magna 合作将在亚利桑那工厂生产超过2000台自动驾驶 Jaguar I-Pace,借助全新自动化装配线迅速实现车辆量产和上路运营。
阿里巴巴推出全新 Qwen3 系列人工智能模型,采用混合专家技术在编码、数学和推理测试中超越部分美国顶级模型,支持119种语言,助力实现超越人类智慧的通用人工智能目标。
英伟达发布 NeMo 微服务,帮助企业构建自主学习、持续优化的 AI 代理,实现数据驱动的业务升级。
Zencoder 今日收购了在 JetBrains 平台备受欢迎的 Machinet,通过整合其“Repo Grokking”技术与多代理系统,为 Java 开发及其他 IDE 用户提供更高效的 AI 编码助手,力图超越 GitHub Copilot 等竞争对手。
Anthropic 上周四宣布启动一项研究计划,探讨 AI 是否可能具备类似人类的意识与情感体验,及如何界定其福利并实施低成本干预,相关论题在学界颇具争议。
Google 推出统一安全平台 GUS,整合多项安全产品和服务,包括威胁情报、安全运营、云安全等。该平台由 Gemini AI 驱动,旨在为企业提供全面的安全数据层面,简化安全管理流程,提高威胁检测和响应效率。Google 期望通过这一平台解决企业安全领导者面临的碎片化安全解决方案问题,为用户提供更好的安全成果。
大语言模型技术日新月异,但评估它们的能力和局限性仍面临挑战。传统基准测试已不足以全面衡量这些强大工具。本文提出了四个新的人本主义评估维度:价值观、情感、思维和交互,旨在从更深层次、更以人为中心的角度来评估这些变革性技术,以确保AI的发展不仅仅追求智能,更要追求智慧、责任和协作。