微软研究院提出Chain-of-Model学习范式,将因果关系融入大型语言模型的隐藏状态。这一创新通过"链式表示"将模型参数分为多个子表示链,使模型能够逐层扩展且保持前序能力。研究成果包括CoLM和CoLM-Air两种实现,实验…详细
这篇研究介绍了字节跳动团队开发的AdaCoT框架,通过强化学习实现大型语言模型的自适应思维链触发。该框架将问题设计为帕累托优化,平衡推理质量与计算效率,使模型能根据输入复杂度自主决定是否使用详细推理。研究结…详细
这项由清华大学张嘉杰等人开发的AdaptThink算法,教会了AI推理模型根据问题难度自动选择思考模式。研究发现,对于简单问题,直接给出答案(NoThinking模式)不仅效率高,准确率还可能更好;而复杂问题则需要深入思考…详细
这篇研究论文介绍了MM-PRM,一种用于增强多模态数学推理能力的过程奖励模型。研究团队首先构建了一个强大的多模态策略模型MM-Policy,然后创建了包含10,000个多模态数学问题的数据集MM-K12。利用蒙特卡洛树搜索(MCTS…详细
这项研究提出了FedSVD,一种在联邦学习环境中提升低秩适应(LoRA)微调效果的新方法。研究团队通过引入基于奇异值分解的自适应正交化技术,成功解决了差分隐私随机梯度下降(DP-SGD)与LoRA结合时导致的噪声放大问题。实…详细
阿里云在全球29个地域运营了87个可用区,可提供394款云与AI产品、59项技术服务,是亚太规模第一的云服务商。…详细
今日,产业技术的全球领导者施耐德电气在北京成立EcoFit工业自动化适配改造中心,强势打造面向工业服务的创新引擎。…详细
5月22日,昆仑万维面向全球市场,同步发布天工超级智能体(Skywork Super Agents)。…详细
本届峰会聚焦AI、消费升级、内容创新等核心议题,让我们共同聚焦这场思想盛宴,解码智能科技如何成为品牌破局增长的核心引擎,在技术革新与行业演进的交汇点上,探寻广告营销的未来。…详细
本文介绍了 Salesforce 推出专为金融服务设计的 Agentforce 平台预建 AI 模板,帮助银行、保险和理财等业务自动化,从而减轻专业人员的行政负担,提升客户体验。…详细
本文探讨开放系统在大语言模型优化中的核心作用,详细说明 GPU 调优、编译器修正和网络优化如何推动 AI 性能提升,并以 CentML 平台为例展示开源系统如何降低成本、提升效率。…详细
VAST Data 发布 AI 操作系统,构建分布式智能代理计算平台及云端统一数据存储,加速 AI 任务与海量数据处理。…详细
VSP 360 是 Hitachi Vantara 推出的全新管理层,统一管理 VSP One 存储资源,支持混合云部署、AIOps 智能预测及自动化运维。…详细
量子 AI 结合量子计算与人工智能,为全球 UBI 提供可能,通过优化资源分配和经济建模推动公平与稳定,激发创新和人类潜能,迈向从生存到繁荣的新纪元。…详细
这项新加坡国立大学的研究开发了"Thinkless"框架,解决了大语言模型在推理时的效率问题。研究者通过引入两种控制标记和创新的解耦式相对策略优化算法,使模型能够智能地决定何时使用详细推理、何时直接给出简洁答案,…详细
这项研究提出了一种名为"混合3D-4D高斯分布"的新方法,巧妙解决了动态场景重建的效率问题。研究团队发现传统4D高斯分布技术在处理静态区域时存在大量冗余,因此开发了自动识别静态/动态区域的算法,并将静态部分转换…详细
这项研究提出了CPGD算法,解决语言模型规则强化学习中的训练不稳定问题。通过用策略梯度损失替代PPO-clip损失,并引入裁剪机制和策略漂移正则化,CPGD有效避免了现有方法中由重要性采样比率引起的训练崩溃。实验结果…详细
这项由香港大学和Salesforce AI Research联合开展的研究解决了AI助手操作电脑时的关键障碍:GUI定位能力。研究者创建了新的OSWORLD-G基准测试(564个样本)和JEDI数据集(400万示例),通过将复杂界面交互分解为基础…详细
这项研究提出了一种名为"断点思维链推理"的创新方法,颠覆了大语言模型中"完整思考过程必不可少"的传统观念。研究表明,在思考链中途截断并直接生成答案竟能达到甚至超过完整推理的准确率,同时显著节省计算资源。基…详细
香港中文大学与智谱研究院的研究团队提出了VisionReasoner,一个基于强化学习的统一视觉感知与推理框架。该模型能够同时处理检测、分割和计数三类视觉任务,通过结构化推理过程分析图像内容。实验显示,与Qwen2.5VL相…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。