科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-05-22 14:01:09
链式模型:微软打造的"俄罗斯套娃"语言模型将提高训练效率和推理灵活性

微软研究院提出Chain-of-Model学习范式,将因果关系融入大型语言模型的隐藏状态。这一创新通过"链式表示"将模型参数分为多个子表示链,使模型能够逐层扩展且保持前序能力。研究成果包括CoLM和CoLM-Air两种实现,实验…详细

大语言模型神经网络架构弹性推理

2025-05-22 14:00:03
大模型不再"想"得太多:字节跳动AdaCoT通过强化学习实现自适应思维链

这篇研究介绍了字节跳动团队开发的AdaCoT框架,通过强化学习实现大型语言模型的自适应思维链触发。该框架将问题设计为帕累托优化,平衡推理质量与计算效率,使模型能根据输入复杂度自主决定是否使用详细推理。研究结…详细

人工智能强化学习大型语言模型

2025-05-22 13:58:28
AdaptThink:教会推理模型如何灵活选择思考方式

这项由清华大学张嘉杰等人开发的AdaptThink算法,教会了AI推理模型根据问题难度自动选择思考模式。研究发现,对于简单问题,直接给出答案(NoThinking模式)不仅效率高,准确率还可能更好;而复杂问题则需要深入思考…详细

人工智能强化学习推理模型

2025-05-22 13:57:25
MM-PRM:通过可扩展的步骤级监督提升多模态数学推理能力

这篇研究论文介绍了MM-PRM,一种用于增强多模态数学推理能力的过程奖励模型。研究团队首先构建了一个强大的多模态策略模型MM-Policy,然后创建了包含10,000个多模态数学问题的数据集MM-K12。利用蒙特卡洛树搜索(MCTS…详细

多模态数学推理过程奖励模型步骤级监督

2025-05-22 13:55:43
FedSVD:使用自适应正交化技术提升LoRA在联邦学习中的隐私保护能力

这项研究提出了FedSVD,一种在联邦学习环境中提升低秩适应(LoRA)微调效果的新方法。研究团队通过引入基于奇异值分解的自适应正交化技术,成功解决了差分隐私随机梯度下降(DP-SGD)与LoRA结合时导致的噪声放大问题。实…详细

联邦学习差分隐私低秩适应

2025-05-22 13:44:28
阿里云:以战略级投入,全力支持中国企业出海

阿里云在全球29个地域运营了87个可用区,可提供394款云与AI产品、59项技术服务,是亚太规模第一的云服务商。…详细

阿里云出海

2025-05-22 13:18:14
施耐德电气EcoFit工业自动化适配改造中心在京落成 为工业服务升级注入新动能

今日,产业技术的全球领导者施耐德电气在北京成立EcoFit工业自动化适配改造中心,强势打造面向工业服务的创新引擎。…详细

2025-05-22 13:16:22
昆仑万维面向全球发布天工超级智能体:基于deep research的“AI版office”

5月22日,昆仑万维面向全球市场,同步发布天工超级智能体(Skywork Super Agents)。…详细

2025-05-22 11:06:48
2025 IAI传鉴国际创意节今日在北京开幕 | 鉴势新生力

本届峰会聚焦AI、消费升级、内容创新等核心议题,让我们共同聚焦这场思想盛宴,解码智能科技如何成为品牌破局增长的核心引擎,在技术革新与行业演进的交汇点上,探寻广告营销的未来。…详细

2025-05-22 10:19:30
Salesforce 以 AI 代理为金融服务公司带来更多人性化体验

本文介绍了 Salesforce 推出专为金融服务设计的 Agentforce 平台预建 AI 模板,帮助银行、保险和理财等业务自动化,从而减轻专业人员的行政负担,提升客户体验。…详细

人工智能自然语言处理自动化

2025-05-22 10:17:44
开放系统如何驱动 AI 性能

本文探讨开放系统在大语言模型优化中的核心作用,详细说明 GPU 调优、编译器修正和网络优化如何推动 AI 性能提升,并以 CentML 平台为例展示开源系统如何降低成本、提升效率。…详细

人工智能深度学习新型算法

2025-05-22 10:15:13
VAST Data 推出 AI 操作系统

VAST Data 发布 AI 操作系统,构建分布式智能代理计算平台及云端统一数据存储,加速 AI 任务与海量数据处理。…详细

人工智能分布式存储全新 AI 操作系统

2025-05-22 10:13:47
Hitachi Vantara 推出 VSP 360,一站式存储控制平面

VSP 360 是 Hitachi Vantara 推出的全新管理层,统一管理 VSP One 存储资源,支持混合云部署、AIOps 智能预测及自动化运维。…详细

数据管理AIOps统一控制平台

2025-05-22 10:11:25
人类的下一次飞跃:量子 AI、UBI 和全民公平的机会

量子 AI 结合量子计算与人工智能,为全球 UBI 提供可能,通过优化资源分配和经济建模推动公平与稳定,激发创新和人类潜能,迈向从生存到繁荣的新纪元。…详细

人工智能量子计算新型算法

2025-05-22 08:28:45
让大语言模型学会何时"少思考":新加坡国立大学研究团队开发出自适应推理框架

这项新加坡国立大学的研究开发了"Thinkless"框架,解决了大语言模型在推理时的效率问题。研究者通过引入两种控制标记和创新的解耦式相对策略优化算法,使模型能够智能地决定何时使用详细推理、何时直接给出简洁答案,…详细

人工智能强化学习大语言模型

2025-05-22 08:27:02
静态与动态的和谐:成功大学3D-4D高斯分布融合技术突破动态场景建模效率瓶颈

这项研究提出了一种名为"混合3D-4D高斯分布"的新方法,巧妙解决了动态场景重建的效率问题。研究团队发现传统4D高斯分布技术在处理静态区域时存在大量冗余,因此开发了自动识别静态/动态区域的算法,并将静态部分转换…详细

计算机视觉3D高斯飞溅技术动态场景重建

2025-05-22 08:26:13
CPGD:让语言模型的规则强化学习更稳定可靠

这项研究提出了CPGD算法,解决语言模型规则强化学习中的训练不稳定问题。通过用策略梯度损失替代PPO-clip损失,并引入裁剪机制和策略漂移正则化,CPGD有效避免了现有方法中由重要性采样比率引起的训练崩溃。实验结果…详细

强化学习语言模型稳定性多模态推理

2025-05-22 08:25:24
拆解界面,组合交互:香港大学和Salesforce AI的创新研究让电脑操作模型更精准

这项由香港大学和Salesforce AI Research联合开展的研究解决了AI助手操作电脑时的关键障碍:GUI定位能力。研究者创建了新的OSWORLD-G基准测试(564个样本)和JEDI数据集(400万示例),通过将复杂界面交互分解为基础…详细

人工智能图形用户界面自然语言处理

2025-05-22 08:22:41
拆解断点思维链:大模型推理效率革命 - 阿姆斯特丹大学与Salesforce AI联合研究

这项研究提出了一种名为"断点思维链推理"的创新方法,颠覆了大语言模型中"完整思考过程必不可少"的传统观念。研究表明,在思考链中途截断并直接生成答案竟能达到甚至超过完整推理的准确率,同时显著节省计算资源。基…详细

人工智能大语言模型推理效率

2025-05-22 08:21:17
VisionReasoner:中国香港中文大学与智谱研究院联合打造的一体化视觉感知推理系统

香港中文大学与智谱研究院的研究团队提出了VisionReasoner,一个基于强化学习的统一视觉感知与推理框架。该模型能够同时处理检测、分割和计数三类视觉任务,通过结构化推理过程分析图像内容。实验显示,与Qwen2.5VL相…详细

人工智能视觉推理强化学习

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章