商业办公-第24页-频道-至顶网

2025-10-20 13:27:23

罗切斯特理工学院团队突破性成果：让机器能够"看懂"并"解释"为什么选择这个视频

罗切斯特理工学院团队开发出X-CoT系统，突破传统视频推荐"黑箱"限制，利用大语言模型进行链式推理，不仅提升检索准确率5.6%，还能详细解释每个推荐选择的原因。该系统通过两两比较和Bradley-Terry模型优化排序，同时…详细

2025-10-20 13:27:10

智能视觉革命：DEIMv2如何将目标检测推向新高度——Intellindust AI实验室的突破性成果

Intellindust AI实验室推出DEIMv2实时目标检测系统，融合DINOv3技术实现八个版本全场景覆盖。创新的空间调谐适配器让最大版本仅用50.3M参数达到57.8 AP，首次实现sub-10M模型突破50 AP大关。从GPU服务器到移动设备的…详细

人工智能目标检测实时处理

2025-10-20 12:13:43

英特尔人工智能全球影响力嘉年华，中国创新力量崭露头角

英特尔人工智能全球影响力嘉年华，在培养负责任地使用人工智能能力的同时，表彰下一代技术人才。…详细

人工智能英特尔

2025-10-20 12:00:46

大语言模型竟然连最基本的格式要求都做不到？莫斯科高等经济学院揭露AI的"格式盲区"

莫斯科高等经济学院研究员尼古拉·斯克里普科开发了IFEval-FC基准测试，专门评估大语言模型在函数调用中遵循格式指令的能力。研究发现，即使是GPT-5和Claude Opus 4.1等最先进模型，在处理看似简单的格式要求时准确率…详细

人工智能函数调用格式控制

2025-10-20 11:53:28

上海AI实验室推出MinerU2.5：让文档解析变得像看图说话一样简单

上海人工智能实验室联合多家机构推出MinerU2.5文档解析模型，仅用12亿参数就在文本、公式、表格识别等任务上全面超越GPT-4o等大型模型。该模型采用创新的两阶段解析策略，先进行全局布局分析再做局部精细识别，计算效…详细

文档解析深度学习新型算法

2025-10-20 11:48:20

英伟达突破视频生成瓶颈：LONGLIVE让普通电脑也能实时生成超长视频

英伟达研究团队开发的LONGLIVE系统实现了实时交互式长视频生成的重大突破。该系统通过KV重缓存、流式长视频调优和短窗口注意力等创新技术，在单块H100显卡上达到20.7FPS的生成速度，支持240秒视频生成，速度比现有系…详细

人工智能视频生成实时交互

2025-10-20 11:47:52

AI大语言模型训练的"熵值困境"：中科大团队如何让机器学习更稳定

中科大研究团队针对AI大语言模型训练中的"熵值困境"问题，提出了分位数优势估计新方法。该方法通过改进基准线设定策略，有效解决了训练过程中的熵值崩塌和爆炸问题，在数学推理任务上实现了显著性能提升。研究显示，…详细

人工智能强化学习优化算法

2025-10-20 11:45:33

罗格斯大学与Adobe联手破解AI智能体训练难题：大模型如何在复杂任务中学会平衡探索与利用

罗格斯大学与Adobe联合研究发现AI智能体在执行30+步骤的复杂任务时会遭遇"探索-利用级联失效"——早期盲目探索导致错误决策传播至后续步骤，造成训练崩溃。研究团队开发的EPO框架通过轨迹感知熵正则化、历史窗口平滑…详细

人工智能强化学习智能体训练

2025-10-20 11:44:51

KAIST团队用AI当"审稿神探"：破解学术评审中的"瞎说八道"难题

KAIST团队开发了名为REVIEWSCORE的AI系统，用于识别学术评审中的错误信息。研究发现，在AI顶级会议的评审意见中，26.4%的问题在论文中已有答案，15.2%的批评基于错误信息。该系统通过分析评审逻辑、验证前提假设来评…详细

人工智能同行评审质量评估

2025-10-20 10:42:58

清华、新加坡大学等顶尖高校联手：让AI像人类一样深度思考，解决推理训练中的"偏心"问题

清华大学、新加坡国立大学等顶尖高校联合发布重大AI研究成果，创新性地提出变分推理框架解决AI推理训练中的偏见问题。该方法将AI思考过程分解为思维轨迹和答案两部分，通过"思考教练"机制避免AI偏向简单问题的毛病。…详细

人工智能变分推理推理训练

2025-10-20 10:42:42

传统强化学习新变革：谷歌等研究机构发现语言模型可以跳过数字评分直接从文字反馈中学习

新加坡国立大学等机构研究团队提出反馈条件策略（FCP），让AI直接从文字反馈学习而非转换为数字评分。该方法在数学和通用推理任务上表现优异，能处理复杂混合反馈，支持灵活的行为控制，避免了传统强化学习中的奖励黑…详细

人工智能强化学习自然语言处理

2025-10-20 10:42:27

上海AI实验室发布CapRL：图像描述能力实现飞跃式突破

上海AI实验室等机构联合发布CapRL框架，通过创新的强化学习方法解决AI图像描述质量评判难题。该方法将主观的描述质量转化为客观的问答准确率测试，使30亿参数模型达到720亿参数模型的描述效果，在多项基准测试中实现…详细

人工智能强化学习图像描述

2025-10-20 10:17:21

AI语音助手的全面"体检报告"：香港中文大学研究团队首创多维度评测体系

香港中文大学研究团队创建了首个全面评估AI语音助手的标准体系VoiceAssistant-Eval，包含10,497个测试案例，涵盖听说看三大能力维度的13个任务类别。通过对22个模型的测试发现：商业模型并非全面领先，多数模型说话强…详细

人工智能语音交互多模态评测

2025-10-20 10:16:58

人工智能长征路：斯坦福大学等顶尖机构联手揭示AI在复杂任务中的"马拉松式"挑战

这项由滴滴出行、中山大学、清华大学等机构联合开展的突破性研究首次深入揭示了人工智能在处理复杂长期任务时面临的重大挑战。研究团队开发了UltraHorizon测试平台，发现目前最先进的AI系统在长期任务中表现远不如人…详细

人工智能长期任务处理 UltraHorizon基准测试

2025-10-20 10:16:41

香港中文大学推出WebGen-Agent：让AI做网站就像聊天一样简单，准确率暴涨一倍

香港中文大学研究团队开发的WebGen-Agent系统通过为AI配备视觉反馈和用户测试能力，解决了传统网站生成AI"盲目"开发的问题。该系统让AI能够"看见"网站外观并模拟用户测试功能，结合智能回溯机制和Step-GRPO训练方法，…详细

人工智能多模态反馈网站生成

2025-10-20 10:10:48

香港科技大学团队发布LucidFlux：让模糊照片重获新生的AI修复神器

香港科技大学团队开发的LucidFlux是一个革命性的图像修复系统，能够在不需要任何文字描述的情况下自动修复模糊、噪点、压缩损坏的照片。该系统采用双分支条件器协同工作，一个分支保护细节信息，另一个分支抑制伪影，…详细

图像修复扩散变换器无监督学习

2025-10-20 10:05:18

上海交大团队突破机器人场景生成瓶颈：让AI直接从任务指令"看懂"桌面应该怎么摆

上海交通大学和上海人工智能实验室联合团队提出MesaTask框架，首次实现从高层任务指令直接生成符合要求的三维桌面场景。研究构建了包含10700个精调场景的MesaTask-10K数据集，通过"空间推理链"方法将复杂生成过程分解…详细

机器人技术 3D场景生成任务导向生成

2025-10-17 21:12:08

合作攻坚首个药学、睡眠等大模型！北京清华长庚医院携手北电数智，加速AI+医疗多场景落地

一直以来，医疗资源不均衡是我国医疗行业发展的突出挑战。优质医疗资源多集中于大城市三甲医院，导致专家接诊量饱和，部分医生长期处于高强度工作状态。…详细

2025-10-17 17:18:43

智算赋能，生态共荣——超智算人工智能产业生态大会在京启幕，共筑AI发展新范式

2025年10月16日，以“智算驱动·万象更新”为主题的超智算人工智能产业生态大会在北京银保园金融文化交流中心盛大启幕。…详细

2025-10-17 16:56:50

端点科技亮相第二十七届中国国际软件博览会 AI原生ERP斩获双项大奖

「郑州，2025年10月16日」第二十七届中国国际软件博览会（CISE）近日在郑州成功举行。今年的大会以“开源构筑新生态，软件智造新未来”为主题，聚焦讨论了软件领域前沿技术趋势、创新成果、应用实践、产业合作等重点…详细

华为云数字化转型秘籍调研

业界热点: