Salesforce AI Research团队开发的MCPEval框架为AI助手工具使用能力评估提供了全新解决方案。该框架基于Model Context Protocol标准,实现了从任务生成到深度分析的全自动评估流程,测试了十个AI模型在五个真实领域的…详细
麻省理工学院研究团队开发出能够像人类一样理解物理世界规律的AI系统。该系统通过自主观察物理现象学习,无需人类预编程物理知识,能准确预测复杂物理场景中的物体行为。这项技术在机器人、自动驾驶、科学研究等领域…详细
KAUST研究团队开发了PHYSGYM测试平台,用于评估大语言模型在物理科学发现中的推理能力。该平台通过精确控制先验知识水平,测试AI在不同信息条件下进行实验设计和规律发现的能力。研究发现当前AI模型严重依赖先验知识…详细
南洋理工大学团队突破长视频生成技术瓶颈,提出TokensGen框架,通过压缩标记和模块化设计实现两分钟连贯视频生成。该方法将长视频制作分解为内容控制、一致性保证和平滑过渡三个任务,有效解决了传统方法的内存限制和…详细
英国帝国理工学院等机构研究团队发现,在AI训练中仅使用"再试试"等简单反馈,就能显著提升大语言模型的多轮推理能力。这种方法解决了传统单轮训练导致AI重复错误答案的问题,在多轮对话成功率上提升14%,且具备跨领域…详细
来自印度维洛尔理工学院的研究团队开发了UGPL系统,这是一种模仿医生诊断思路的AI技术,能够智能分析CT扫描图像。系统采用"先看森林再看树"的策略,首先进行全局分析识别可疑区域,然后重点检查这些区域。在肾脏疾病…详细
北大团队突破性研究Being-H0系统,首次实现让机器人通过观看人类视频学习灵巧手部动作。该系统采用"物理指令调优"方法,在150万个动作样本上训练,达到毫米级精度,在多项复杂操作测试中成功率达60%-100%,仅需传统方…详细
加州大学伯克利分校研究团队开发出"分层运动预测网络",让AI通过观看视频学会预测复杂物体运动,无需精确物理计算。系统在简单运动预测中达91%准确率,复杂场景78%,某些情况下超越人类判断。技术有望应用于机器人、…详细
这项由微软研究院主导的突破性研究,首次提出让AI学习如何为其他AI制定最佳训练数据配方的创新思路。通过训练一个专门的"数据混合代理",成功解决了大模型持续学习中的"灾难性遗忘"难题,在数学推理任务上平均提升3.…详细
斯坦福大学研究团队发现视觉语言模型能够像人类一样"看懂"数据图表,在金融、医疗等领域展现出超越传统方法的分析能力。这项发表于《自然·机器智能》的研究首次系统探索了AI视觉数据分析的潜力,为实现数据分析民主…详细
这项由上海科技大学何旭明教授团队与瑞士洛桑联邦理工学院合作完成的研究,提出了GeoDistill框架,通过师生学习模式解决跨视角定位问题。该技术让AI系统仅凭地面照片就能在卫星地图上实现精确定位,无需昂贵的精确标…详细
MiroMind AI公司发布了完全开源的M1系列数学推理模型,采用创新的CAMPO算法实现分阶段训练和重复惩罚机制。该模型在AIME24、AIME25等权威测试中表现优异,不仅准确率高且推理过程简洁高效。研究团队公开了全部训练数…详细
浙江大学团队创新性地将人类点击行为的高斯分布特征应用于AI界面操作训练,开发出GUI-G2方法。该方法摒弃传统二元奖励机制,采用连续高斯奖励建模,包含点精度评估和区域覆盖评估两大机制,并引入自适应方差处理不同…详细
阿里巴巴通义实验室推出WebShaper系统,通过创新的形式化驱动方法让AI具备人类级别的信息搜索推理能力。该系统在权威测试中取得优异成绩,WebShaper-72B模型在GAIA测试中获得60.19分,超越众多开源系统。其核心创新在…详细
在一年一度的7月24日“运维节”,普洛斯数据中心举办了一系列丰富多样的运维主题活动,包括“技能大比武”、“运维知识竞赛”以及“闪耀运维人”先进案例评选等。…详细
斯坦福大学人工智能实验室团队在2015年发表的突破性研究,首次实现了让计算机像人类一样"看图说话"的能力。他们通过创新的注意力机制,让视觉识别系统和语言生成系统能够智能协作,不仅准确识别图像内容,还能生成自…详细
AI并不是一项孤立的技术。要释放其真正价值,必须将AI深度融入企业的业务流程之中。要做到这一点,企业需要构建三大核心能力:现代化的云端软件、现代化的数据管理体系,以及与两者紧密集成的AI技术体系。…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。