中山大学团队针对OpenAI O1等长思考推理模型存在的"长度不和谐"问题,提出了O1-Pruner优化方法。该方法通过长度-和谐奖励机制和强化学习训练,成功将模型推理长度缩短30-40%,同时保持甚至提升准确率,显著降低了推理…详细
上海AI实验室研究团队深入调查了12种先进视觉语言模型在自动驾驶场景中的真实表现,发现这些AI系统经常在缺乏真实视觉理解的情况下生成看似合理的驾驶解释。通过DriveBench测试平台的全面评估,研究揭示了现有评估方…详细
谷歌和香港大学研究团队提出Learn-by-interact框架,让AI智能体通过自主与环境互动来学习,核心创新是"逆向构建"机制,能将失败操作转化为有价值训练数据。在四个真实环境测试中,该方法显著提升了AI在软件编程、网页…详细
TransPixeler是由香港科技大学和Adobe研究院联合开发的AI视频生成技术,专门解决生成带透明效果(RGBA)视频的难题。该技术巧妙扩展现有视频生成模型,让AI能同时生成RGB颜色和Alpha透明度信息,避免了传统"先生成后…详细
腾讯混元团队通过366组实验发现了AI大模型低精度训练的关键规律,提出Capybara缩放定律。研究揭示指数位比尾数位更重要,存在训练数据临界值现象,4-8位精度具有最佳成本效益。该成果为AI训练提供精确预测工具,有助…详细
阿里巴巴研究团队开发出ProgCo方法,让AI像程序员一样生成验证程序来检查和纠正自己的答案。该方法在数学问题和指令遵循任务上表现卓越,准确率提升超过7%,同时具有比传统方法更高的计算效率,为AI自我纠错开辟了新…详细
小豆科技发布的Xmodel-2是一个专门针对推理任务优化的12亿参数语言模型。通过创新的张量程序架构、WSD学习率调度和数据配比优化,该模型在复杂推理和智能代理任务上表现卓越,超越了许多同规模模型。经1.5万亿token训…详细
2025年,AI技术演进正呈指数级加速,当我们惊叹于AIGC的创造力时,你是否想过,我们日常接触的AI应用,或许只是整个庞大技术体系中的冰山一角?应用之下,是由算力、数据、模型和基础设施共同构筑的庞大基石。…详细
南洋理工大学研究团队构建了Video-MMMU基准,通过300个专业教学视频和900道问题,评估AI模型从视频中学习知识的能力。研究发现人类专家知识增益达33.1%,而最先进的AI模型仅达15.6%,特别在知识适应新场景方面表现不…详细
清华大学等机构开发的SimpleVLA-RL框架突破了传统机器人依赖大量人类演示数据的局限,让机器人通过强化学习自主试错掌握技能。该方法在数据稀缺情况下将成功率从17.3%提升至91.7%,并在真实世界中验证有效,机器人还…详细
港中深研究团队发现语音AI系统"答非所问"的根本原因在于声学和语义理解的认知鸿沟,并提出EchoX解决方案。通过创新的"回声训练"方法,EchoX用仅6千小时训练数据就在知识问答任务中取得显著性能提升,综合得分46.3分超…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。