中山大学团队针对OpenAI O1等长思考推理模型存在的"长度不和谐"问题,提出了O1-Pruner优化方法。该方法通过长度-和谐奖励机制和强化学习训练,成功将模型推理长度缩短30-40%,同时保持甚至提升准确率,显著降低了推理…详细
上海AI实验室研究团队深入调查了12种先进视觉语言模型在自动驾驶场景中的真实表现,发现这些AI系统经常在缺乏真实视觉理解的情况下生成看似合理的驾驶解释。通过DriveBench测试平台的全面评估,研究揭示了现有评估方…详细
谷歌和香港大学研究团队提出Learn-by-interact框架,让AI智能体通过自主与环境互动来学习,核心创新是"逆向构建"机制,能将失败操作转化为有价值训练数据。在四个真实环境测试中,该方法显著提升了AI在软件编程、网页…详细
TransPixeler是由香港科技大学和Adobe研究院联合开发的AI视频生成技术,专门解决生成带透明效果(RGBA)视频的难题。该技术巧妙扩展现有视频生成模型,让AI能同时生成RGB颜色和Alpha透明度信息,避免了传统"先生成后…详细
腾讯混元团队通过366组实验发现了AI大模型低精度训练的关键规律,提出Capybara缩放定律。研究揭示指数位比尾数位更重要,存在训练数据临界值现象,4-8位精度具有最佳成本效益。该成果为AI训练提供精确预测工具,有助…详细
阿里巴巴研究团队开发出ProgCo方法,让AI像程序员一样生成验证程序来检查和纠正自己的答案。该方法在数学问题和指令遵循任务上表现卓越,准确率提升超过7%,同时具有比传统方法更高的计算效率,为AI自我纠错开辟了新…详细
小豆科技发布的Xmodel-2是一个专门针对推理任务优化的12亿参数语言模型。通过创新的张量程序架构、WSD学习率调度和数据配比优化,该模型在复杂推理和智能代理任务上表现卓越,超越了许多同规模模型。经1.5万亿token训…详细
2025年,AI技术演进正呈指数级加速,当我们惊叹于AIGC的创造力时,你是否想过,我们日常接触的AI应用,或许只是整个庞大技术体系中的冰山一角?应用之下,是由算力、数据、模型和基础设施共同构筑的庞大基石。…详细
南洋理工大学研究团队构建了Video-MMMU基准,通过300个专业教学视频和900道问题,评估AI模型从视频中学习知识的能力。研究发现人类专家知识增益达33.1%,而最先进的AI模型仅达15.6%,特别在知识适应新场景方面表现不…详细
清华大学等机构开发的SimpleVLA-RL框架突破了传统机器人依赖大量人类演示数据的局限,让机器人通过强化学习自主试错掌握技能。该方法在数据稀缺情况下将成功率从17.3%提升至91.7%,并在真实世界中验证有效,机器人还…详细
港中深研究团队发现语音AI系统"答非所问"的根本原因在于声学和语义理解的认知鸿沟,并提出EchoX解决方案。通过创新的"回声训练"方法,EchoX用仅6千小时训练数据就在知识问答任务中取得显著性能提升,综合得分46.3分超…详细
9月12日,在2025全球数据存储教授论坛上,第五届“奥林帕斯奖”获奖名单正式揭晓。来自国内外的6支顶尖科研团队,凭借其在数据存储领域的技术突破,分别斩获1项奥林帕斯奖与5项奥林帕斯先锋奖。…详细
ByteDance智能创作实验室与清华大学联合发布HuMo系统,这是首个实现文字、图片、音频三模态协同控制的人物视频生成框架。该系统通过创新的渐进式训练方法和时间自适应引导策略,让用户仅需提供文字描述、参考照片和音…详细
字节跳动种子团队提出熵调制策略梯度EMPG方法,解决AI智能体在长期任务中的稀疏奖励学习难题。通过自校准梯度缩放和未来清晰度奖励双重机制,根据步骤不确定性动态调整学习信号强度。在WebShop、ALFWorld和Deep Sear…详细
快手科技Kling团队发布的Kling-Avatar技术通过多模态大语言模型导演实现真正的指令理解,采用级联生成框架支持长时长数字人视频制作。该系统在唇形同步、情感表达、身份一致性等关键指标上全面超越现有技术,支持108…详细
香港大学团队发布史上最大规模AI绘画推理数据集FLUX-Reason-6M,包含600万张高质量图像和2000万条双语描述,耗费15000个GPU天计算资源。首创"生成链式思维"训练法,让AI学会像人类艺术家般思考创作过程。同时推出PRI…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。