Xbench是知名投资机构红杉中国推出一款全新的AI基准测试工具,旨在真实地反映AI的客观能力,其在评估和推动AI系统提升能力上限与技术边界的同时,会重点量化AI系统在真实场景的效用价值,并采用长青评估的机制,去捕…详细
2025·全球AI攻防挑战赛启动选手招募:图、视、音三赛道逐鹿,推动AI安全技术进化。…详细
宏碁旗下多款产品荣获2025年红点设计大奖,以卓越的产品设计实力深受肯定。本次获奖产品包括AI笔记本电脑、平板电脑、移动连接解决方案以及创新游戏设备概念机,展现了宏碁多元的产品线布局。…详细
这项研究首次将在线强化学习成功应用于流匹配模型,通过巧妙的ODE到SDE转换和去噪减少策略,显著提升了AI图像生成的精确度和可控性。在复合场景生成、文字渲染等任务上取得突破性进展,为AI生成领域开辟了新的技术路…详细
这篇由阿里巴巴集团联合多所知名高校发表的综述论文,系统梳理了统一多模态理解与生成模型的最新发展。研究将现有模型分为扩散、自回归和混合三大类型,详细分析了不同图像编码策略的特点,整理了相关数据集和评估基…详细
伊利诺伊大学研究团队开发出RM-R1奖励模型,首次让AI评委具备深度推理能力。通过"链式评分标准"机制,模型会先分析问题、制定标准、详细推理再给出评判,就像人类评委的思考过程。在三大基准测试中达到业界最高水平,…详细
这是阿里巴巴通义实验室推出的创新AI训练框架ZEROSEARCH,通过虚拟搜索环境替代真实搜索引擎进行训练,成本降低80%以上,效果反而更好。该方法采用渐进式学习策略,从简单到复杂逐步提升训练难度,让AI掌握稳定的搜索…详细
沙特阿拉伯Misraj AI公司开发出名为Sadeed的阿拉伯语标音模型,仅用15亿参数就在标音任务上超越了GPT-4等大型模型。研究团队创建了严格的数据清洗流程和全新的SadeedDiac-25评测基准,解决了现有基准数据污染问题。该…详细
中国人民大学联合北京智源人工智能研究院推出WebThinker框架,首次实现AI在推理过程中自主搜索网络、深度探索网页并撰写研究报告。该系统突破传统AI知识局限,具备类似人类研究员的主动信息获取能力,在多项复杂推理…详细
中国人民大学研究团队开发了名为DeepCritic的AI批评框架,解决了现有AI监督模型批评过于浅薄的关键问题。该系统通过两阶段训练让AI学会深度思考和多角度分析,在数学推理任务上显著超越现有模型,甚至让小规模模型超…详细
香港中文大学团队开发出MathCoder-VL,这是首个通过代码理解数学图形的AI模型。该系统将图形转换为精确绘图代码,而非模糊的自然语言描述,从而实现对几何图形的精确理解。研究团队构建了860万图形-代码配对的训练数…详细
香港大学团队联合快手科技发布的这项交互式生成视频技术综述,展示了AI如何实时创造虚拟世界的革命性能力。该技术通过五大模块协同工作,让AI能够根据用户操作实时生成独特的游戏场景,在游戏、机器人训练和自动驾驶…详细
微软推出的Phi-4-Mini-Reasoning模型仅用38亿参数就在数学推理任务上击败了70-80亿参数的竞争对手。通过创新的四阶段训练方法(大规模中期训练、监督精调、回滚偏好学习、强化学习),该模型在AIME24、MATH-500等测试…详细
港中文团队开发的T2I-R1系统首次让AI学会"思考式"图像生成,通过语义规划和细节优化的双层推理机制,在复杂图像生成任务上比基础模型提升13-19%,甚至超越了业界最强的FLUX.1模型,为AI创意产业应用开辟新路径。…详细
华中科技大学开发的PixelHacker是一款革命性AI图像修复系统,通过创新的"潜在类别指导"方法,只需区分前景和背景两大类别,就能实现近乎完美的图像修复效果。该系统在1400万张图像上训练,采用门控线性注意力机制,在…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。