联想万全大模型训推一体机荣获HPC China 2025产品创新奖。…详细
中国人民大学和字节跳动联合提出Pass@k训练方法,通过给AI模型多次答题机会来平衡探索与利用。该方法不仅提升了模型的多样性表现,还意外改善了单次答题准确率。实验显示,经过训练的7B参数模型在某些任务上超越了GP…详细
南加州大学等机构研究团队开发出突破性的"N-gram覆盖攻击"方法,仅通过分析AI模型生成的文本内容就能检测其是否记住了训练数据,无需访问模型内部信息。该方法在多个数据集上超越传统方法,效率提升2.6倍。研究还发现…详细
微软研究团队发现AI推理模型存在"长度膨胀"问题——回答冗长啰嗦但准确性并未提升。他们提出GFPO方法,通过训练时生成更多候选答案但只学习最简洁有效的回答,成功将AI回答长度减少46%-85%,同时保持原有准确性。该方…详细
华沙大学联合研究团队首次将μ参数化技术成功扩展至混合专家架构,解决了MoE模型训练中的超参数调优难题。通过理论分析和实验验证,证明了小模型上找到的最佳学习率可直接应用于大模型,大幅降低训练成本。研究发现专…详细
印度理工学院等机构研究发现,即使是最先进的AI模型如GPT-4o、Claude等,在面对间接表达、干扰信息或背景过载的"混淆问题"时,准确率会从70-80%骤降至25-40%。研究团队开发的ObfusQAte评估框架首次系统性揭示了大语言…详细
清华大学团队开发的ASM-UNet系统通过创新的自适应扫描机制,首次实现了医疗影像精细结构的智能识别。该系统结合群体共性和个体差异的双重评分策略,在胆管系统等微小复杂结构分割上取得突破性进展。团队还构建了BTMS…详细
GSFixer是由北京大学等机构联合开发的3D重建技术,专门解决从稀少照片中重建高质量3D模型的难题。该技术通过参考引导的视频扩散模型,融合2D语义和3D几何信息,确保生成的新视角与原始照片保持一致性。相比现有方法在…详细
这项研究推出了CannyEdit图像编辑框架,通过选择性边缘控制和双重提示策略,实现了前所未有的自然编辑效果。在用户测试中,普通用户仅有49.2%能识别出其编辑痕迹,远低于其他方法的76-89%识别率。该技术无需专门训练…详细
代尔夫特理工大学研究团队首次实现了完全分布式的多无人机协作搬运系统,通过多智能体强化学习让三台无人机在无需相互通信的情况下精确控制悬挂重物的6自由度姿态。该方法仅通过观察被搬运物体状态实现隐性协作,计算…详细
腾讯微信视觉团队提出Stand-In框架,仅用1%参数实现高质量身份保持视频生成。该方法通过条件图像分支和受限自注意力机制,让AI在生成视频时能持续参考原始照片,确保人物面部特征一致。在多项评测中表现优异,面部相…详细
蚂蚁集团智能医疗部门提出GRAO统一对齐框架,通过"模仿-探索-超越"三阶段机制解决传统AI对齐方法局限性。该方法相比监督微调、强化学习等基线方法分别实现57.70%、7.95%等显著提升,特别在专家混合模型上表现突出,为…详细
ByteDance研究团队推出的M3-Agent是首个具备长期记忆能力的多模态AI代理。它能同时处理视频、音频信息,像人类一样积累经验和知识。系统采用情节记忆和语义记忆双重机制,以实体为中心组织信息,并通过多轮推理解决复…详细
微软研究院开发的VisCodex实现了多模态AI的重要突破,通过创新的模型融合技术让AI同时具备视觉理解和编程能力。该系统采用任务向量融合方法,将视觉语言模型与编程模型巧妙结合,并构建了包含59.8万样本的多模态编程…详细
清华大学研究团队开发了AMFT自适应元微调方法,通过智能元学习控制器动态平衡模仿学习与强化学习,解决传统AI训练中的灾难性遗忘问题。该方法在数学推理、视觉推理等多项任务中创造最佳成绩,不仅提高了性能还增强了…详细
德国慕尼黑工业大学研究团队探索了AI自动生成解释是否能帮助其他AI模型提升决策性能。研究使用四个大型语言模型生成自然语言解释,并测试其对传统模型和先进语言模型的影响。结果显示,解释能显著改善传统模型表现,…详细
8月16日,2025英特尔人工智能创新应用大赛总决赛暨颁奖典礼在深圳盛大启幕。历经层层选拔,从2817支年轻队伍中脱颖而出的40个优秀团队和作品,围绕工业、教育、心理健康、游戏等领域,展开了巅峰对决。…详细
2025世界人工智能大会(WAIC)期间,施耐德电气正式发布全新楼宇智能运维专家 EcoStruxure Building GPT,引发行业广泛关注。作为施耐德电气数字能效业务中国区数字楼宇和智能系统产品市场部负责人,魏琨就 AI 在能源…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。