这项由OPPO等机构完成的研究首次建立了评估AI研究助手个性化能力的标准基准。研究团队构建了250个真实用户场景,开发了PQR三维评价框架,测试发现开源系统个性化能力更强,用户信息越详细AI表现越好,为推动AI从标准…详细
首尔大学团队首次构建了评估视觉语言模型个性化能力的综合基准MMPB,包含111个概念和超万个测试样本。研究发现即使先进AI模型在个性化任务上表现不佳,存在安全机制过度保守、视觉信息利用不足、长对话记忆丢失等问题…详细
浙江大学和阿里巴巴集团联合开发的DATAMIND系统,通过创新的数据合成和训练方法,让AI具备了专业数据分析师的能力。该系统使用12,000个高质量训练样本,采用动态权重调整的混合训练策略,最终的DATAMIND-14B模型在多…详细
复旦大学团队针对掩码扩散语言模型提出三项关键技术:EOS早期拒绝解决句号陷阱问题,渐进式步长调度器将解码步骤从L/2降至log?L,一致性轨迹强化学习确保训练与实际运行的一致性。研究发现规划任务更适合并行解码而数…详细
上海AI实验室研究团队开发出具备推理能力的科学答案验证模型SCI-Verifier,解决了AI无法准确验证科学答案等价形式的关键问题。该模型覆盖数学、物理、化学、生物五大领域,验证准确率达86.28%,与GPT-5相当。通过构建…详细
南洋理工大学研究团队通过创新的GRPO强化学习方法,成功让70亿参数的小模型在无线通信数学推理上接近GPT-4o性能。他们构建了包含4027道题目的专业数据集,证明了专门化训练能够让小模型"以小博大",同时意外发现这种…详细
这项研究首次系统性地评估了大语言模型在跨数据库系统SQL翻译任务中的能力。研究团队构建了包含598个高质量翻译对的PARROT基准,涵盖22个主流数据库系统。实验结果显示,即使是最先进的AI模型,在SQL翻译任务上的准确…详细
香港科技大学团队通过DAFNYCOMP基准测试发现,当前最先进的AI模型在编写单个功能时表现优秀(95.67%语法正确率),但在需要多个功能协调工作的复杂程序中却表现糟糕(仅3.69%验证成功率)。研究揭示了AI在组合推理方…详细
西班牙国立远程教育大学联合挪威国家图书馆创建BOE-XSUM数据集,包含3648个西班牙法律文档的极简摘要,旨在将复杂法律条文转换为普通人可理解的语言。研究显示专门训练的小型模型在此任务上超越大型通用模型,为西班…详细
阿里纳德数据中心与Calibrant Energy合作开发首创电池储能系统,通过绕过传统电网升级时间线,使俄勒冈州希尔斯伯勒在建数据中心园区提前数年上线。该31兆瓦、62兆瓦时储能系统计划2026年投运,将作为响应电网的动态…详细
微软在Edge浏览器中推出增强版Copilot模式,提供更强大的AI代理功能,目前在美国进行限量预览。该模式包含Actions和Journeys两大功能:Actions让浏览器能代表用户执行任务,如语音控制打开网页或查找文章特定内容;J…详细
IBM正通过收购红帽和HashiCorp、为Power和z系统增加AI功能等方式,构建盈利能力强的AI产品服务组合。公司拥有超10万企业客户,将为其提供安全、熟悉的AI集成解决方案。IBM第三季度营收163.3亿美元,同比增长9.1%,净…详细
MIT媒体实验室推出可扩展AI智能网络演进项目(SAIpien),专注于可审计的人机交互系统。该项目将负责任AI从政策讨论转化为工程学科,连接用户体验标准与可追溯的治理机制。通过数字孪生、原型开发和跨领域设计,SAIp…详细
随着机器学习和大语言模型在企业中的广泛应用,AI系统的数据来源和使用方式日益受到关注。企业开始为客户提供详细的伦理评分卡,记录模型训练数据的来源、处理方式和使用情况。这些评分卡帮助组织建立客户信任,确保…详细
亚马逊旗下直播平台Twitch在TwitchCon 2025大会上发布多项AI功能。其中Auto Clip功能可帮助主播快速剪辑多小时直播中的精彩片段,便于分享到TikTok等短视频平台。平台还将集成Meta的AI智能眼镜,支持直接通过眼镜进行…详细
SAP公布全年云收入位于指导区间下限,令投资者失望。高管表示制造业和公共部门客户签约周期延长。该欧洲软件巨头预计销售额将接近216-219亿欧元预测区间的下限,股价下跌2%。第三季度全球收入91亿欧元,同比增长7%,…详细
阿联酋正经历数字基础设施转型,数据中心和云投资浪潮将该国重塑为人工智能和数字化转型的区域枢纽。据研究报告,阿联酋数据中心市场2024年价值约12.6亿美元,预计2030年将超过33亿美元。政府数字化议程、AI技术快速…详细
谷歌宣布在量子计算研究中取得重大突破,其量子回声算法运算速度比顶级经典超级计算机快13000倍。该算法在Willow量子芯片上运行,已成功计算分子结构,为药物发现等实际应用铺平道路。研究显示量子增强核磁共振技术可…详细
生成式AI快速发展带来巨大机遇,但也面临海量数据管理挑战。Gartner预测到2029年,键值对象存储将占本地非结构化数据50%,生成式AI存储需求将超2EB。传统存储系统在性能、扩展性和元数据管理方面存在瓶颈,无法满足A…详细
2025 年第二季度,雷鸟创新以高达 39% 的市场份额,登顶全球 AR 眼镜市场第一,并且超越了苹果,成为了全球 XR 市场(含 VR 头显和 AR 眼镜)第三。…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。