中科大研究团队针对新兴MCP协议环境开发了首个专业AI评估基准MCP-AgentBench,包含33个服务器188种工具和600道测试题目。研究发现开源模型表现优异,通义千问达到64.7%最高得分超越专有模型,揭示了交互框架对性能的…详细
复旦大学和阿里巴巴联合推出VStyle,这是全球首个专门评估AI语音风格适应能力的基准测试。该研究解决了当前语音AI只关注"说什么"而忽视"怎么说"的问题,提出包含声学控制、自然指令、角色扮演、情感共情四类测试的15…详细
中科院大学等机构联合开发的MachineLearningLM突破了大语言模型在数据分析方面的局限。该系统通过300万个合成任务的训练,能够在看到数百个例子后自动掌握各种数据预测规律。测试显示,它在金融、医疗等领域的分析准…详细
ServiceNow团队开发的AU-Harness是首个专门针对AI语音助手的综合评估工具包。该工具通过创新的并行处理和标准化测试协议,将评估效率提升127%,涵盖19项测试任务。研究引入了两个全新测试类别:时间感知的对话分离和…详细
约翰霍普金斯大学研究团队开发了MMBERT多语言AI模型,采用渐进式学习策略训练超过1800种语言。该模型通过逆向掩码调度和温度采样等创新技术,在多项基准测试中超越XLM-R等现有模型,甚至在部分小语种任务上超过OpenA…详细
华为科技团队开发出首个多视角3D空间理解基准测试Ego3D-Bench,包含8600个测试样本,覆盖距离测量、定位、运动推理等任务。同时推出Ego3D-VLM解决方案,通过构建文字版认知地图显著提升AI空间理解能力,多选题准确率…详细
香港大学团队构建了全球首个大规模牙科全景X光AI数据集MMOral,包含2万余张影像和130万条指令数据。研究发现现有AI模型在牙科诊断上表现不佳,最强的GPT-4o仅达41%准确率。团队开发的专业模型OralGPT经训练后准确率提…详细
意大利博尔扎诺自由大学团队开发了首个跨领域AI代码漏洞检测系统AI-DO,成功将学术研究转化为工业实践。研究证明用开源数据训练的AI模型能够有效检测工业软件漏洞,性能下降仅约10%。该系统已在真实企业环境中部署测…详细
德州农工大学研究团队开发的FuzzingBrain系统,结合大语言模型和传统模糊测试技术,能够自动发现软件安全漏洞并生成修复补丁。在DARPA人工智能网络挑战赛中获得第四名,成功发现28个漏洞包括6个零日漏洞。系统采用大…详细
阿德莱德大学研究团队开发了ObjectReact系统,让机器人能像人类一样通过物体关系而非图像匹配进行导航。该方法构建三维物体关系地图,使用WayObject代价地图引导机器人朝低代价区域移动。实验显示这种方法在复杂导航…详细
9月25日,移动AI融合创新发展论坛在国家会议中心隆重召开,在工业和信息化部的指导下,依托于IMT-2020(5G)推进组和IMT-2030(6G)推进组,由中国信息通信研究院牵头,联合产业界多家领军企业共同发起的“移动AI产业…详细
西湖大学团队开发出VLA-Adapter机器人控制系统,仅用0.5B参数就超越了7B参数的传统系统。该系统通过Bridge Attention机制实现视觉-语言-动作的高效转换,训练成本降低38倍,推理速度快3倍,在LIBERO测试中达到97.3%成…详细
谷歌发布数据共享模型上下文协议服务器,使开发者和AI智能体能够通过自然语言访问真实世界统计数据。该服务整合了政府调查、行政数据和联合国等全球机构的公共数据集。新服务旨在解决AI系统训练中常见的数据噪声和幻…详细
微软宣布从周三开始将Anthropic的AI模型集成到其Copilot助手中,此前该助手主要依赖OpenAI技术。企业用户可在OpenAI的深度推理模型和Anthropic的Claude Opus 4.1、Claude Sonnet 4之间选择,用于复杂研究和构建定制A…详细
Gensyn团队提出SAPO分布式AI训练方法,让普通设备通过分享学习经验协作训练语言模型。实验显示,采用50%本地和50%外部经验的均衡策略,小型AI模型性能提升94%。该方法避免了传统分布式训练的同步瓶颈,为AI训练民主化…详细
曼彻斯特大学研究团队发现,尽管AI语言模型在多数任务中表现优异,但在理解"Drivelology"(一种表面荒诞但蕴含深意的语言现象)时却频频失误。研究团队构建了涵盖六种语言的1200多个样本数据库,通过四项测试发现AI模…详细
苹果研究人员开发出SimpleFold,这是一个轻量级的蛋白质折叠预测AI模型。与谷歌DeepMind的AlphaFold等需要极其昂贵计算资源的模型不同,SimpleFold采用流匹配模型技术,跳过多个去噪步骤,降低计算成本并提升生成速度…详细
数据中心现场发电能力可提升可靠性并满足不断增长的能源需求,但传统发电厂建设复杂昂贵。燃料电池提供了替代方案,能以更简单、可扩展的方式现场发电。微软、Equinix和亚马逊等公司已开始试用燃料电池作为主备电源。…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。