中央民族大学徐桂先团队创建了首个专门用于中国少数民族语言新闻标题生成的大规模数据集CMHG,包含藏语10万条、维吾尔语和蒙古语各5万条高质量数据。该数据集通过严格的母语使用者评估体系确保质量,并在多个先进模型…详细
剑桥大学等机构研究发现,AI模型在长期任务执行中存在致命缺陷:微小的单步改进会带来指数级的长期能力提升,但传统模型会被自己的历史错误"带偏",出现自我设限效应。思考型模型如GPT-5能执行超过1000步任务,打破了…详细
香港科技大学等研究机构联合提出InfGen,一种革命性的AI图像生成方法。该技术将内容生成与分辨率调整分离,通过固定尺寸的潜在表示配合专门的生成器,实现任意分辨率图像的快速生成。相比传统方法需要100秒生成4K图像…详细
史丹福大学团队开发出名为QuantAgent的AI股票预测系统,由四个专业AI助手协作:技术指标分析师、图形识别专家、趋势分析师和风险管理师。该系统仅通过分析股价数据就能预测市场走向,在比特币、标普500等八种资产的测…详细
中科大研究团队针对新兴MCP协议环境开发了首个专业AI评估基准MCP-AgentBench,包含33个服务器188种工具和600道测试题目。研究发现开源模型表现优异,通义千问达到64.7%最高得分超越专有模型,揭示了交互框架对性能的…详细
复旦大学和阿里巴巴联合推出VStyle,这是全球首个专门评估AI语音风格适应能力的基准测试。该研究解决了当前语音AI只关注"说什么"而忽视"怎么说"的问题,提出包含声学控制、自然指令、角色扮演、情感共情四类测试的15…详细
中科院大学等机构联合开发的MachineLearningLM突破了大语言模型在数据分析方面的局限。该系统通过300万个合成任务的训练,能够在看到数百个例子后自动掌握各种数据预测规律。测试显示,它在金融、医疗等领域的分析准…详细
ServiceNow团队开发的AU-Harness是首个专门针对AI语音助手的综合评估工具包。该工具通过创新的并行处理和标准化测试协议,将评估效率提升127%,涵盖19项测试任务。研究引入了两个全新测试类别:时间感知的对话分离和…详细
约翰霍普金斯大学研究团队开发了MMBERT多语言AI模型,采用渐进式学习策略训练超过1800种语言。该模型通过逆向掩码调度和温度采样等创新技术,在多项基准测试中超越XLM-R等现有模型,甚至在部分小语种任务上超过OpenA…详细
华为科技团队开发出首个多视角3D空间理解基准测试Ego3D-Bench,包含8600个测试样本,覆盖距离测量、定位、运动推理等任务。同时推出Ego3D-VLM解决方案,通过构建文字版认知地图显著提升AI空间理解能力,多选题准确率…详细
香港大学团队构建了全球首个大规模牙科全景X光AI数据集MMOral,包含2万余张影像和130万条指令数据。研究发现现有AI模型在牙科诊断上表现不佳,最强的GPT-4o仅达41%准确率。团队开发的专业模型OralGPT经训练后准确率提…详细
意大利博尔扎诺自由大学团队开发了首个跨领域AI代码漏洞检测系统AI-DO,成功将学术研究转化为工业实践。研究证明用开源数据训练的AI模型能够有效检测工业软件漏洞,性能下降仅约10%。该系统已在真实企业环境中部署测…详细
德州农工大学研究团队开发的FuzzingBrain系统,结合大语言模型和传统模糊测试技术,能够自动发现软件安全漏洞并生成修复补丁。在DARPA人工智能网络挑战赛中获得第四名,成功发现28个漏洞包括6个零日漏洞。系统采用大…详细
阿德莱德大学研究团队开发了ObjectReact系统,让机器人能像人类一样通过物体关系而非图像匹配进行导航。该方法构建三维物体关系地图,使用WayObject代价地图引导机器人朝低代价区域移动。实验显示这种方法在复杂导航…详细
9月25日,移动AI融合创新发展论坛在国家会议中心隆重召开,在工业和信息化部的指导下,依托于IMT-2020(5G)推进组和IMT-2030(6G)推进组,由中国信息通信研究院牵头,联合产业界多家领军企业共同发起的“移动AI产业…详细
西湖大学团队开发出VLA-Adapter机器人控制系统,仅用0.5B参数就超越了7B参数的传统系统。该系统通过Bridge Attention机制实现视觉-语言-动作的高效转换,训练成本降低38倍,推理速度快3倍,在LIBERO测试中达到97.3%成…详细
谷歌发布数据共享模型上下文协议服务器,使开发者和AI智能体能够通过自然语言访问真实世界统计数据。该服务整合了政府调查、行政数据和联合国等全球机构的公共数据集。新服务旨在解决AI系统训练中常见的数据噪声和幻…详细
微软宣布从周三开始将Anthropic的AI模型集成到其Copilot助手中,此前该助手主要依赖OpenAI技术。企业用户可在OpenAI的深度推理模型和Anthropic的Claude Opus 4.1、Claude Sonnet 4之间选择,用于复杂研究和构建定制A…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。