本篇文章以 Navin Chaddha 的采访为主线,阐述了 AI 技术背后人际伙伴关系和早期合作的重要性,以及“协同智能即服务”的理念,强调未来创新依旧由人类主导,技术只是辅助工具。…详细
CapSpeech是约翰·霍普金斯大学等机构联合提出的风格描述文本转语音合成基准,包含超过1000万机器标注和36万人工标注的语音-描述配对。它支持五大下游任务:基础风格描述、带音效的语音合成、口音控制、情感表达和表…详细
6月5日,"Accelerate 2025北亚巡展·北京站"圆满落幕!来自智库、产业界、Fortinet管理层及技术团队的权威专家,与来自各行业的企业客户代表齐聚一堂,围绕"AI智御全球·引领安全新时代"主题,就AI技术驱动的安全防御…详细
Sandia国家实验室与SpiNNcloud合作推出的SpiNNaker2类脑超级计算机,依靠48芯片高并行架构及高速SRAM/DRAM通信,无需GPU或内置存储,适用于国防及前沿计算任务。…详细
Meta首席技术官博兹预测2025年将成为Reality Labs转折点,Ray-Ban AI眼镜的突破和激烈市场竞争将决定未来成败。…详细
第三届Runway AI电影节展示了利用Runway、Midjourney等AI工具生成全新视听作品,颠覆传统电影制作,赋能无限创意。…详细
在今年高考季,小艺协同华为浏览器推出高考Agent问答服务。华为浏览器作为终端设备上全球资讯的便捷入口,在权威资讯的基础上,基于AI Agent能力,在高考日程、院校信息、历年真题、查询分数线、志愿规划建议、模拟选…详细
华盛顿大学和卡内基梅隆大学的研究团队开发了"位置专家"(PosS)技术,解决了推测性解码中的关键挑战。传统方法使用单一草稿模型预测多个位置的词汇,导致预测质量随位置深入而急剧下降。PosS创新性地引入多个专业化…详细
这篇研究论文《段级策略优化》提出了一种介于词元级和轨迹级之间的新型强化学习框架SPO,用于提升大语言模型的推理能力。研究者将生成序列划分为连续段落,并在段级粒度上估计优势,实现了更精确的信用分配和更准确的…详细
NVIDIA研究团队在最新研究中指出,小语言模型(SLM)将成为AI智能代理的未来。他们论证了SLM不仅足够强大,还在操作上更适合且经济性更高。研究显示现代SLM已可媲美更大模型的性能,同时推理成本降低10-30倍,微调更快…详细
RiOSWorld是一项开创性研究,评估多模态计算机使用代理在真实环境中的安全风险。由上海人工智能实验室团队开发的这个基准测试包含492个风险任务,涵盖网页浏览、社交媒体、操作系统等多种应用场景。研究将风险分为环…详细
牛津大学林元泽及其国际合作团队开发的IllumiCraft是一种创新的视频重光照技术,它首次将几何和光照引导统一到一个扩散模型中。通过同时处理HDR环境图、合成重光照帧和3D点轨迹,该技术能生成与用户提示一致的时间连…详细
中国人民大学物理学院研究团队开发了HTSC-2025,这是一个专为AI预测超导临界温度而设计的常压高温超导体基准数据集。该数据集包含140个样本,涵盖了2023-2025年基于BCS理论预测的超导材料,平均Tc为27.3K,最高达160…详细
MBZUAI研究团队开发了FinChain,这是金融领域首个可验证的符号化思维链推理基准测试。该基准涵盖12个金融领域的54个主题,每个主题包含5个不同难度的参数化模板,配有可执行的Python代码验证每一步推理。研究者还提出…详细
这项研究提出了VIDEO-SKILL-COT(别名VIDEO-SKOT),一种新型视频理解框架,能自动构建和利用技能感知的思维链进行领域自适应视频推理。北卡罗来纳大学教堂山分校的研究人员首先从训练问题中提取领域相关推理技能并聚…详细
莫斯科物理技术学院和人工智能研究所共同开发的AmbiK数据集,专门用于评估大型语言模型处理厨房环境中歧义指令的能力。该数据集包含1000对任务,按照偏好类、常识知识类和安全类三种歧义类型分类,每对包含歧义和无歧…详细
MBZUAI和澳大利亚国立大学的研究团队开发了CASS,这是首个大规模跨架构GPU代码转译系统,实现了Nvidia和AMD之间的源代码和汇编级代码转换。该项目包含7万对验证代码对,展示了源代码转换95%和汇编转换37.5%的准确率,…详细
MMR-V是一个创新的视频多模态深度推理基准测试集,专注于评估AI模型在视频长距离多帧推理能力。与现有基准不同,它要求模型不仅理解问题帧,还需在远距离帧中挖掘证据进行推理。研究发现即使最先进的模型o4-mini也仅…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。