Sony AI开发出SoundReactor框架,首次实现逐帧在线视频转音频生成,无需预知未来画面即可实时生成高质量立体声音效。该技术采用因果解码器和扩散头设计,在游戏视频测试中表现出色,延迟仅26.3毫秒,为实时内容创作、…详细
英伟达和诺基亚宣布战略合作,将英伟达AI驱动的无线接入网产品集成到诺基亚RAN产品组合中,助力运营商在英伟达平台上部署AI原生5G Advanced和6G网络。双方将推出AI-RAN系统,提升网络性能和效率,为生成式AI和智能体…详细
10月 29日,由安阳师范学院、腾讯SSV联合主办的“2025 AI+甲骨文成果展示暨协同创新交流会”在河南安阳举行,会议集中呈现了“数字甲骨共创计划”在甲骨文数字化保护、智能化研究和创新性活化方面取得的系列突破性成果…详细
10月30日,WIKO首款线上手机——WIKO X70正式发布并同步登陆京东开售。…详细
这项由哥伦比亚大学研究团队完成的突破性研究首次揭示了AI系统自我改进中的"效用-学习张力"问题:系统追求更好性能时会增加复杂度,但过高复杂度会破坏学习能力。研究建立了学习边界定理,提出双门控制机制,为AI安全…详细
这项由Reactive AI公司Adam Filipek主导的研究提出了反应式变换器(RxT),通过事件驱动架构和固定大小记忆系统,将传统聊天机器人的对话成本从平方级降为线性级,使长期对话成本降低99%以上,同时实现恒定响应速度。…详细
这项研究首次实现了让AI同时理解文字和时间序列数据的技术突破,开发出OpenTSLM模型family,能够像医生一样综合分析病历文字和心电图等检查数据。实验显示即使10亿参数的小模型也能超越2000亿参数的GPT-4o,在睡眠分…详细
卡内基梅隆大学研究团队发现,在AI问答系统中,扩大检索文档库的规模可以有效替代使用更大的语言模型。研究表明,小型模型配备更大文档库能够达到甚至超越大型模型的表现,为资源受限环境下的AI系统部署提供了更经济…详细
苹果公司研究团队提出了CADD技术,创新性地结合离散和连续扩散方法的优势。通过创建"双重世界"系统,在保持传统遮掩方法稳定性的同时,在连续空间中保留语义信息,为AI生成提供更精准的指导。实验证明该技术在文字、…详细
华盛顿大学研究团队通过分析21个前沿AI模型发现,当前AI系统缺乏个性化推理能力,无法通过主动询问了解用户需求并调整回答方式。研究显示29%的个性化尝试效果反而更差,数学推理准确率下降3.5%,而社会推理提升3.1%。…详细
苹果公司研究团队提出了一种革命性的"分层记忆预训练"技术,将AI模型分为负责基础推理的锚定模型和存储专门知识的分层记忆库。这种设计让1.6亿参数的小模型配上记忆模块后,性能可达到4.1亿参数传统模型的水平,特别…详细
大模型技术变革下,通常需借助云端算力和存储资源,为端侧提供更丰富的大模型应用场景体验。与此同时,行业对端云协作下的全链路安全和透明可信提出了更高要求。…详细
Meta超级智能实验室联合佐治亚理工学院开发出RECAP训练方法,通过故意给AI模型误导性开头来训练其纠错能力。该方法显著提升了大语言模型的安全性(12.3%)、抗攻击能力(21.0%)和推理质量,同时减少过度拒绝问题。R…详细
奥地利科学技术研究院团队深入研究微缩浮点数格式NVFP4和MXFP4的实际性能,发现现有量化方法效果不佳。他们开发了微旋转GPTQ算法和QuTLASS计算库,在保持模型精度的同时实现显著加速:B200芯片上达到2.2倍端到端提升…详细
这项研究开发了正交稀疏自编码器(OrtSAE),解决了传统AI解码工具中特征混淆的问题。通过强制要求不同特征保持独立,新方法发现了9%更多独特特征,减少了65%的特征吸收和15%的特征组合问题。在保持高效率的同时,显…详细
麻省理工学院研究团队通过Game-Time测试框架评估了AI语音系统的时间感知能力,发现现有系统虽然能处理基础对话,但在时间控制方面表现不佳。研究揭示AI缺乏"何时说话"的时间意识,在需要精确时机控制的任务中几乎全军…详细
中科院团队开发的MaskGRPO是首个针对多模态离散扩散模型的强化学习方法,通过为文本和图像设计专门的训练策略,成功解决了并行生成模式下的重要性采样和推理生成难题。实验显示该方法在数学推理、编程和图像生成任务…详细
KAIST团队开发的TalkPlay-Tools系统通过让大语言模型学会智能调用多种推荐工具,创造了会话式音乐推荐的新范式。该系统像专业音乐顾问一样能够理解复杂需求,动态组合SQL查询、语义匹配、个性化推荐等六种工具,在准…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。