南京大学团队开发出STAR视频超分辨率技术,通过借用文本生成视频模型的智慧,配合局部信息增强模块和动态频率损失机制,成功解决了现实世界视频修复中的画质模糊和时间不连贯问题。该技术在多项测试中表现优异,特别…详细
上海AI实验室等机构联合开发的EnerVerse系统,首次让机器人具备了"想象未来"的能力。通过将视频生成技术与机器人控制结合,该系统能够预测操作过程并生成相应动作。核心创新包括块状自回归生成、自由锚点视角和4D数据…详细
日本Sakana AI实验室开发出Transformer?系统,首次实现AI模型实时自我调节能力。该系统通过奇异值微调技术,让大模型能根据任务类型自动调整内部参数配置,仅用传统方法1%的参数量就实现显著性能提升。系统采用两轮推…详细
香港大学联合阿里巴巴达摩院开发出VideoAnydoor技术,实现视频中物体的精准插入和运动控制。该技术通过ID提取器、像素变形器和3D神经网络三大创新组件,让用户仅需提供参考图片和轨迹就能完成专业级视频编辑。在多项…详细
MinMo是阿里巴巴通义实验室开发的80亿参数多模态语音模型,在140万小时语音数据上训练,实现了全双工语音交互,支持多语言识别翻译、情感分析、风格控制等功能,语音响应延迟仅100-800毫秒,在各项语音任务上达到业界…详细
清华大学团队发布URSA系统,这是首个针对多模态数学推理的过程奖励模型。该系统通过创新的三阶段训练框架,不仅能解决复杂的图文结合数学问题,更重要的是能提供完全可验证的推理过程。URSA在六个标准测试中全面超越…详细
中科院团队开发的LLaVA-Mini实现了多模态AI领域的重大突破,将图像理解所需的视觉token从576个压缩至1个,性能不降反升。通过创新的预融合技术和智能压缩机制,该模型计算量减少77%,速度提升3倍,内存占用减少600倍…详细
每一次Amazon Graviton的升级,都带来了两位数的性能提升,同时单位算力的功耗也在持续下降,这也预示着我们也正在迈入新一轮高效算力时代。…详细
PTC今日宣布发布其Arena(R)产品生命周期管理(PLM)和质量管理系统(QMS)的人工智能(AI)助手,助力团队加速价值实现。…详细
在“PEC 2025 AI创新者大会暨第二届提示工程峰会”的“MCP引领Agent互联网新世界的钥匙与协议”分论坛上,来自至顶网、AIGC Link等联合主办方的专家与产业先锋们,围绕MCP的技术演进、应用潜力与生态建设展开深入交流…详细
阿里巴巴团队开发了CODEELO,这是首个让AI模型与人类程序员在相同条件下公平竞技的编程评估平台。该系统通过直接将AI代码提交到真实竞赛平台CodeForces进行评判,实现了零误判和完全公平的评估环境。测试33个主流AI模…详细
这项由清华大学与快手科技等机构合作的研究构建了包含18.2万个人工标注样本的大规模视频偏好数据集,开发了VideoReward多维度视频评价系统,并提出了Flow-DPO等三种对齐算法,成功让AI视频生成模型学会按照人类偏好创…详细
在模型、框架\应用场景,快速迭代的背景下,算力的竞争已经不再只是单点性能的比拼,而是平台化、体系化的持续进化。Arm选择在架构层面重新定义计算底座,用灵活、可扩展的方式回应AI的不确定性与爆发力。…详细
ByteDance研究团队开发了PaSa智能学术搜索系统,通过双AI代理架构解决传统搜索局限性。系统能自动阅读论文、追踪引用网络,实现深度文献挖掘。在真实测试中,PaSa相比现有最佳方法在相关论文发现率上提升近40%。该系…详细
微软团队开发的SIGMA是首个专为系统域任务设计的高效大语言模型,通过创新的DiffQKV注意力机制在保持性能的同时大幅提升推理效率,在长文本场景下速度提升达33.36%。该模型在系统管理任务上的表现全面超越GPT-4,为A…详细
YouTube在其直播活动中发布了多项面向Shorts创作者的生成式AI工具,包括定制版Veo 3 Fast视频生成模型、新的混音工具和AI编辑功能。Veo 3 Fast能以480p分辨率低延迟生成带声音的视频片段,支持图像动画化、视频风格转…详细
谷歌发布了一款全新的Windows桌面应用程序,为PC用户带来了类似Mac系统Spotlight搜索功能的搜索栏体验。这款应用旨在提升Windows用户的搜索效率和使用体验,让用户能够更便捷地在电脑上查找文件、应用程序和其他内容…详细
劳埃德银行集团首席数据分析官博特朱表示,金融机构正探索通过生成式AI直接为客户提供服务,以解决传统个人化金融咨询模式无法规模化的问题。由于大语言模型存在"幻觉"等问题,银行采用"智能体作为评判者"的方法,让…详细
Gemini移动应用自8月推出Nano Banana图像编辑模型后用户激增,该模型因能轻松执行复杂编辑和创建逼真图像而广受好评。据应用情报公司Appfigures数据,9月份下载量环比增长45%,已达1260万次。应用在9月12日超越ChatG…详细
Meta Connect 2025大会将于周三开幕,预计AI智能眼镜将成为焦点。公司可能发布与Ray-Ban和Oakley合作的新款智能眼镜,包括配备抬头显示屏的Hypernova眼镜和专为运动员设计的Oakley Spheara款式。此次大会是Meta成立超…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。