腾讯AI团队开发出革命性文档识别系统POINTS-Reader,摆脱传统依赖大模型"蒸馏"的训练方式,通过自主学习机制让AI独立掌握文档理解能力。该方法分两阶段:先用统一格式的合成数据建立基础,再通过迭代自我改进在真实数…详细
香港中文大学团队开发出让AI学会矢量图形编程的创新方法,通过强化学习和跨模态奖励机制,成功将开源模型的绘图能力提升到商业级水平。研究建立了SGP-GenBench评估体系,发现AI不仅学会精确绘图,还发展出分层构建、…详细
新加坡多所顶尖大学联合发布首个3D和4D世界建模全面调研,系统整理了视频生成、占用网格和激光雷达三大技术路径。研究建立了统一的分类体系和评估标准,涵盖数据引擎、动作解释器、神经模拟器等四类功能,并深入分析…详细
独立研究者Rishiraj Acharya提出了门控关联记忆网络(GAM),这是一种全新的AI架构,通过分工协作的方式解决了传统Transformer处理长文本时计算量呈二次方增长的问题。GAM采用局部卷积处理语法结构和全局关联记忆处理…详细
百川智能团队开发的Baichuan-M2是一个32B参数的医疗AI模型,通过创新的动态验证系统突破了传统静态评估局限。该系统包含虚拟患者模拟器和临床评估标准生成器,让AI在真实诊疗环境中学习。在HealthBench测试中,Baich…详细
帝国理工学院团队对视觉基础模型DINOv3在医学影像领域进行了全面评估。研究发现DINOv3在胸部X光、CT扫描等任务上表现出色,甚至超越专门的医学AI模型,但在病理切片、电子显微镜、PET扫描等高度专业化任务上表现糟糕…详细
快手科技发布Keye-VL 1.5多模态AI系统,创新性地引入"慢-快"双眼视频编码策略,能够智能分配计算资源处理视频内容。系统通过四阶段渐进式训练,将上下文理解能力从8K扩展至128K tokens,显著提升长视频理解能力。在多…详细
由移动网络运营商(MNO)主导的开放式无线接入网(O-RAN)联盟,一直是推动 5G 无线接入网(RAN)演进的核心力量。…详细
作为全球工业发展的“风向标”,2025中国国际工业博览会集中展示了全球制造业的高质量制造实力和创新能力。施耐德电气展示了多款为工业应用环境而设计的产品。其中Galaxy PW二代 UPS拥有卓越的适应能力,不仅能在高温…详细
9月22日,第五届世界生物圈保护区大会(简称WCBR)在杭州隆重开幕,这不仅是世界生物圈保护区大会第一次在中国举办,也是首次在亚太地区举办。…详细
9月15日至17日,由中国汽车工程学会、江苏省科学技术协会联合主办的国际汽车智能座舱大会(ICIC 2025)在江苏苏州盛大召开。…详细
UC Santa Cruz团队开发的OpenVision 2通过去除文本编码器,将视觉编码器训练简化为纯生成式学习,实现训练时间缩短1.5倍、内存使用减少1.8倍的显著效率提升。研究使用高质量合成数据集和token掩码策略,在保持性能的…详细
华中科技大学团队开发的ReVPT系统首次让AI学会像人类一样主动选择和使用视觉分析工具解决复杂问题。通过创新的两阶段强化学习训练,该系统能根据任务需求灵活调用物体检测、深度估计等专业工具,在多项国际测试中显著…详细
华为技术团队发布突破性研究,首次系统阐述如何通过强化学习训练AI研究助手。研究涵盖数据合成、训练方法、系统框架、协作机制和评估标准五大核心领域,提出从"模仿学习"向"探索学习"的范式转变,让AI具备类似人类研…详细
香港中文大学团队提出过渡模型(TiM),突破AI图像生成"速度与质量不可兼得"难题。该模型通过学习任意时间间隔的状态转换,让用户可以灵活选择生成步数,实现从快速生成到精细制作的连续调节。仅用8.65亿参数就超越了业…详细
数字营销正经历“从流量驱动向技术驱动”的深度转型,在新范式下如何借助AI技术实现高效转化与效能提升、进而带来可持续的生意增长,成为商家们共同关注的问题。…详细
ByteDance团队开发的UMO框架解决了AI生成多人图片时的身份混乱问题。采用"多对多匹配"策略替代传统"一对一"方法,通过全局优化找到最佳人物-照片配对方案。结合奖励反馈学习和新的身份混乱度评估指标,显著提升了多人…详细
Bar-Ilan大学研究团队开发出NER Retriever智能实体检索系统,突破传统固定分类限制,用户可用自然语言描述检索任意实体类型。系统巧妙利用大语言模型内部知识结构,准确率比传统方法高3-4倍,存储效率提升79%,为新闻…详细
Meta FAIR团队发布DARLING技术,通过"多样性感知强化学习"方法解决AI回答千篇一律的问题。该系统创新性地将质量与多样性奖励相结合,使用语义分类器判断真正的内容差异,在创意写作和数学解题等多个领域都实现了质量…详细
上海AI实验室开发的F1机器人"大脑"实现了革命性突破,让机器人首次具备"预见未来"的能力。通过理解、生成、执行三个专家模块协作,F1能预测任务执行后的画面并据此制定行动策略。在多个机器人平台测试中,F1的成功率…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。