商业办公-第17页-频道-至顶网

2025-09-23 13:38:25

腾讯AI团队革命性突破：无需"老师"指导，让AI自己学会阅读复杂文档

腾讯AI团队开发出革命性文档识别系统POINTS-Reader，摆脱传统依赖大模型"蒸馏"的训练方式，通过自主学习机制让AI独立掌握文档理解能力。该方法分两阶段：先用统一格式的合成数据建立基础，再通过迭代自我改进在真实数…详细

人工智能文档识别自主学习

2025-09-23 13:38:07

香港中文大学团队让AI学会画图：从文字到精美矢量图的创作之路

香港中文大学团队开发出让AI学会矢量图形编程的创新方法，通过强化学习和跨模态奖励机制，成功将开源模型的绘图能力提升到商业级水平。研究建立了SGP-GenBench评估体系，发现AI不仅学会精确绘图，还发展出分层构建、…详细

人工智能强化学习矢量图形生成

2025-09-23 13:37:53

世界建模新纪元：NTU、SMU和NTU联合推出首个3D和4D世界建模全面调研

新加坡多所顶尖大学联合发布首个3D和4D世界建模全面调研，系统整理了视频生成、占用网格和激光雷达三大技术路径。研究建立了统一的分类体系和评估标准，涵盖数据引擎、动作解释器、神经模拟器等四类功能，并深入分析…详细

人工智能世界建模 3D生成

2025-09-23 13:37:36

当算法不再"吃内存"：独立研究者破解AI处理长文本的瓶颈难题

独立研究者Rishiraj Acharya提出了门控关联记忆网络（GAM），这是一种全新的AI架构，通过分工协作的方式解决了传统Transformer处理长文本时计算量呈二次方增长的问题。GAM采用局部卷积处理语法结构和全局关联记忆处理…详细

人工智能序列建模线性复杂度

2025-09-23 13:36:38

白川团队推出Baichuan-M2：让AI医生像真正的医生一样思考和对话，在全球最严格医疗测试中击败所有开源模型

百川智能团队开发的Baichuan-M2是一个32B参数的医疗AI模型，通过创新的动态验证系统突破了传统静态评估局限。该系统包含虚拟患者模拟器和临床评估标准生成器，让AI在真实诊疗环境中学习。在HealthBench测试中，Baich…详细

人工智能强化学习医疗诊断

2025-09-23 13:36:21

DINOv3能否成为医学影像的新标杆？帝国理工学院团队跨领域测试揭示惊人发现

帝国理工学院团队对视觉基础模型DINOv3在医学影像领域进行了全面评估。研究发现DINOv3在胸部X光、CT扫描等任务上表现出色，甚至超越专门的医学AI模型，但在病理切片、电子显微镜、PET扫描等高度专业化任务上表现糟糕…详细

人工智能医学影像跨领域迁移

2025-09-23 13:36:05

快手科技重磅发布：让AI看懂复杂视频的"慢-快"双眼系统

快手科技发布Keye-VL 1.5多模态AI系统，创新性地引入"慢-快"双眼视频编码策略，能够智能分配计算资源处理视频内容。系统通过四阶段渐进式训练，将上下文理解能力从8K扩展至128K tokens，显著提升长视频理解能力。在多…详细

多模态大语言模型视频理解技术 SlowFast编码策略

2025-09-23 12:54:54

是德科技：从芯片到智能网络，全面验证O-RAN无线连接

由移动网络运营商（MNO）主导的开放式无线接入网（O-RAN）联盟，一直是推动 5G 无线接入网（RAN）演进的核心力量。…详细

2025-09-23 12:50:58

施耐德电气朱文沁：可靠电力是未来工业发展的“稳定器”

作为全球工业发展的“风向标”，2025中国国际工业博览会集中展示了全球制造业的高质量制造实力和创新能力。施耐德电气展示了多款为工业应用环境而设计的产品。其中Galaxy PW二代 UPS拥有卓越的适应能力，不仅能在高温…详细

施耐德电气

2025-09-23 11:53:13

BOE（京东方）携手UNESCO联合主办WCBR“科学十年”分会彰显中国科技企业可持续发展实力

9月22日，第五届世界生物圈保护区大会（简称WCBR）在杭州隆重开幕，这不仅是世界生物圈保护区大会第一次在中国举办，也是首次在亚太地区举办。…详细

2025-09-23 11:06:31

闪迪携前沿车载存储方案亮相ICIC 2025，以技术创新赋能智能座舱未来

9月15日至17日，由中国汽车工程学会、江苏省科学技术协会联合主办的国际汽车智能座舱大会（ICIC 2025）在江苏苏州盛大召开。…详细

2025-09-23 11:05:51

UC Santa Cruz团队大幅精简视觉编码器训练：OpenVision 2让AI"看图说话"训练速度提升1.5倍

UC Santa Cruz团队开发的OpenVision 2通过去除文本编码器，将视觉编码器训练简化为纯生成式学习，实现训练时间缩短1.5倍、内存使用减少1.8倍的显著效率提升。研究使用高质量合成数据集和token掩码策略，在保持性能的…详细

计算机视觉生成式学习训练效率优化

2025-09-23 11:05:31

华中科技大学团队发明AI"视觉工具使用专家"，让计算机像人类一样调用外部工具解决复杂视觉问题

华中科技大学团队开发的ReVPT系统首次让AI学会像人类一样主动选择和使用视觉分析工具解决复杂问题。通过创新的两阶段强化学习训练，该系统能根据任务需求灵活调用物体检测、深度估计等专业工具，在多项国际测试中显著…详细

人工智能强化学习视觉工具使用

2025-09-23 11:05:14

华为技术团队首次全面解析AI智能研究助手的"大脑升级秘籍"

华为技术团队发布突破性研究，首次系统阐述如何通过强化学习训练AI研究助手。研究涵盖数据合成、训练方法、系统框架、协作机制和评估标准五大核心领域，提出从"模仿学习"向"探索学习"的范式转变，让AI具备类似人类研…详细

深度研究系统强化学习多智能体协作

2025-09-23 11:04:57

香港中文大学团队突破AI图像生成技术：让机器学会"变速"画画，一步到位还是精雕细琢？

香港中文大学团队提出过渡模型(TiM)，突破AI图像生成"速度与质量不可兼得"难题。该模型通过学习任意时间间隔的状态转换，让用户可以灵活选择生成步数，实现从快速生成到精细制作的连续调节。仅用8.65亿参数就超越了业…详细

人工智能扩散模型优化算法

2025-09-23 10:04:02

腾讯广告携手京东重磅发布京腾4.0：AI驱动全域智能营销新时代，破解增长难题

数字营销正经历“从流量驱动向技术驱动”的深度转型，在新范式下如何借助AI技术实现高效转化与效能提升、进而带来可持续的生意增长，成为商家们共同关注的问题。…详细

2025-09-23 10:03:17

ByteDance UXO团队新突破：让AI生成图片再也不会认错人了

ByteDance团队开发的UMO框架解决了AI生成多人图片时的身份混乱问题。采用"多对多匹配"策略替代传统"一对一"方法，通过全局优化找到最佳人物-照片配对方案。结合奖励反馈学习和新的身份混乱度评估指标，显著提升了多人…详细

图像生成多身份优化人工智能

2025-09-23 10:02:48

实体检索革命：Bar-Ilan大学开发智能系统，让计算机像图书管理员一样精准找到你想要的任何实体

Bar-Ilan大学研究团队开发出NER Retriever智能实体检索系统，突破传统固定分类限制，用户可用自然语言描述检索任意实体类型。系统巧妙利用大语言模型内部知识结构，准确率比传统方法高3-4倍，存储效率提升79%，为新闻…详细

自然语言处理实体检索智能检索系统

2025-09-23 10:02:24

Meta FAIR团队推出DARLING：让AI回答既优质又多样化，告别千篇一律的无聊回复

Meta FAIR团队发布DARLING技术，通过"多样性感知强化学习"方法解决AI回答千篇一律的问题。该系统创新性地将质量与多样性奖励相结合，使用语义分类器判断真正的内容差异，在创意写作和数学解题等多个领域都实现了质量…详细

人工智能强化学习创意生成

2025-09-23 10:01:56

机器人终于学会"预测未来"：上海AI实验室开发出能看到下一秒的智能机器人大脑

上海AI实验室开发的F1机器人"大脑"实现了革命性突破，让机器人首次具备"预见未来"的能力。通过理解、生成、执行三个专家模块协作，F1能预测任务执行后的画面并据此制定行动策略。在多个机器人平台测试中，F1的成功率…详细

人工智能机器人控制预测建模

华为云数字化转型秘籍调研

业界热点: