ByteDance团队开发的GR-3是一个革命性的视觉-语言-动作模型,让机器人能够像人类一样理解指令并灵活操作。它通过多模态数据联合训练获得了强大的泛化能力,能处理未见过的物品和环境,还能从少量人类演示中快速学习。…详细
上海人工智能实验室联合多家机构提出SeC视频分割技术,通过大型视觉语言模型构建物体概念表示,突破传统像素匹配局限。该技术在复杂场景变化中表现卓越,比SAM 2.1平均提升11.8分,并构建了专门的SeCVOS测试集验证效…详细
快手科技和清华大学联合提出了Archer训练方法,通过识别语言中的知识型和推理型词语,对不同类型内容采用差异化约束策略。该方法让1.5B参数的小模型在数学推理和编程任务上达到了与大模型相当的性能,在AIME数学竞赛…详细
南洋理工大学研究团队开发了名为"视频思维测试"的新基准,通过1000个精心设计的YouTube短视频揭示了AI视频理解的真实水平。测试发现,即使是最强AI模型GPT-4o的正确率也只有36.6%,远低于人类的84.3%。研究指出AI主要…详细
清华大学团队开发的StreamVGGT实现了首个实时4D视觉几何重建系统,通过模仿人类视觉的时间因果感知机制,将处理速度提升30倍而精度几乎不变。该技术采用流式处理架构和知识蒸馏训练,为自动驾驶、AR/VR、机器人导航等…详细
USC研究团队提出的潜在去噪分词器(l-DeTok)通过在训练过程中引入插值噪声和随机遮罩,让视觉分词器学会从损坏信息中重建图像,使其更好地适配下游生成模型的去噪任务。该方法在六种代表性生成模型上均实现显著性能…详细
清晨六点,上海某垃圾发电厂的中控室大屏突然弹出预警:3号炉火线位置持续走高,有脱料风险。在搭载AI视觉识别的控制系统调节下,未等值班人员到场,系统自动执行补料操作,负荷炉温和氧量快速回归最优区间——这是施…详细
自动驾驶开发商Nuro与豪华电动车制造商Lucid建立合作伙伴关系,获得Uber投资,共同打造机器人出租车新玩家。Nuro从纯配送市场转向授权自动驾驶技术,Lucid负责车辆制造并集成Nuro硬件设计,Uber拥有并运营车辆。该合…详细
Wayback 0.1正式发布,这是一个新的Wayland显示服务器的首个预览版本。该项目旨在为坚持使用X11的用户提供"足够的Wayland功能来让Xwayland正常工作"。虽然这是预览版本,但对于需求简单的用户来说已经可以日常使用。…详细
物理安全是数据中心运营的基石,包括周边入侵检测、视频监控、AI分析、电子门禁和生物识别等。随着数据中心规模扩大,传统安全方法难以适应。AI驱动的分析可将误报率降低70%以上,生物识别技术在高风险环境中日益突出…详细
定义云原生充满挑战,因为云原生并不一定意味着应用必须在云中运行,而更多关乎应用架构。当与云基础、云就绪、云托管和云优先等热门术语并列时,更容易产生混淆。云原生是一种专注于松耦合、可扩展模式的应用设计和…详细
三星Galaxy S25系列搭载骁龙8 Elite处理器,AI处理速度提升40%,CPU性能增强37%,图形渲染提升30%。配备40%更大蒸汽腔散热系统,有效防止过热。ProScaler AI图像缩放引擎实时优化视觉效果,游戏模式可定制化设置避免…详细
IBM首席执行官阿尔温德·克里希纳表示,公司预计通过扩大AI业务规模,到2025年底实现45亿美元的内部成本节约。IBM第二季度营收达170亿美元,同比增长8%。生成式AI业务规模已超75亿美元并持续加速增长。尽管外界担心A…详细
面对日益复杂的网络威胁和混合IT环境,HPE提供全面的数据保护解决方案组合。通过网络弹性、高性能恢复和集成生态系统,HPE确保从本地到云端的全环境数据安全。解决方案涵盖HPE Alletra存储、Zerto软件、StoreOnce备份…详细
研究显示,拥有专门AI领导者的企业在AI投资回报率上高出10%,创新表现超越同行的可能性增加24%。高AI成熟度组织中45%的AI项目能运行三年以上,而低成熟度组织仅为20%。尽管如此,许多企业仍采用零散的AI应用方式,缺…详细
7月23日,在2025开放原子开源生态大会开幕式上,第三届开放原子大赛正式启动,首批12个赛项同步发布。…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。