科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-10-22 10:12:46
埃默里大学团队首创AceSearcher:让小体量AI模型也能像侦探一样精准推理

埃默里大学团队发布AceSearcher框架,通过让单一AI模型扮演分析师和调查员双重角色,实现复杂问题的系统性分解和推理。该技术在多跳问答等任务上平均提升7.6%准确率,15亿参数的小模型即可媲美数百亿参数大模型,显著…详细

人工智能强化学习多步推理

2025-10-22 10:12:27
腾讯混元团队发布史上最强开源图像生成AI:一个模型既能看懂图片又能生成图片

腾讯混元团队发布HunyuanImage 3.0,这是全球首个统一图像理解与生成的原生多模态开源模型。该模型基于800亿参数架构,在推理时激活130亿参数,具备思维链推理能力,在文本-图像对齐和视觉质量评估中达到业界领先水平…详细

人工智能图像生成多模态模型

2025-10-22 10:11:54
GUI智能体重获新生:北京理工大学团队让AI在电脑上的操作效率狂飙5倍

北京理工大学团队提出DART框架,通过去耦合训练和自适应数据管理策略大幅提升GUI智能体训练效率。DART-GUI-7B在OSWorld测试中达到42.13%成功率,比基础模型提高14.61%,训练吞吐量提升1.9倍,环境利用率提升5.5倍。该…详细

人工智能强化学习GUI自动化

2025-10-22 10:11:38
中科大和港科大联手打造:让AI学会"听"一小时还能"说"十分钟的神奇对话机器人

香港中文大学和香港科技大学联合开发了MGM-Omni,一个能够理解超过60分钟音频并生成10分钟以上连贯语音的AI系统。该系统采用创新的"大脑-嘴巴"双轨架构,分别负责多模态理解和语音生成,通过分块并行解码技术解决了文…详细

多模态大语言模型语音生成技术零样本语音克隆

2025-10-22 10:11:13
中山大学重新定义视频理解:让AI像人一样"放大镜观看"长视频

中山大学研究团队开发出LOVE-R1视频理解模型,通过模仿人类"先粗后细、重点观察"的认知方式,让AI能够智能地在长视频中定位关键片段进行高分辨率分析。该模型采用快慢结合的处理策略和三阶段训练方案,在四个长视频理…详细

人工智能视频理解注意力机制

2025-10-22 09:56:46
韶音再度携手芝加哥马拉松,深耕全球顶级赛事版图

2025年10月12日,备受瞩目的芝加哥马拉松鸣枪开跑。…详细

2025-10-22 09:12:33
超越扩散模型的新突破:DP Technology让AI图像生成迎来全新变革

这项由DP Technology和北京大学联合完成的研究提出了SphereAR方法,通过超球面约束解决连续标记自回归图像生成中的方差崩溃问题。该方法将所有输入输出限制在固定半径球面上,实现尺度不变性,在ImageNet数据集上创下…详细

人工智能自回归生成图像生成技术

2025-10-22 09:12:15
微软研究院打造AI视觉推理专家:让机器像人类一样"看图说话"

微软研究院联合清华大学开发的PixelCraft系统,通过多智能体协作突破了AI视觉推理瓶颈。该系统采用专业分工模式,包含调度员、规划员、推理员等角色,配备图像记忆库实现灵活推理。在权威测试中准确率提升5-9个百分点…详细

多模态大模型视觉推理系统多智能体协作

2025-10-22 09:12:02
清华深研院突破AI推理的"两难选择":探索与利用居然可以兼得

清华深研院研究团队通过分析AI模型的内部语义表征空间,发现传统认为对立的探索与利用能力实际上可以解耦并同时增强。基于这一发现,他们开发了VERL方法,通过有效排序及其导数来动态调节训练激励,在高考2024数据集…详细

强化学习语义表征AI推理优化

2025-10-22 09:11:49
人工智能与人类协作的新境界:北京传媒大学和微软团队破解云端智能压缩难题

这项由中国传媒大学和微软联合开展的研究提出了UniMIC框架,创新性地采用令牌化技术解决人机协作中的通信效率问题。该技术将多媒体数据转换为紧凑令牌进行传输,避免了传统方法的累积损失,在文本生成图像、图像编辑…详细

人工智能令牌化压缩人机协作通信

2025-10-22 09:11:37
NVIDIA突破4位浮点训练瓶颈:让大模型训练速度翻倍的NVFP4技术

NVIDIA团队成功实现了4位浮点精度(NVFP4)的大语言模型训练突破,通过创新的双级缩放、随机哈达玛变换、二维块缩放和随机舍入技术,在120亿参数模型上完成了史上最长的4位精度训练实验。相比传统方法,NVFP4将训练速度…详细

人工智能NVFP4格式训练效率优化

2025-10-22 09:11:15
上海AI实验室突破计算机视觉难题:如何让机器像人类一样"看懂"深度

上海人工智能实验室研究团队开发了BRIDGE系统,通过强化学习优化的深度-图像生成引擎解决单目深度估计中的数据稀缺问题。系统能根据深度信息生成2000万张高质量图像,采用混合监督策略结合教师模型预测和高精度真实标…详细

计算机视觉深度学习强化学习

2025-10-22 09:11:02
腾讯和武汉大学研发的"思维型AI智能体":会思考、会推理、像人类一样学习游戏

这项由腾讯与武汉大学合作的研究开发了一种革命性的AI智能体CEL,它能像人类一样从零开始学习游戏规则并制定策略。与传统需要大量数据训练的"黑箱"AI不同,CEL通过观察、思考和反思的方式自主学习,整个决策过程完全…详细

人工智能强化学习可解释AI

2025-10-22 09:10:48
机器人导航新突破:上海AI实验室团队开发出会"自学成才"的智能导航系统

这项由上海AI实验室联合多所知名高校开发的SID导航系统,首次实现了机器人通过自我经验学习来提升导航能力的突破。该系统能让机器人仅凭简单的目标描述就在陌生环境中自主探索,在SOON任务中成功率达50.9%,比现有方…详细

机器人导航自监督学习目标导向导航

2025-10-22 08:20:48
可穿戴设备、AI与个人医疗数字化身的融合趋势

随着大语言模型在人工智能时代展现强大力量,可穿戴设备成为收集人体数据的重要载体。通过实时监测血压、心率、血糖等生命体征,结合AI边缘计算能力,医疗正向个性化转型。基因治疗、数字孪生技术让每个人都能拥有专…详细

人工智能可穿戴设备个性化医疗

2025-10-22 08:20:10
OpenInfra欧洲峰会:从VMware迁移至开源替代方案

在巴黎举办的欧洲开放基础设施峰会期间,专门用一整天时间讨论VMware迁移问题。博通收购VMware后许可证价格上涨,导致客户运营成本大幅增加。开源开发者展示了将VMware虚拟机迁移到开源替代方案的产品。Forrester分析…详细

虚拟化技术开源软件企业迁移

2025-10-22 08:10:57
OpenAI寻求"谷歌Chrome"时刻:推出Atlas网页浏览器

OpenAI发布Atlas浏览器,旨在将ChatGPT深度集成到网页浏览体验中。该浏览器支持用户与网页对话,提供侧边聊天功能,可直接在Gmail等应用中编辑文本。Agent模式允许AI代理自动执行跨网站任务,如将食谱配料添加到购物…详细

人工智能智能体技术浏览器创新

2025-10-22 08:08:54
Aura推出499美元电子墨水数码相框,实现无线充电功能

Aura发布新款Ink相框,采用13英寸彩色电子纸显示屏,售价499美元。该产品使用六色墨水系统呈现丰富色彩,最重要的是支持无线操作,适合挂在客厅墙面等需要美观的位置。相框配备前置光源改善对比度,电池续航可达三个…详细

数码相框电子墨水技术无线充电功能

2025-10-22 08:07:53
软件推动AI帕累托前沿超越硬件

英伟达CEO黄仁勋在GTC 2025大会上展示了AI推理吞吐量与响应时间之间的帕累托前沿曲线。数据显示,从Hopper H200到Blackwell B200系统,通过硬件升级和软件优化,性能提升达25倍。值得注意的是,在AI领域,硬件性能提…详细

人工智能GPU计算性能优化

2025-10-22 08:02:11
AWS与e&联合推出AI和云计算培训项目,培养阿联酋未来就绪人才

亚马逊云科技AWS与科技集团e&联合推出"AI Nation - Afaaq"全国培训项目,计划通过e& Academy平台为3万名学员提供人工智能和机器学习技术培训。该项目是双方10亿美元战略联盟的重要组成部分,旨在解决阿联酋AI技能短缺…详细

人工智能云计算人才培养

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章