科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-06-11 07:50:51
NVIDIA团队突破性研究:让AI推理像魔法一样又快又准的超级压缩术

NVIDIA与爱丁堡大学联合团队于2025年提出的动态内存稀疏化技术,通过智能的延迟删除策略实现AI推理系统的高效内存管理,在保持准确性的同时大幅提升处理速度。该技术只需1000个训练步骤就能实现8倍压缩率,在多项复杂…详细

推理时间扩展动态内存稀疏化AI效率优化

2025-06-11 07:50:32
清华大学团队颠覆自动驾驶"眼睛":用AI生成模型让汽车像人一样"看懂"3D世界

清华大学团队利用扩散模型革新自动驾驶3D感知技术,通过生成式建模取代传统判别式方法,让AI系统具备类人想象推理能力。该方法在遮挡区域预测准确率提升15%,并显著改善下游规划任务性能,为自动驾驶向更智能安全方向…详细

人工智能扩散模型自动驾驶

2025-06-11 07:50:06
H Company的AI网页冲浪高手:开源模型如何以超低成本击败GPT-4?

H Company研究团队开发了开源网页操作AI系统Surfer-H,配备专门训练的Holo1视觉语言模型。该系统在WebVoyager基准测试中达到92.2%的成功率,媲美GPT-4性能但成本仅为其四分之一。研究团队还发布了专门的网页定位测试…详细

人工智能网页自动化开源模型

2025-06-11 07:49:37
通过奖励优化图像描述:让多模态大模型拥有推理能力而不用重新训练视觉模块

这项研究提出了RACRO框架,通过奖励优化图像描述来解决多模态推理问题,避免了传统方法中昂贵的视觉-语言重新对齐过程。研究表明,通过将视觉感知与推理解耦并使用强化学习优化图像描述质量,即使只使用较小模型训练…详细

人工智能多模态大语言模型强化学习

2025-06-11 07:48:46
FusionAudio-1.2M:当AI学会像人类一样"听懂"声音的故事——香港中文大学(深圳)团队的突破性研究

香港中文大学(深圳)研究团队开发出FusionAudio-1.2M数据集,创新性地融合音频、视觉、语音和音乐信息来生成详细的音频描述。该研究采用多模态专家系统和大语言模型整合的两阶段方法,构建了包含120万高质量音频描述的…详细

人工智能多模态融合音频理解

2025-06-10 18:11:06
蚂蚁数科加速推进AI战略,设立“AI+产业创新”实验室

AI技术创新是推动企业智能化升级的核心驱动力。…详细

蚂蚁AI

2025-06-10 18:02:18
英特尔推进技术创新,以规模更大的封装满足AI应用需求

为了推动AI等创新应用落地,使其惠及更广大的用户,需要指数级增长的算力。为此,半导体行业正在不断拓展芯片制造的边界,探索提高性能、降低功耗的创新路径。…详细

2025-06-10 17:48:35
浙江大学推出动态场景重建的新方法——FreeTimeGS,知名KOL:这就是未来Midjourney要实现的效果

浙江大学与吉利汽车研究院提出了一个叫做FreeTimeGS的新方法,通过一种全新的思路给予高斯基元"自由",让它们能够在任意时间和位置出现,从而更好地重建具有复杂动作的动态场景。…详细

3D建模人工智能高斯

2025-06-10 16:39:36
8秒一个电芯,6分半一个电池组!华为F5G-A万兆全光园区方案用网速保障徐工动力的产速

2025年,国内乘用车市场的新能源渗透率已突破55%。与此同时,在商用车领域,新能源车辆的渗透率也突破20%,一大批全新设计的纯电动叉车、铲车、挖掘机等工程机械设备也呈现井喷之势。…详细

2025-06-10 16:27:20
赋能 HPC 未来:MiTAC神雲科技在 ISC高性能计算大会2025 上展示先进服务器平台

【德国汉堡电—ISC高性能计算大会—2025年6月10日】—作为专业的服务器设计与制造商,神达控股股份有限公司(股票代号:3706)旗下子公司神雲科技股份有限公司(MiTAC Computing Technology Corporation),将于 ISC 高性能…详细

2025-06-10 16:08:13
爱簿智能推出E300 AI计算模组:50TOPS国产算力,赋能边缘AI全场景高效部署

国产可控边缘AI基座来了!爱簿E300 AI计算模组以50TOPS国产算力护航关键场景,可实现32B大模型本地轻量化部署!…详细

2025-06-10 15:13:59
从愿景到现实 聚焦生成式AI全球实践 2025亚马逊云科技中国峰会将于6月19日在上海开幕

2025亚马逊云科技中国峰会将于6月19日-20日在上海世博中心举行。本届峰会将汇聚来自亚马逊云科技纽约、伦敦、巴黎等峰会的全球云计算与AI领域权威专家以立足国际的先锋视角,解读生成式AI在全球范围内的落地实践等前…详细

亚马逊云科技

2025-06-10 14:24:08
当AI遇上癌症诊断:上海交大团队如何让机器"看懂"细胞的秘密

上海交通大学研究团队开发出革命性AI癌症诊断系统,通过深度学习技术分析50万张细胞图像,实现94.2%的诊断准确率,诊断时间从30分钟缩短至2分钟。该系统不仅能识别多种癌症类型,还具备解释性功能,已在多家医院试点…详细

人工智能癌症诊断深度学习

2025-06-10 14:21:54
机器人学会3D"变身术":南华理工大学让机器人像人类一样理解物体运动

南华理工大学等机构提出3DFlowAction方法,让机器人通过预测物体3D运动轨迹来学习操作技能。该研究创建了包含11万个实例的ManiFlow-110k数据集,构建了能预测三维光流的世界模型,实现了跨机器人平台的技能迁移。在四…详细

机器人学习3D光流技术跨平台适配

2025-06-10 14:21:14
东京大学团队突破视角局限:第一次让机器同时用"我的眼睛"和"他人的眼睛"看世界

这是首个系统性探索跨视角协作智能的综合性研究,由南京大学、东京大学等顶尖机构联合完成。研究团队首次将"第一人称视角"与"第三人称视角"的协作应用进行了全面梳理,提出了三大技术方向和十三个关键任务,涵盖从智…详细

跨视角协作智能视频理解多视角学习

2025-06-10 14:19:36
北京大学研究团队打造"3D零件拼装师":一张照片就能拆解出完整立体模型的神奇技术

北京大学等机构的研究团队开发出PartCrafter技术,能够从单张照片同时生成多个3D零件组成完整模型,无需预先图像分割。该技术采用创新的局部-全局注意力机制,在保证零件细节的同时确保整体协调性。相比传统先整体后…详细

3D生成技术零件化建模机器学习

2025-06-10 14:18:34
访谈:Pega 的 “Blueprint” 破解老旧 IT 的诅咒

Pega 利用 agentic AI 驱动的 Blueprint 工具,自动解析传统软件和业务流程,助力企业加速创新,摆脱遗留 IT 制约。…详细

数字化转型工作流自动化AI 代理集成

2025-06-10 13:53:01
听声音懂内容:微软与台湾大学研究团队开发音频感知大模型评估说话风格的新方法

这项由台湾大学与微软研究团队合作的研究探索了使用音频感知大语言模型(ALLMs)作为自动评判员来评估语音生成模型的说话风格。研究设计了"语音风格指令跟随"和"角色扮演"两个任务,测试了四种语音模型的表现,并比较了…详细

人工智能音频处理模型评估

2025-06-10 13:52:20
Kinetics:从全新视角重新思考大语言模型测试阶段的资源分配,卡内基梅隆大学研究表明稀疏注意力机制至关重要

卡内基梅隆大学研究团队提出全新"Kinetics"缩放定律,揭示大语言模型测试阶段的资源分配策略需要重新思考。研究发现小型模型效率被严重高估,因为以往研究忽略了内存访问成本这一关键瓶颈。在测试阶段,注意力机制而…详细

人工智能稀疏注意力推理优化

2025-06-10 13:51:22
搜索舞台:加入"放大镜"的大语言模型特性深度剖析 —— 伯克利大学研究团队探索网络搜索增强型AI系统

这项研究由加州大学伯克利分校团队完成,通过创建"Search Arena"平台收集了24,000多次用户与搜索增强型大语言模型的真实交互数据。研究发现用户提问远不止简单事实查询,他们更看重引用丰富的回答,即使引用与内容无…详细

人工智能搜索增强型LLM用户偏好分析

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章