商业办公-第51页-频道-至顶网

2025-06-25 14:53:35

统一理解与生成的"大脑分工"：上海AI实验室揭示多模态AI的两难困境与解决方案

上海AI实验室研究团队发现统一多模态AI中图像理解与生成任务存在根本冲突：理解需要逐层增强语义关联，生成则需要早期语义指导后期专注细节。他们提出UniFork架构，采用"共享浅层+分离深层"的Y型设计，有效解决任务冲…详细

统一多模态AI 图像生成与理解 Y型神经网络架构

2025-06-25 14:52:32

新加坡国立大学团队开发"拖拽式"AI模型：让大模型适应新任务只需几秒钟

新加坡国立大学团队开发出革命性的"拖拽式"AI技术DnD，能够在几秒钟内直接从文本描述生成大语言模型参数，无需传统耗时的训练过程。该技术在多个任务上表现优异，效率比传统方法提升2500-12000倍，为AI模型的快速定制…详细

人工智能参数生成大语言模型优化

2025-06-25 14:50:44

终端平铺工具：控制台专家的多路复用利器

本文评测了六款控制台平铺终端复用器工具。GNU Screen作为老牌工具功能强大但操作复杂，Tmux更现代化但学习曲线陡峭，Byobu为前两者提供友好界面，Zellij用Rust编写界面简洁易用，DVTM追求极简主义，Twin提供类似Tur…详细

终端管理平铺窗口多路复用器

2025-06-25 14:48:49

Snyk收购Invariant Labs以扩展AI智能体安全能力

网络安全公司Snyk宣布收购瑞士人工智能安全研究公司Invariant Labs，收购金额未公开。Invariant Labs从苏黎世联邦理工学院分拆成立，专注于帮助开发者构建安全可靠的AI代理工具和框架。该公司提供Explorer运行时观察…详细

人工智能 AI智能体安全企业收购

2025-06-25 14:47:43

谷歌发布离线机器人AI系统，无需联网即可系鞋带

谷歌DeepMind发布新的离线视觉语言行动模型，让机器人无需云端支持即可自主运行。该模型基于Gemini的多模态理解能力，能够完成系鞋带、折衣服等复杂任务。相比之前的混合云端模式，新模型准确性仅略有下降，但大幅提…详细

人工智能机器人技术离线部署

2025-06-25 14:43:00

Pure Storage谈AI数据挑战超越硬件层面

Pure Storage AI基础设施副总裁Par Botes强调，成功应对AI工作负载不仅需要足够的计算和存储资源，更关键的是确保AI训练数据的质量。企业需要捕获、组织、准备和对齐数据，因为数据往往不完整或不适合AI要解决的问题…详细

人工智能数据工程数据湖仓

2025-06-25 14:41:56

全球5G用户2025年底将接近30亿，FWA业务快速增长

爱立信2025年移动性报告显示，5G通信正加速走向成熟，商业服务发展为复杂套餐。预计2025年底全球5G用户数将超过29亿，约占移动用户总数三分之一。2024年底5G网络承载35%全球移动流量，预计2030年将达80%。固定无线接…详细

5G网络固定无线接入基于速度资费

2025-06-25 13:31:46

机器人团队协作新突破：上海人工智能实验室让多个机器人像人类团队一样高效合作

上海人工智能实验室的研究团队开发了VIKI-R框架，首次实现了让不同类型机器人像人类团队一样协作。该研究建立了全球首个多机器人视觉协作评估平台VIKI-Bench，通过队员选择、任务规划、轨迹感知三层测试体系全面评估…详细

机器人协作强化学习视觉感知

2025-06-25 13:31:30

告别文档分块难题：Yellow.ai如何用AI"眼睛"让机器真正看懂PDF文件

Yellow.ai研究团队开发了革命性的多模态文档分块技术，让AI系统能像人类一样"看"PDF文档，而非仅仅"读"文字。该方法采用批量视觉处理和上下文保持机制，解决了传统固定长度分块导致的表格分割、内容破碎等问题。在RA…详细

多模态文档理解 RAG系统优化视觉引导分块

2025-06-25 13:31:14

DreamCube：香港大学团队突破传统，让AI从一张照片"脑补"出整个360度世界

香港大学团队突破性地解决了AI全景图生成中的拼接难题，提出DreamCube系统，能从单张照片生成包含深度信息的完整360度场景。该研究创新性地引入"多平面同步"技术，让AI同时协调处理立方体六个面，避免传统方法的色差…详细

人工智能 3D场景生成多平面同步

2025-06-25 13:30:48

腾讯推出"游戏制造器"：AI让你用键盘鼠标就能创造真实游戏世界

腾讯混元团队推出革命性AI系统Hunyuan-GameCraft，能根据键盘鼠标操作实时生成对应游戏画面。该系统统一处理各种输入信号，采用混合历史条件训练保持长期一致性，通过模型蒸馏实现近实时响应。基于100多款3A游戏数据…详细

游戏视频生成交互式AI 实时内容创作

2025-06-25 13:30:30

腾讯混元3D 2.5：让3D模型生成进入"极致细节"时代

腾讯混元3D团队发布的最新版本2.5在3D资产生成领域实现重大突破。新系统引入100亿参数的LATTICE形状模型，能生成极其精细的3D形状细节，并首次支持PBR物理渲染材质生成。通过双阶段分辨率提升和多通道协同机制，实现…详细

3D生成技术物理渲染深度学习

2025-06-25 12:54:32

佳量医疗曹鹏：2025年是我们的脑机接口元年

将脑机接口技术，拓展到具身智能领域，应用到康养、家用等场景。…详细

脑机接口

2025-06-25 11:37:56

清华大学推出革命性视频生成技术：让AI看懂"注意力"背后的秘密

清华大学团队通过创新的"模式感知重排序"技术，解决了AI视频生成中注意力机制计算效率低下的问题。该技术将复杂分散的注意力模式重新整理成规整的块状结构，结合专门设计的稀疏化和量化策略，在保持生成质量的同时将…详细

人工智能注意力机制计算优化

2025-06-25 11:37:38

哥伦比亚大学研究团队破解AI偏见难题：如何让人工智能在政治立场总结中保持公正

哥伦比亚大学研究团队开发出新的AI偏见纠正技术，通过"重排序"方法让人工智能在总结政治观点时保持公正。该方法让AI生成多个版本后择优选择，结合偏好调优训练，显著提升了观点覆盖度和内容准确性，为构建更可信赖的…详细

人工智能观点总结重排序技术

2025-06-25 11:37:08

Show-o2：新加坡国立大学新突破，一个AI大脑同时掌握看图说话和画图创作

新加坡国立大学Show Lab团队发布Show-o2统一多模态AI模型，首次实现单一系统内文字、图像、视频的理解与生成能力。该研究采用3D因果VAE和双路径融合机制，通过创新的两阶段训练策略，在多项基准测试中超越现有技术，…详细

人工智能多模态模型统一生成

2025-06-25 11:36:54

微软研究院揭示AI推理真相：当智能模型遇上变化题目会怎样？

微软研究院开发的RE-IMAGINE框架通过创新的三层次测试体系（观察、变化、想象），系统评估大型语言模型的真实推理能力。研究发现，即使最先进的AI模型在面对题目变化时表现也会显著下降，揭示了当前AI系统过度依赖统…详细

人工智能推理评估大型语言模型

2025-06-25 11:36:41

让大模型像人一样思考：AI推理能力跨领域训练的突破性进展——加州大学圣地亚哥分校等多机构合作成果

加州大学圣地亚哥分校等多机构研究团队通过创建GURU数据集，系统研究了强化学习在AI推理能力跨领域迁移中的作用机制。研究发现，AI在熟悉领域主要激发已有知识，在陌生领域则能学习新技能，开发的GURU模型在17项推理…详细

人工智能强化学习跨领域推理

2025-06-25 11:36:17

当AI学会倾听人类情感：LAION团队打造史上最精细的语音情感识别基准测试

LAION团队联合多个顶尖研究机构推出EMONET-VOICE语音情感识别基准，包含4500小时多语言合成语音数据和40种精细情感分类。该项目通过心理学专家标注创建高质量测试集，开发出性能领先的EMPATHICINSIGHT-VOICE模型，发…详细

语音情感识别合成语音技术多模态情感分析

2025-06-25 11:36:04

新加坡科技设计大学SonicVerse：让AI像音乐专家一样"听"懂音乐并用语言完美描述

新加坡科技设计大学团队开发了SonicVerse音乐描述AI系统，通过多任务学习架构同时进行音乐特征识别和自然语言生成，能够像专业音乐评论家一样准确描述音乐的技术特征和艺术内容。该系统不仅在短片段描述上表现出色，…详细

音乐AI 多任务学习音乐特征识别

华为云数字化转型秘籍调研

业界热点: