科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-06-11 11:45:40
百度网盘、文库重磅推出AI相机:打造全模态“超级入口”

数字时代,我们每天与海量信息打交道,拍照、存储、管理、学习、办公……这些碎片化的需求,往往令人感到疲惫。但现在,这一切将变得前所未有的简单与高效!百度网盘与百度文库创新推出“AI相机”…详细

百度网盘百度文库AI

2025-06-11 10:54:44
Vanta 的 AI 代理想要运行您的合规计划 —— 事实可能如此

Vanta 推出全新 AI 合规代理,自动处理安全与合规工作流,从策略映射到证据审核,有效降低人工失误并提升运营效率。该产品已启动私测,七月全面上线在即,开启企业风险管理新时代。…详细

人工智能合规自动化自主代理

2025-06-11 09:49:23
谷歌DeepMind突破性技术:机器人能像人类一样"看着学"——从不完美数据中重建完美虚拟世界

谷歌DeepMind研究团队开发了一种革命性的机器人3D重建技术SplatMesh,能够让机器人从不完美的真实数据中学习,同时重建物体几何形状和外观。该技术采用端到端优化策略,将机器人校准、场景重建和物理仿真统一在一个框…详细

机器人学习3D重建端到端优化

2025-06-11 09:49:09
电子科大团队最新发现:用不到10%的数据就能让AI更聪明,训练时间还能缩短一半!

电子科技大学研究团队突破性发现:仅使用不到10%的精选训练数据,就能让多模态AI的推理能力超越传统全数据训练方法,同时缩短40%训练时间。他们开发的RAP数据选择框架通过因果差异分析和注意力评估,精准识别能激发A…详细

人工智能多模态推理数据选择

2025-06-11 09:48:44
巴斯克AI团队新突破:让计算机像专家一样自动识别信息,无需大量人工标注

这项由巴斯克语言技术中心团队完成的研究,开发了GUIDEX方法来自动生成信息提取的标注指南和训练数据。该方法通过四个步骤(文档总结、结构化表示、指南生成、实例提取)模拟专家工作流程,无需人工标注即可适应新领…详细

GUIDEX信息提取零样本学习

2025-06-11 09:48:23
大模型也会"过时"?Skoltech首创"常青问题"识别系统,让AI更懂"时效性"

Skoltech等机构联合开发了首个多语言"常青问题"识别系统EverGreenQA,能准确区分问题答案的时效性。研究创建了包含7种语言4757个问题的数据集,训练的EG-E5分类器准确率达90.6%,超越现有大型语言模型。该技术可改善…详细

人工智能自然语言处理多语言分类器

2025-06-11 09:34:15
Check Point《2025 年云安全报告》揭露危险盲点:企业因时间、信任和敏捷性而付出高昂代价

报告发现,65% 的企业在过去一年中遭遇了云安全事件,但只有 6% 的企业在一小时内进行了补救…详细

2025-06-11 09:13:35
不是做大模型,而是落在执行闭环,酷开智能体思路浮出水面

进入2025年,智能体成为AI产业的新入口。不同企业路径分化明显:有的强调大模型平台能力,有的围绕助手封装展开,另一些则选择从具体场景出发,构建可持续的服务闭环。…详细

2025-06-11 07:53:58
CRAWLDoc:如何从混乱的网页中找到学术黄金——德国乌尔姆大学开发的智能文献排序系统

这项研究介绍了CRAWLDoc,一种创新的文献排序系统,能从网络中自动识别与学术论文相关的文档。德国乌尔姆大学的研究团队利用小型语言模型,将论文登陆页面作为查询,对所有链接资源进行排序,有效解决了学术元数据提…详细

学术数据集信息检索语言模型

2025-06-11 07:52:43
婴幼儿语音情感数据的智能分析:西安交通大学与昆明理工大学联合突破传统限制的榜样之作

西安交通大学与昆明理工大学研究团队开发了一种基于集成学习的婴幼儿语音情感识别方法,能有效分辨饥饿、困倦、不舒服和高兴四种情绪状态。研究采用三层分类器架构,整合SVM、随机森林和KNN算法,达到85.82%的准确率…详细

人工智能语音情感识别集成学习

2025-06-11 07:52:03
大型语言模型的隐私保护:微软与普渡大学联合研究团队让AI学会在对话中判断哪些信息该说,哪些不该说

这项来自普渡大学和微软的研究探索如何让AI助手更好地保护用户隐私。研究团队通过让大型语言模型在回答前先思考"语境完整性"(即在特定场景下什么信息适合分享),并结合强化学习技术进行训练,成功降低了隐私信息泄露…详细

人工智能隐私保护大型语言模型

2025-06-11 07:51:43
SkyReels-Audio:让肖像"动"起来 - Skywork AI开创全能音频驱动的人像视频生成技术

SkyReels-Audio是Skywork AI团队开发的全能音频驱动人像视频生成框架,能将静态图像或视频与语音输入结合,生成高度逼真、唇形同步的说话人像视频。基于预训练的视频扩散变换器构建,该技术支持无限长度视频生成和编…详细

人工智能视频生成音频同步

2025-06-11 07:51:19
波士顿大学研究揭秘:为什么大脑"练得越多,想得越少"?神经科学家发现思维自动化的惊人真相

波士顿大学研究团队通过先进脑成像技术首次揭示了技能从需要意识控制转变为自动化执行的完整神经过程。研究发现大脑存在两个关键网络:认知控制网络负责新技能学习,程序性学习网络负责自动化执行。随着练习增加,控…详细

神经科学技能学习大脑网络

2025-06-11 07:50:51
NVIDIA团队突破性研究:让AI推理像魔法一样又快又准的超级压缩术

NVIDIA与爱丁堡大学联合团队于2025年提出的动态内存稀疏化技术,通过智能的延迟删除策略实现AI推理系统的高效内存管理,在保持准确性的同时大幅提升处理速度。该技术只需1000个训练步骤就能实现8倍压缩率,在多项复杂…详细

推理时间扩展动态内存稀疏化AI效率优化

2025-06-11 07:50:32
清华大学团队颠覆自动驾驶"眼睛":用AI生成模型让汽车像人一样"看懂"3D世界

清华大学团队利用扩散模型革新自动驾驶3D感知技术,通过生成式建模取代传统判别式方法,让AI系统具备类人想象推理能力。该方法在遮挡区域预测准确率提升15%,并显著改善下游规划任务性能,为自动驾驶向更智能安全方向…详细

人工智能扩散模型自动驾驶

2025-06-11 07:50:06
H Company的AI网页冲浪高手:开源模型如何以超低成本击败GPT-4?

H Company研究团队开发了开源网页操作AI系统Surfer-H,配备专门训练的Holo1视觉语言模型。该系统在WebVoyager基准测试中达到92.2%的成功率,媲美GPT-4性能但成本仅为其四分之一。研究团队还发布了专门的网页定位测试…详细

人工智能网页自动化开源模型

2025-06-11 07:49:37
通过奖励优化图像描述:让多模态大模型拥有推理能力而不用重新训练视觉模块

这项研究提出了RACRO框架,通过奖励优化图像描述来解决多模态推理问题,避免了传统方法中昂贵的视觉-语言重新对齐过程。研究表明,通过将视觉感知与推理解耦并使用强化学习优化图像描述质量,即使只使用较小模型训练…详细

人工智能多模态大语言模型强化学习

2025-06-11 07:48:46
FusionAudio-1.2M:当AI学会像人类一样"听懂"声音的故事——香港中文大学(深圳)团队的突破性研究

香港中文大学(深圳)研究团队开发出FusionAudio-1.2M数据集,创新性地融合音频、视觉、语音和音乐信息来生成详细的音频描述。该研究采用多模态专家系统和大语言模型整合的两阶段方法,构建了包含120万高质量音频描述的…详细

人工智能多模态融合音频理解

2025-06-10 18:11:06
蚂蚁数科加速推进AI战略,设立“AI+产业创新”实验室

AI技术创新是推动企业智能化升级的核心驱动力。…详细

蚂蚁AI

2025-06-10 18:02:18
英特尔推进技术创新,以规模更大的封装满足AI应用需求

为了推动AI等创新应用落地,使其惠及更广大的用户,需要指数级增长的算力。为此,半导体行业正在不断拓展芯片制造的边界,探索提高性能、降低功耗的创新路径。…详细

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章