数字时代,我们每天与海量信息打交道,拍照、存储、管理、学习、办公……这些碎片化的需求,往往令人感到疲惫。但现在,这一切将变得前所未有的简单与高效!百度网盘与百度文库创新推出“AI相机”…详细
Vanta 推出全新 AI 合规代理,自动处理安全与合规工作流,从策略映射到证据审核,有效降低人工失误并提升运营效率。该产品已启动私测,七月全面上线在即,开启企业风险管理新时代。…详细
谷歌DeepMind研究团队开发了一种革命性的机器人3D重建技术SplatMesh,能够让机器人从不完美的真实数据中学习,同时重建物体几何形状和外观。该技术采用端到端优化策略,将机器人校准、场景重建和物理仿真统一在一个框…详细
电子科技大学研究团队突破性发现:仅使用不到10%的精选训练数据,就能让多模态AI的推理能力超越传统全数据训练方法,同时缩短40%训练时间。他们开发的RAP数据选择框架通过因果差异分析和注意力评估,精准识别能激发A…详细
这项由巴斯克语言技术中心团队完成的研究,开发了GUIDEX方法来自动生成信息提取的标注指南和训练数据。该方法通过四个步骤(文档总结、结构化表示、指南生成、实例提取)模拟专家工作流程,无需人工标注即可适应新领…详细
Skoltech等机构联合开发了首个多语言"常青问题"识别系统EverGreenQA,能准确区分问题答案的时效性。研究创建了包含7种语言4757个问题的数据集,训练的EG-E5分类器准确率达90.6%,超越现有大型语言模型。该技术可改善…详细
报告发现,65% 的企业在过去一年中遭遇了云安全事件,但只有 6% 的企业在一小时内进行了补救…详细
进入2025年,智能体成为AI产业的新入口。不同企业路径分化明显:有的强调大模型平台能力,有的围绕助手封装展开,另一些则选择从具体场景出发,构建可持续的服务闭环。…详细
这项研究介绍了CRAWLDoc,一种创新的文献排序系统,能从网络中自动识别与学术论文相关的文档。德国乌尔姆大学的研究团队利用小型语言模型,将论文登陆页面作为查询,对所有链接资源进行排序,有效解决了学术元数据提…详细
西安交通大学与昆明理工大学研究团队开发了一种基于集成学习的婴幼儿语音情感识别方法,能有效分辨饥饿、困倦、不舒服和高兴四种情绪状态。研究采用三层分类器架构,整合SVM、随机森林和KNN算法,达到85.82%的准确率…详细
这项来自普渡大学和微软的研究探索如何让AI助手更好地保护用户隐私。研究团队通过让大型语言模型在回答前先思考"语境完整性"(即在特定场景下什么信息适合分享),并结合强化学习技术进行训练,成功降低了隐私信息泄露…详细
SkyReels-Audio是Skywork AI团队开发的全能音频驱动人像视频生成框架,能将静态图像或视频与语音输入结合,生成高度逼真、唇形同步的说话人像视频。基于预训练的视频扩散变换器构建,该技术支持无限长度视频生成和编…详细
波士顿大学研究团队通过先进脑成像技术首次揭示了技能从需要意识控制转变为自动化执行的完整神经过程。研究发现大脑存在两个关键网络:认知控制网络负责新技能学习,程序性学习网络负责自动化执行。随着练习增加,控…详细
NVIDIA与爱丁堡大学联合团队于2025年提出的动态内存稀疏化技术,通过智能的延迟删除策略实现AI推理系统的高效内存管理,在保持准确性的同时大幅提升处理速度。该技术只需1000个训练步骤就能实现8倍压缩率,在多项复杂…详细
清华大学团队利用扩散模型革新自动驾驶3D感知技术,通过生成式建模取代传统判别式方法,让AI系统具备类人想象推理能力。该方法在遮挡区域预测准确率提升15%,并显著改善下游规划任务性能,为自动驾驶向更智能安全方向…详细
H Company研究团队开发了开源网页操作AI系统Surfer-H,配备专门训练的Holo1视觉语言模型。该系统在WebVoyager基准测试中达到92.2%的成功率,媲美GPT-4性能但成本仅为其四分之一。研究团队还发布了专门的网页定位测试…详细
这项研究提出了RACRO框架,通过奖励优化图像描述来解决多模态推理问题,避免了传统方法中昂贵的视觉-语言重新对齐过程。研究表明,通过将视觉感知与推理解耦并使用强化学习优化图像描述质量,即使只使用较小模型训练…详细
香港中文大学(深圳)研究团队开发出FusionAudio-1.2M数据集,创新性地融合音频、视觉、语音和音乐信息来生成详细的音频描述。该研究采用多模态专家系统和大语言模型整合的两阶段方法,构建了包含120万高质量音频描述的…详细
为了推动AI等创新应用落地,使其惠及更广大的用户,需要指数级增长的算力。为此,半导体行业正在不断拓展芯片制造的边界,探索提高性能、降低功耗的创新路径。…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。