科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-07-07 17:35:28
TL;DR:微调大模型思考长度,让AI推理更高效——记录中美多机构联合研究

这篇研究论文提出了一种名为TLDR(思考长度数据再权重)的创新方法,用于解决大型语言模型在推理过程中过度思考的问题。研究团队通过动态平衡系统1(简洁直觉)和系统2(深度推理)数据的权重,实现了在保持推理准确…详细

人工智能大语言模型推理思考压缩技术

2025-07-07 17:35:12
MoCA-Video:运动感知概念对齐技术让视频编辑更连贯自然

MoCA-Video是沙特阿卜杜拉国王科技大学研究团队开发的免训练视频编辑框架,通过运动感知概念对齐技术实现高质量语义混合。该方法巧妙利用对角线去噪调度和无类别分割技术在潜在空间中精确跟踪目标,并通过动量校正和…详细

计算机视觉扩散模型视频编辑

2025-07-07 17:34:50
微软最新突破:如何让大型语言模型在超长文本中聊得又快又好?

微软研究院团队提出了Rectified Sparse Attention(ReSA)技术,解决大型语言模型处理超长文本时的效率问题。ReSA结合了分组块稀疏注意力机制和定期密集矫正策略,既保持了生成质量,又显著提高了处理速度。实验表明…详细

大型语言模型稀疏注意力机制推理效率优化

2025-07-07 17:34:35
提升社交智能:如何让大模型像人类一样理解人情世故——浙江大学与阿里巴巴通义实验室联合研究

这项研究由浙江大学和阿里巴巴通义实验室合作完成,提出了一种名为"时序感知分层认知强化学习"(TimeHC-RL)的创新方法,旨在提升大语言模型的社交智能。研究者观察到,虽然大模型在数学等领域进步显著,但社交领域需…详细

人工智能社交智能强化学习

2025-07-07 17:34:10
小米发布MiMo-VL-7B:一款令人惊艳的开源视觉语言模型,通用性能与推理能力双双突破

小米LLM-Core团队开源了两款强大的视觉语言模型MiMo-VL-7B-SFT和MiMo-VL-7B-RL,在通用视觉理解和多模态推理领域创下新纪录。仅有7B参数的MiMo-VL-7B-RL在40项评测中的35项上超越Qwen2.5-VL-7B,在OlympiadBench上达…详细

人工智能视觉语言模型多模态推理

2025-07-07 17:33:28
物声相应:交互式感知物体的图像到音频生成技术——加州大学伯克利分校与字节跳动联合研究突破

这项研究提出了一种交互式物体感知的图像到音频生成模型,让用户能够针对图像中选定的特定物体生成相应声音。研究团队将物体中心学习整合到条件潜在扩散模型中,通过多模态注意力机制学习图像区域与声音的对应关系。…详细

人工智能音频生成物体感知

2025-07-07 17:32:15
解剖自然图像的秘密:伯克利与谷歌研究团队如何让计算机理解"什么让一张照片看起来像照片"

这篇研究来自加州大学伯克利分校和谷歌研究院团队,探讨了什么让图像看起来"自然"这一问题。论文提出了一种识别自然图像特征的深度学习方法,通过训练神经网络区分真实照片与人工处理的图像,并能将"不自然"的图像转…详细

计算机视觉深度学习图像处理

2025-07-07 17:30:39
哈佛大学团队揭秘:如何用"心理学+AI"的神奇组合,让机器人学会像人类一样从错误中成长

哈佛大学研究团队开发出革命性AI训练方法,让机器能像人类一样从错误中学习成长。与传统需要大量正确答案示例的方法不同,新方法让AI系统自主探索并从失败中提取学习信号。实验显示,这种方法在机器人导航、医学诊断…详细

人工智能机器学习错误学习算法

2025-07-07 17:29:28
AUTOMIND:清华浙大联手打造的"数据科学全自动大师",让AI学会像专家一样解决机器学习难题

这项由浙江大学与蚂蚁集团联合研究的AUTOMIND系统,通过构建专家知识库、智能搜索策略和自适应编程三大创新,让AI具备了接近人类专家的数据科学能力。在权威测试中超越56.8%的人类参赛者,相比前代系统效率提升300%,…详细

人工智能数据科学机器学习

2025-07-07 17:28:34
让AI按照你的要求写作:突破"千篇一律"的新框架——Komorebi AI公司的可配置偏好调优技术

这项由西班牙Komorebi AI公司发表的研究提出了"可配置偏好调优"(CPT)框架,解决了传统AI只能用固定风格写作的问题。通过合成数据训练,CPT让AI能根据系统指令动态调整写作风格,从正式商务到创意文学都能胜任。实验…详细

人工智能自然语言处理新型算法

2025-07-07 16:57:16
阿里通义实验室推出WebSailor:首个与顶级闭源系统媲美的开源超级网络智能体

阿里通义实验室发布首个媲美顶级闭源系统的开源超级网络智能体WebSailor,突破性解决开源模型在超高不确定性任务中的系统性推理难题,在BrowseComp基准测试准确率提升3倍,标志着开源技术在复杂信息搜索领域的历史性…详细

2025-07-07 15:51:20
印度理工学院团队推出EKA-EVAL:专为印度语言设计的AI大模型评测神器

印度理工学院团队推出EKA-EVAL评测框架,首次实现对AI大模型的全方位多语言评估。该框架整合35个评测任务,专门支持22种印度官方语言,涵盖推理、数学、工具使用等核心能力。相比现有英语中心的评测工具,EKA-EVAL填…详细

多语言AI评测印度语言处理AI模型评估框架

2025-07-07 14:31:26
VMware竞争对手加速构建虚拟化替代方案

随着VMware推进基于核心虚拟化技术的私有云愿景,竞争对手正加速开发替代方案。OpenNebula发布7.0版本,新增ARM处理器支持和增强的PCI直通功能,可部署在AI工厂中。红帽OpenShift Virtualization 4.19版本在Azure、O…详细

虚拟化开源技术架构优化

2025-07-07 12:16:40
医生的AI助手:CRISP-SAM2如何让CT扫描精准识别人体器官

杭州电子科技大学研究团队开发出CRISP-SAM2智能医学影像分析系统,能够结合文字描述和CT图像同时进行器官识别。该系统通过跨模态语义交互技术,无需医生手动提示即可精准分割18种人体器官,在七个数据集测试中表现优…详细

医学影像分析跨模态AI器官分割

2025-07-07 12:16:22
伊利诺伊大学香槟分校首创视觉对抗推理:揭秘AI分割模型的幻觉漏洞

伊利诺伊大学研究团队开发了HalluSegBench评估系统,首次系统性揭示AI视觉分割模型的"幻觉"问题。通过创建1340对对比图像和四种新评估指标,研究发现当前先进AI模型普遍存在错误识别不存在物体的严重缺陷,且视觉变化…详细

视觉分割反事实推理AI幻觉评估

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章