这篇论文提出了"计划与预算"框架,解决大型语言模型在推理任务中的效率问题。研究者发现模型存在"推理失调"现象——简单问题上过度思考,复杂问题上思考不足。他们开发了贝叶斯预算分配模型(BBAM)作为理论基础,将推…详细
康奈尔大学团队提出的"神秘语言模型"(Eso-LMs)创新性地融合了自回归和掩码扩散模型的优势,实现了两种范式间的平滑过渡。研究最大突破在于首次为掩码扩散模型引入KV缓存技术,同时保留并行生成能力,使推理速度比标准…详细
这项由LMU慕尼黑大学研究团队进行的研究,首次深入探索了代码语言模型如何在内部表示和处理多种编程语言。研究通过分析Llama系列模型的中间层表示和神经元激活模式,发现模型在处理代码翻译任务时会经过"英语思维"的…详细
这项研究提出了首个统一的可解释AI生成内容检测框架IVY-FAKE,能同时处理图像和视频。研究团队创建了一个包含15万多个带有详细注释样本的大型数据集,并开发了IVY-XDETECTOR模型,不仅能准确识别AI生成内容,还能用自…详细
这项研究提出了RARE框架,全面评估检索增强生成系统面对现实干扰时的鲁棒性。它包含三大核心组件:RARE-Met评估指标,RARE-Get自动数据生成管道,以及RARE-Set覆盖金融、经济、政策领域的大规模数据集。实验结果揭示…详细
今日,以“AI重构商业未来”为主题的2025思爱普中国峰会盛大召开。在全球商业环境持续面临不确定性影响的当下,中国企业正积极拥抱变革,寻求韧性发展。…详细
Snap 推出 Lens Studio 的 iOS 应用和网页工具,让所有技能层次的用户都能通过文字提示和简单编辑,轻松创建 AR 镜头,包括生成 AI 效果和集成 Bitmoji,从而普及 AR 创作,并持续为专业应用提供支持。…详细
Epic Games 在 Orlando Unreal Fest 上发布 2025 年 Unreal 状态报告,展示了 UE5.6 新技术、AI 创作工具和 Epic Games Store 成就,助力开发者打造开放世界游戏体验。…详细
在数字化浪潮汹涌的当下,软件测试作为保障软件质量的关键环节,正经历着由 AI 技术引发的深刻变革。传统软件测试模式在周期、成本和效率等方面的固有弊端,正被 AI 的智能化能力逐一突破,开启软件测试的全新篇章。…详细
罗切斯特理工学院和美国陆军研究实验室的研究团队开发了一种突破性的无源域适应方法,通过混搭拼图增强技术和置信度-边界加权策略,使AI模型能在没有原始训练数据的情况下适应新环境。该方法在三个主要基准数据集上取…详细
苹果将在 WWDC 2025 上推出重磅软件更新,包括 iOS 全新设计、系统命名变革、AI 功能提升及游戏体验升级,进一步优化跨设备生态。…详细
这篇论文介绍了R1-Code-Interpreter,一种通过有监督学习和强化学习训练大型语言模型进行代码推理的新方法。研究团队收集了144个推理和规划任务,利用多轮训练教会模型自主决定何时使用文本推理或生成代码。最终的14…详细
这项研究探索了一种全新的AI文本生成方式:"弗兰肯文本"。灵感来自《弗兰肯斯坦》小说,研究者让大型语言模型在一个极端条件下创作:90%的内容必须直接复制自人类写作片段。尽管限制严格,但像Gemini-2.5-Pro这样的模…详细
ISTA和Red Hat AI的研究团队在《Unified Scaling Laws for Compressed Representations》论文中提出了一个革命性的统一框架,揭示了AI模型压缩背后的数学规律。他们发现,无论使用什么压缩方法,模型性能都可以通过"…详细
这项研究揭示了机器生成文本检测器的重大漏洞。意大利研究团队通过直接偏好优化技术,成功训练AI模型生成更像人类的文本,导致顶尖检测器准确率下降高达60%。研究者分析了语言特征分布变化,发现经过训练的模型能有效…详细
武汉大学研究团队开发了PCogAlign框架,使视觉语言模型能够理解人类的个性化情境认知。研究采用社会学中"角色集合"概念描述人类多样性,构建了PCogAlignBench基准测试集,包含18,000个样本和20个不同角色集的个体。该…详细
这项由ETH苏黎世、ELLIS图宾根研究所和MPI图宾根的研究者合作完成的论文,揭示了评估大型语言模型预测能力时的关键陷阱。研究发现两类主要问题:数据时间泄露导致评估结果不可信,以及基准测试表现难以外推到实际预测…详细
CityLens是清华大学和北京交通大学联合开发的基准测试系统,旨在评估大型语言-视觉模型通过城市图像预测社会经济指标的能力。研究团队构建了一个覆盖17个全球城市的多模态数据集,包含经济、教育、犯罪、交通、健康和…详细
Snapchat 推出全新 watchOS 应用,支持 Apple Watch 用户预览及通过键盘、手写、语音或表情快速回复消息,打造便捷的多平台通讯体验。…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。