科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-10-24 14:06:04
北卡罗来纳大学团队破解大语言模型信心预测难题:让AI学会准确评估自己的回答可靠性

北卡罗来纳大学研究团队通过大量实验发现,大语言模型缺乏准确的自我认知能力,无法可靠评估自身回答的正确性。他们提出通用正确性模型,通过学习多个AI模型的历史表现来预测回答可靠性,准确率比传统自我评估方法提…详细

人工智能机器学习模型校准

2025-10-24 14:05:41
北大腾讯联手破解语音AI"变脸"难题:一项让语音助手在嘈杂环境中保持"人格稳定"的突破性研究

北京大学和腾讯联合研究团队开发出StableToken技术,解决了语音AI在噪音环境下不稳定的关键问题。该技术采用多路径投票机制和共识训练策略,将标记稳定性错误率从26.17%降至10.17%,相对改善超过60%。这项突破使语音…详细

语音技术深度学习鲁棒性优化

2025-10-24 14:05:25
华为诺亚方舟实验室重新定义AI训练:约束强化学习让小模型更聪明地模仿大模型

华为诺亚方舟实验室提出了一种基于约束强化学习的大语言模型知识蒸馏新方法,首次将蒸馏过程重新定义为约束优化问题。该方法在保证学生模型与教师模型差异不超过预设阈值的前提下最大化任务奖励,避免了传统方法的参…详细

知识蒸馏约束强化学习优化算法

2025-10-24 14:05:07
Meta重磅:让AI从真实对话中学习,RLHI技术如何颠覆传统人工智能训练方式

Meta AI研究院联合约翰斯·霍普金斯大学开发的RLHI技术,让AI能从真实用户对话中学习成长,而非依赖专家标注数据。该技术通过用户引导重写和个性化奖励系统,实现因材施教式的AI训练。实验显示个性化能力提升24.3%,…详细

人工智能强化学习个性化交互

2025-10-24 14:04:55
威斯康星大学麦迪逊分校首创数据清洗评估基准:让AI更听话的关键在于精挑细选训练数据

威斯康星大学麦迪逊分校研究团队创建了首个AI训练数据清洗方法评估基准PrefCleanBench,系统比较了13种数据清洗技术。研究发现删除低质量数据比修正错误标签更有效,多模型投票方法表现最佳,最优数据删除比例为20-3…详细

人工智能数据清洗AI安全性

2025-10-24 13:44:37
比亚迪出海:从"建"到"简"的车联网修行

比亚迪不仅是中国汽车出海的一面旗帜,也是中国智能制造比肩全球的担当代表。…详细

2025-10-24 12:56:22
从“成本中心”到“质量飞轮”,IT部门如何重塑软件交付的价值公式

当前的数字化转型浪潮中,IT预算的投向已成为企业领导层最核心的战略考量。对于CIO和CTO而言,最大的挑战并非采纳新技术,而是如何让技术投入不再仅仅是开支,而是能立即产生可量化的业务价值。…详细

2025-10-24 11:39:22
华为发布站点光储错峰一体化解决方案 单站年电费节省8000元

10月23日,在第九届站点能源JDC论坛暨绿色网络峰会上,华为站点能源正式发布通信站点“光储错峰一体化”解决方案(以下简称“华为方案”),旨在通过智能调度光能、储能和电网电力,全面优化站点能源结构,打开ICT行…详细

2025-10-24 11:02:02
英特尔公布2025年三季度财报:营收137亿美元,同比增长3%

第三季度,英特尔公司从运营中产生了25亿美元的现金。…详细

英特尔

2025-10-24 10:02:53
威斯康星大学最新研究:AI在"背书"时容易撒谎,LUMINA系统如何识破这些"花言巧语"

威斯康星大学研究团队开发了LUMINA系统,专门检测AI在回答问题时的"撒谎"行为。该系统发现AI有时会忽视提供的参考资料,固执地依赖内部知识生成不准确回答。LUMINA通过监测AI对外部文档和内部知识的依赖程度来识别这…详细

人工智能幻觉检测信息利用度

2025-10-24 10:02:23
当AI学会"思考":CentraleSupélec团队揭秘推理训练何时真正有效

这项由法国CentraleSupélec大学领导的研究通过严格控制的实验,系统比较了AI的推理训练与传统训练方式。研究发现推理训练在数学、开放式任务中效果显著,但需要70亿参数以上模型才能充分发挥优势,且成本增加明显。…详细

人工智能推理训练模型优化

2025-10-24 10:02:07
AI助手可以"量身定制"了?首个个性化深度研究系统评测基准在OPPO等机构诞生

这项由OPPO等机构完成的研究首次建立了评估AI研究助手个性化能力的标准基准。研究团队构建了250个真实用户场景,开发了PQR三维评价框架,测试发现开源系统个性化能力更强,用户信息越详细AI表现越好,为推动AI从标准…详细

人工智能深度研究个性化评测

2025-10-24 10:01:43
首个VLM个性化基准测试MMPB:让AI助手真正懂你——首尔大学团队揭秘视觉语言模型个性化难题

首尔大学团队首次构建了评估视觉语言模型个性化能力的综合基准MMPB,包含111个概念和超万个测试样本。研究发现即使先进AI模型在个性化任务上表现不佳,存在安全机制过度保守、视觉信息利用不足、长对话记忆丢失等问题…详细

多模态个性化视觉语言模型基准测试

2025-10-24 09:44:53
浙江大学团队打造数据分析神器:让AI像人类专家一样解读复杂数据

浙江大学和阿里巴巴集团联合开发的DATAMIND系统,通过创新的数据合成和训练方法,让AI具备了专业数据分析师的能力。该系统使用12,000个高质量训练样本,采用动态权重调整的混合训练策略,最终的DATAMIND-14B模型在多…详细

人工智能数据分析开源模型

2025-10-24 09:44:41
复旦大学团队突破语言模型瓶颈:让AI对话变得更快更聪明

复旦大学团队针对掩码扩散语言模型提出三项关键技术:EOS早期拒绝解决句号陷阱问题,渐进式步长调度器将解码步骤从L/2降至log?L,一致性轨迹强化学习确保训练与实际运行的一致性。研究发现规划任务更适合并行解码而数…详细

人工智能掩码扩散语言模型强化学习优化

2025-10-24 09:44:29
上海AI实验室团队打造"火眼金睛":让AI学会像人类专家一样验证科学答案的神奇本领

上海AI实验室研究团队开发出具备推理能力的科学答案验证模型SCI-Verifier,解决了AI无法准确验证科学答案等价形式的关键问题。该模型覆盖数学、物理、化学、生物五大领域,验证准确率达86.28%,与GPT-5相当。通过构建…详细

人工智能科学验证推理模型

2025-10-24 09:44:16
南洋理工大学团队首创!让小模型在无线通信数学推理上"以小博大"的训练秘籍

南洋理工大学研究团队通过创新的GRPO强化学习方法,成功让70亿参数的小模型在无线通信数学推理上接近GPT-4o性能。他们构建了包含4027道题目的专业数据集,证明了专门化训练能够让小模型"以小博大",同时意外发现这种…详细

无线通信强化学习专门化训练

2025-10-24 09:44:03
上海交通大学发布SQL翻译神器:PARROT帮你解决数据库之间的语言不通问题

这项研究首次系统性地评估了大语言模型在跨数据库系统SQL翻译任务中的能力。研究团队构建了包含598个高质量翻译对的PARROT基准,涵盖22个主流数据库系统。实验结果显示,即使是最先进的AI模型,在SQL翻译任务上的准确…详细

跨系统SQL翻译大语言模型数据库评测基准

2025-10-24 09:43:49
香港科技大学团队揭露AI写代码的惊人盲点:单个功能很厉害,组合起来就"翻车"

香港科技大学团队通过DAFNYCOMP基准测试发现,当前最先进的AI模型在编写单个功能时表现优秀(95.67%语法正确率),但在需要多个功能协调工作的复杂程序中却表现糟糕(仅3.69%验证成功率)。研究揭示了AI在组合推理方…详细

人工智能形式化验证组合推理

2025-10-24 09:43:35
西班牙法律文档秒变"人话":西班牙国立远程教育大学和挪威国家图书馆联手破解法律条文的"天书"难题

西班牙国立远程教育大学联合挪威国家图书馆创建BOE-XSUM数据集,包含3648个西班牙法律文档的极简摘要,旨在将复杂法律条文转换为普通人可理解的语言。研究显示专门训练的小型模型在此任务上超越大型通用模型,为西班…详细

法律文档摘要自然语言处理数据集构建

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章