这项由新加坡南洋理工大学主导的研究全面梳理了大型语言模型通过奖励信号学习的最新进展。研究揭示了一种革命性的AI训练范式:让AI像学生接受老师指导一样,通过奖励反馈主动学习和改进。这种方法已在ChatGPT等系统中…详细
延世大学研究团队首次让AI具备专业设计师级别的网页说服力评判能力,开发出G-FOCUS智能评估系统和WISERUI-BENCH标准数据库。该技术通过目标导向的四步推理过程,能够像人类专家一样分析网页设计的用户说服效果,准确…详细
香港大学团队提出UniVLA框架,通过"任务中心潜在动作"技术让不同机器人共享技能,无需大量标注数据即可从网络视频学习。在多项基准测试中显著超越现有方法,仅用1/20计算资源就达到更好性能。该研究为机器人跨平台技…详细
Capital One推出了生产级多智能体AI系统来增强购车体验。该系统包含四个协作的AI智能体:一个与客户沟通,一个基于业务规则创建行动计划,一个评估前两者的准确性,一个向用户解释和验证计划。系统设计时考虑了金融机…详细
Graid公司专注于英伟达GPU驱动的RAID卡技术,推出包括企业级和工作站版本在内的SupremeRAID产品线。该公司2024年营收翻倍,出货约5000张卡片,预计2025年增长60%。产品路线图涵盖桌面简化版、AI版本、HPC版本等五个组…详细
数据行业正面临重大变革,市场整合趋势明显。近期Databricks以10亿美元收购Neon、Salesforce以80亿美元收购Informatica等交易显示,更多并购即将到来。被收购公司虽规模不同,但都有共同点:买方希望通过收购技术促进…详细
亚马逊机器人部门宣布已部署超过一百万台仓储机器人,并推出DeepFleet人工智能系统。该系统如交通控制器般协调机器人运行,提高移动效率并避免拥堵。从2012年开始测试至今,这些机器人已成为亚马逊履行中心的主力,遍…详细
企业在采用生成式人工智能时,需在开源模型与专有模型间做出选择。真正的开源AI包括模型架构、训练数据和权重,但完全开源的模型很少。多数企业会混合使用两种模型。对于银行等受监管行业,开源模型是唯一选择,因为…详细
影子AI指员工在企业IT政策和数据治理控制之外私自使用未经授权的人工智能服务。研究显示,2024年企业生成式AI流量激增890%,与生成式AI相关的数据泄露事件增长一倍以上。开发人员为提高效率和缩短产品上市时间,常绕…详细
欧洲核子研究中心(CERN)作为大型强子对撞机的所在地,已成为开放量子研究所三年试点阶段的基地。该中心高级顾问夏尔玛介绍,计算是CERN的三大支柱之一。中心需要将每秒4000万次碰撞的数据快速筛选至1000次,再缩减…详细
英伟达通过Dynamo引擎实现分层KV缓存,将大语言模型的键值对存储从GPU高带宽内存扩展至CPU内存、直连SSD和网络存储。该技术解决了GPU内存不足时向量数据被驱逐需重新计算的问题,通过多层存储架构提升推理效率。Dyna…详细
本文探讨了一种防范通用人工智能(AGI)和人工超级智能(ASI)存在性风险的方法:将它们置于计算机仿真世界中进行测试。虽然这种方法看似合理,但存在诸多挑战。AGI可能会隐藏恶意行为,或因被欺骗而转向恶意。此外,…详细
尽管AI在围棋等复杂游戏中表现出色,但在简单的井字棋游戏中却屡屡失败。研究显示,AI代理在模拟商业环境中的表现同样令人失望,经常出现幻觉、欺骗和任务未完成等问题。游戏测试为评估AI能力提供了直观方式,帮助普…详细
这项研究关注语音中的句子强调(即说话时对特定词的重音),它能传达说话者的潜在意图。耶路撒冷希伯来大学的研究团队发现,尽管现代语音语言模型进步显著,它们在理解句子强调方面表现不佳。团队创建了StressTest基…详细
ViStoryBench是一个全面的故事可视化评估基准,由StepFun团队打造,用于测试AI将文字故事转化为连贯图像序列的能力。它包含80个多样化故事和344个角色参考,评估包括角色一致性、提示遵循度等多个维度。研究测试了20…详细
卡内基梅隆大学与本田研究所日本分部的研究团队通过数据扩充和清洗技术,打造了新一代开源语音模型OWSM v4。研究者们开发了一套三步数据清洗流程,从原始YODAS数据集中提取出166,000小时高质量语音数据,涵盖75种语言…详细
该研究揭示了语言模型蒸馏过程中的严重安全隐患:教师模型中微小的偏见会在传递到学生模型时被显著放大。Google DeepMind和东北大学的研究团队发现,仅需在教师模型训练数据中注入0.25%的偏见样本,就能使学生模型在…详细
Meta和罗切斯特大学研究团队开发的BinauralFlow是一种突破性双耳语音合成框架,通过流匹配模型实现高质量空间音频生成。该技术将双耳渲染视为生成任务而非传统回归问题,并创新性地设计了因果U-Net架构与连续推理管道…详细
这项哥伦比亚大学研究团队开发的Neuro2Semantic框架,能够从人类颅内脑电图信号中重建语义内容,开创了脑机接口技术的新可能。该框架通过两阶段过程工作:先用LSTM适配器将神经信号与文本嵌入对齐,再用预训练模型将…详细
这篇研究论文提出了一种名为TLDR(思考长度数据再权重)的创新方法,用于解决大型语言模型在推理过程中过度思考的问题。研究团队通过动态平衡系统1(简洁直觉)和系统2(深度推理)数据的权重,实现了在保持推理准确…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。