科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-06-05 09:34:35
当上下文成为金子:上下文文档嵌入模型的评估与训练

这项研究针对现代文档检索系统中的关键缺陷:独立处理文档片段导致丢失上下文信息。研究团队开发了ConTEB基准测试来评估模型利用文档级上下文的能力,并提出了InSeNT方法,结合后期分块和创新的对比学习策略。实验表…详细

文档检索上下文嵌入检索增强生成

2025-06-05 09:34:16
多语言LLM安全研究的现状与挑战:从语言鸿沟的测量到解决之道

这项由布朗大学和Cohere实验室研究者联合进行的研究全面分析了大型语言模型(LLM)安全研究中的语言不平等现象。通过系统回顾近300篇2020-2024年间的安全相关论文,研究发现LLM安全研究严重偏向英语,即使中文这样的高…详细

人工智能安全多语言模型语言鸿沟研究

2025-06-05 09:34:00
ChARM:角色扮演型AI助手的突破性进步——让AI角色更加真实可信

这项研究提出了ChARM,一种创新的角色扮演AI奖励建模框架,通过行为自适应边界和自我进化策略大幅提升AI角色的真实性和一致性。研究团队创建了包含1,108个角色的RoleplayPref数据集,实验表明ChARM比传统模型提高了1…详细

角色扮演AI奖励模型自然语言处理

2025-06-05 09:33:41
重新思考循环神经网络中的双线性状态转换:隐藏单元不仅是记忆,更是计算的主角

这篇研究重新审视了循环神经网络中的双线性状态转换机制,挑战了传统观点。高通AI研究团队证明,隐藏单元不仅是被动记忆存储,更是网络计算的积极参与者。研究建立了一个从实数对角线到完全双线性的模型层级,对应不…详细

循环神经网络双线性模型状态跟踪

2025-06-05 09:33:22
深思不见?探究多模态推理模型中放大的幻觉问题——加州大学圣克鲁兹和斯坦福大学的最新发现

这项研究探讨了多模态大语言模型在增强推理能力时出现的视觉幻觉问题。研究发现,模型生成更长推理链时,对视觉信息的关注减少,导致幻觉增加。研究者提出RH-AUC指标和RH-Bench基准来评估模型在推理与幻觉间的平衡,…详细

多模态大语言模型视觉幻觉人工智能评估

2025-06-05 09:33:03
形式化不确定性的语法:何时在自动推理任务中信任大语言模型

这篇研究探讨了大语言模型在自动推理任务中的不确定性问题。研究者提出,模型生成形式规范时的概率不确定性不是缺陷,而是宝贵的信号源。通过引入概率上下文无关文法框架分析SMT-LIB程序分布,他们发现不确定性信号具…详细

人工智能形式验证不确定性量化

2025-06-05 09:32:47
GATE:沙特研究团队打造高性能阿拉伯语文本嵌入模型,比OpenAI还强25%

来自沙特阿拉伯王子苏丹大学和阿尔法萨尔大学的研究团队开发了GATE(General Arabic Text Embedding)模型,这是一套专为阿拉伯语设计的文本嵌入系统。该研究结合了套娃表示学习和混合损失训练方法,解决了阿拉伯语特…详细

阿拉伯语处理文本嵌入语义相似度

2025-06-05 09:32:31
微调小模型还是提示大模型?ServiceNow揭秘低代码工作流程生成的最佳选择

这篇来自ServiceNow的研究探讨了在生成低代码工作流时,微调小型语言模型(SLM)与提示大型语言模型(LLM)的效果对比。研究团队发现,尽管GPT-4o等大模型通过精心设计的提示可以产生合理结果,但在这类需要结构化输出的…详细

人工智能语言模型工作流自动化

2025-06-05 09:31:27
多模态大语言模型的偏好如何影响决策?哈工大与鹏城实验室揭示与控制模型"偏听偏信"的机制

哈尔滨工业大学和鹏城实验室的研究团队开发了一种评估多模态大语言模型模态偏好的新方法,并证实这些模型在处理图像和文本信息冲突时确实存在偏好现象。研究者通过构建MC?基准测试,发现模型偏好受多种因素影响,并能…详细

人工智能多模态大语言模型表示工程

2025-06-05 09:23:25
万兆光网 协同智算,2025中国光网络研讨会盛大召开

6月4日,为期两天的2025年中国光网络研讨会(OptiNet China)在北京盛大召开。…详细

2025-06-05 09:19:05
AI浪潮下的光网络“基石”之变

——2025中国光网络研讨大会释放出七个信号…详细

光网络AI

2025-06-04 17:53:50
分叉-合并解码:提升音视频大语言模型的多模态理解能力

韩国科学技术院研究团队提出"分叉-合并解码"方法,无需额外训练即可改善音视频大语言模型的多模态理解能力。通过先独立处理音频和视频(分叉阶段),再融合结果(合并阶段),该方法有效缓解了模型过度依赖单一模态的…详细

多模态AI解码技术音视频理解

2025-06-04 17:26:18
让马斯克惊呼的AI卧底实验,4个月成功“洗脑”上百位人类精英

苏黎世大学的实验显示,AI的说服成功率达到9-18%,而人类平均只有2.7%,AI比人类强6倍。在4个月内,13个AI账号成功说服了上百位Reddit用户改变观点,且没有人识破它们的身份…详细

AI风险AI伦理

2025-06-04 17:14:24
人工智能驱动边缘防御:Check Point推出全新分支机构安全网关,威胁预防性能提升4倍

专为SD-WAN优化,全新Quantum Force分支机构防火墙可有效抵御针对分支机构日益增多的网络攻击,并提供卓越的终端用户体验。…详细

2025-06-04 17:13:27
利用大语言模型探索科学创新前沿:南洋理工大学团队开发检测学术新颖性的突破性方法

这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显…详细

人工智能科学新颖性检测知识蒸馏

2025-06-04 17:13:10
un?CLIP:通过反转unCLIP来提升CLIP模型的视觉细节捕捉能力

un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节…详细

人工智能计算机视觉CLIP模型改进

2025-06-04 17:12:44
DexUMI:斯坦福大学和哥伦比亚大学联合开发的以人手为灵巧操作通用接口的突破性研究

这项由斯坦福大学和哥伦比亚大学领导的研究提出了DexUMI框架,使用可穿戴外骨骼将人类手部动作直接转换为机器人手操作。通过结合硬件适配(专用外骨骼设计)和软件适配(视觉内容处理),研究成功克服了人手与机器人…详细

机器人技术灵巧操作外骨骼设计

2025-06-04 16:41:37
金融新纪元:AI正在重塑金融服务业的未来

某天,你,一位年轻的投资者走进银行,没有排队,没有等候,只是对着自助终端说出投资需求,一位数字虚...…详细

2025-06-04 16:08:13
角色扮演能力大考验:里尔大学研究团队开发的大语言模型角色扮演评估新标准

这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研…详细

人工智能自然语言处理角色扮演评估

2025-06-04 16:07:53
LegalSearchLM:北大团队打造突破性法律案例检索新方法,将案例检索重新定义为法律要素生成

这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验…详细

人工智能法律案例检索生成式检索

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章