商业办公-第15页-频道-至顶网

2025-08-14 12:48:15

浙江大学团队揭秘AI写作新现象：中间过程竟比最终答案更准确

浙江大学研究团队发现AI写作中的"时间振荡"现象：AI在生成过程的中间步骤往往给出正确答案，但最终输出时却被错误答案覆盖。团队提出"时间自一致性投票"和"时间一致性强化"两种解决方案，通过利用中间过程信息显著提…详细

人工智能扩散语言模型时间一致性强化

2025-08-14 12:47:57

大语言模型能否通关经典文字冒险游戏？斯坦福安全AI中心发现了惊人答案

斯坦福安全AI中心研究团队通过让大语言模型玩25款经典文字冒险游戏，测试其长期推理能力。结果显示即使最先进的GPT-5也仅能完成37.8%进度，揭示了当前AI在复杂探索任务中的重大局限性。研究发现AI存在长文本理解衰减…详细

人工智能长期推理基准测试

2025-08-14 12:47:33

香港大学团队首创针对AI事实核查系统的"真相反转"攻击法

香港大学团队首次发现AI事实核查系统的重大安全漏洞，开发出名为Fact2Fiction的攻击方法，能够系统性欺骗最先进的事实核查系统。研究显示即使投入极少量精心制作的虚假证据，就能让AI系统40-60%的时间得出错误结论，…详细

人工智能网络安全算法攻击

2025-08-14 12:47:16

香港中文大学团队发现AI思考链的惊人秘密：80%的推理步骤竟然是多余的！

香港中文大学团队发现AI推理过程中存在高达80%的冗余步骤。通过创新的"步骤熵"方法，他们能够识别并删除这些多余的推理步骤，在保持准确性的同时实现35-57%的效率提升。研究开发了两阶段训练策略，让AI学会自动生成压…详细

人工智能思考链压缩效率优化算法

2025-08-14 12:46:58

香港中文大学团队发明AI新架构：Grove MoE让大语言模型像人脑一样智能调度资源

香港中文大学等机构联合发布Grove MoE架构，创新性地将专家系统分组并配备共享辅助专家，实现动态资源调配。该33B参数模型仅需激活31.4-32.8B参数，在数学推理、编程等任务上显著超越同规模竞品，在MMLU-Pro测试中达…详细

人工智能混合专家架构动态资源调配

2025-08-14 12:46:43

AI语言模型新革命：像人一样思考句子却说出单词——AIRI研究院提出SONAR-LLM

AIRI研究院提出SONAR-LLM，这是一种革命性的AI语言模型，它像人类一样先用抽象概念思考完整句子，再转换成具体词语输出。相比传统逐词生成的方法，SONAR-LLM在处理长文本时效率显著提升，当文档超过4096词时计算优势…详细

自然语言处理句子级建模计算效率优化

2025-08-14 12:46:29

阿里巴巴团队发布突破性研究：揭开大语言模型强化学习的"黑盒子"，两种技术组合竟能超越复杂算法

阿里巴巴联合多所知名院校的研究团队，通过系统性实验揭开了大语言模型强化学习技术选择的迷雾。他们发现仅用两种核心技术组合的Lite PPO方法，就能超越使用多种复杂技术的主流算法，证明了在AI训练中"极简主义"的有…详细

人工智能强化学习算法优化

2025-08-14 12:45:34

电大数据竟然阻碍了机器人学习？中科大团队揭秘数据集的"暗黑面"

中科大研究团队发现大型机器人数据集存在"捷径学习"问题：机器人虽然数据量庞大，但因数据内部多样性不足和碎片化严重，容易依赖表面特征而非真正理解任务。研究通过理论分析和实验验证了这一现象，并提出视角增强和…详细

机器人学习数据增强捷径学习

2025-08-14 12:45:12

蚂蚁集团携手西湖大学等机构：如何让万亿参数AI大模型瘦身30%却依然强大如初？

蚂蚁集团联合西湖大学推出MoBE技术，通过创建共享基础知识库的方式，成功将万亿参数AI模型压缩30%，性能损失仅为2%。该技术突破了传统压缩方法7%-14%性能损失的瓶颈，有望大幅降低AI部署成本，推动强大AI能力的普及应…详细

混合专家模型模型压缩参数优化

2025-08-14 12:44:58

GLiClass：轻量级文本分类的全能新秀，从乌克兰基辅走向世界的AI突破

GLiClass是由乌克兰基辅Knowledgator工程公司开发的创新文本分类模型，基于GLiNER架构改进而成。该模型通过联合编码文本和标签，在单次前向传递中完成多标签分类，实现了准确性与效率的完美平衡。测试显示，GLiClass…详细

文本分类 GLiNER架构零样本学习

2025-08-14 12:44:32

UNC研究团队推出Bifrost-1：用"补丁级CLIP"让AI既能看又能画，训练成本骤降90%！

北卡大学研究团队推出Bifrost-1系统，通过创新的"补丁级CLIP潜在变量"技术，成功让多模态大语言模型和扩散模型高效协作，实现了既能理解又能创作图像的AI助手。该方法避免了传统技术的高成本训练问题，在保持原有理解…详细

多模态人工智能图像生成 CLIP潜在变量

2025-08-14 12:13:17

人工智能学会说数学：AIRI研究院首次让机器听懂方程式并转换为LaTeX格式

俄罗斯AIRI研究院联合斯科尔科沃理工学院首次系统性解决了语音数学表达式转换问题，开发出能将口述数学公式准确转换为LaTeX格式的AI系统。研究团队构建了包含66,000个人工标注样本的大规模多语种数据集，采用语音识别…详细

语音识别数学表达式处理多模态学习

2025-08-14 12:13:03

AI测试比人类更难的搜索任务：ByteDance研究揭示搜索代理的致命弱点

ByteDance研究团队通过WideSearch基准测试发现，当前最先进的AI搜索代理在大规模信息收集任务上表现极差，成功率普遍低于5%。研究揭示了AI在任务规划、反思调整、证据验证和知识幻觉等方面的根本缺陷，为未来发展多代…详细

人工智能搜索代理基准测试

2025-08-14 12:12:50

人工智能界的"评委"进阶记：中国人民大学等机构如何让AI重新学会"看懂"文本的含金量

这项由中国人民大学、百度和卡内基梅隆大学合作的研究开发出ReasonRank系统，通过创新的数据合成和两阶段训练方法，让AI具备了真正的推理能力进行文本排序。该系统在复杂推理任务中比现有最强系统高出3-5个百分点，同…详细

信息检索推理增强 ReasonRank

2025-08-14 12:12:34

快手科技团队推出Klear-Reasoner：让AI像人类一样深度思考的革命性突破

快手科技团队开发的Klear-Reasoner在AI推理领域取得重大突破，在数学竞赛AIME2024中获得90.5%高分。该研究完全公开训练细节，提出创新的GPPO方法解决传统强化学习局限，证明精选高质量数据比大量普通数据更有效，为A…详细

人工智能强化学习推理模型

2025-08-14 12:12:18

当AI聊天助手遇上挑剔用户：Salesforce如何让机器真正理解你的心思

Salesforce AI Research联合伊利诺伊大学开发的UserBench研究揭示了当前AI助手的重大缺陷：尽管技术上表现出色，但在理解用户真实需求方面表现糟糕。最先进的AI模型完全满足用户需求的成功率仅20%，发现隐性偏好的能…详细

人工智能用户交互机器学习算法

2025-08-14 12:12:05

AI搜索智能体遭遇新挑战：滑铁卢大学团队提出更公平透明的评测新标准

滑铁卢大学团队发布BrowseComp-Plus基准测试，解决AI搜索智能体评测中的公平性、透明度和可及性问题。通过构建包含830个问题和10万文档的固定数据集，研究发现检索系统质量是影响AI搜索表现的关键因素，开源与闭源模…详细

人工智能深度搜索评测基准

2025-08-14 12:01:11

AI的隐藏瓶颈：网络如何影响企业LLM战略

长期以来，对AI网络进行基准测试和优化都需要在昂贵、耗电的GPU上运行实时工作负载。但GPU的可用性有限，而且大规模测试环境的配置需要时间和资金。因此，网络验证往往要推迟到实际工作负载运行时才能进行——这对于…详细

是德科技

2025-08-14 11:43:56

企业宇宙光明集团第二季度实现稳健的财务表现

…详细

美通社

2025-08-14 10:57:21

Continua获800万美元融资，让智能体在群聊中大显神威

前谷歌资深工程师David Petrou创立的AI初创公司Continua宣布完成800万美元种子轮融资，由GV领投。该公司开发AI智能体技术，可加入SMS、iMessage和Discord等群聊平台，为用户协作提供智能支持。Continua能够在群聊中自…详细

人工智能自然语言处理群聊优化

华为云数字化转型秘籍调研

业界热点: