上海交大团队提出AdaMoE架构,通过分离专家选择与权重分配机制,解决了传统机器人AI系统中"专家垄断"问题。该方法让不同专家协同工作而非单一系统包揽,在真实世界机器人操作任务中实现21.5%的成功率提升,为构建更高…详细
首尔大学研究团队开发的LiteStage技术专门解决小型语言模型多阶段推理速度慢的问题。该技术通过智能分配不同推理阶段的计算资源和实时终止无用输出,在三个基准测试中实现了1.16-1.70倍的加速效果,同时将准确率损失…详细
Qwen3Guard是由阿里巴巴达摩院开发的AI安全检测系统,支持119种语言,创新性引入三级安全分类(安全、争议性、不安全)替代传统二元判断。系统包含生成式和流式两个版本,后者能实时监控AI内容生成过程。在多项测试中…详细
Mixedbread AI团队发布了mxbai-edge-colbert-v0信息检索模型,仅有17MB和32MB两个版本却能超越参数量大十倍的传统模型。通过现代架构、三阶段训练和知识蒸馏技术,实现了性能与效率的完美平衡。模型支持长文本处理,…详细
中国人民大学团队提出MoM框架,通过模拟人类专家阅读过程,将传统的机械文档切割转变为主动记忆构建。该框架构建三层记忆架构,采用多路径采样和智能评估确保质量,通过逆向工程让小模型学会专家思维,并提供理论证明…详细
新的一年里,我们将迈入人机协作的新纪元——AI将成为人类的得力助手,而非喧宾夺主的主角。这种协作模式将为解决真正重要的问题创造巨大机遇。而这一切的起点,恰恰是解决超连接时代的副作用——孤独与陪伴缺失——…详细
德国多所知名研究机构联合构建了迄今最大规模的开源德语文本数据集"德国公共资源",包含1540亿词汇标记和3570万份文档。该数据集完全合规使用明确许可证,涵盖政治、法律、新闻、文化、科学等七大领域,经过严格质量…详细
在全球数字化浪潮的推动下,AI 已进入规模化和落地的关键阶段。据数据显示,中国每月电商交易额超过 1.25万亿元, 视频播放次数突破 10万亿次,而全球 AI 大模型每月生成的 Token 数量已超一千万亿。…详细
蚂蚁集团11月18日推出的全模态通用AI助手"灵光"在国内迅速出圈后,引发海外科技媒体和社交平台的关注。美国知名科技媒体《科技时代》(Tech Times)报道称,灵光让处理难题“如同清风拂面般轻松"。…详细
随着大语言模型在文本分析、智能问答等场景的广泛应用,处理1M超长文本推理时,常常面临显存不足、运算速度卡顿的行业痛点,严重限制了超长文本场景的应用。…详细
新加坡人工智能机构与阿里云发布全新大语言模型Qwen-Sea-Lion-v4,专门针对东南亚语言和文化特色进行优化。该模型结合阿里云Qwen3-32B基础模型和大量东南亚地区数据集,在东南亚语言模型评估榜单中位居开源模型首位。…详细
AI智能体是下一代业务自动化工具,不仅能对话交流,还能执行复杂任务。与ChatGPT聊天机器人不同,它们可在最少人工干预下规划并完成工作。文章介绍了五个高影响力应用:自动化客户服务解决方案、销售CRM管理、合规自…详细
这项由CMU与亚马逊AGI联合完成的研究揭示了当前AI系统的重大缺陷:即使最先进的模型也不知道何时该说"我不知道"。研究团队开发的RefusalBench评估系统通过176种语言操作技巧动态生成测试案例,发现顶级AI在多文档任务…详细
嵌套学习:谷歌又一个Transformer级别的研究?AI学习就像做梦一样层层嵌套…详细
蚂蚁数科团队已孵化出IMO奥赛题形式化转写数据集,正与国内某头部模型厂商合作,在通用大模型及数学模型测试中持续优化方案。…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。