科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-10-09 10:21:31
土耳其AI如何识破聊天机器人的"胡说八道"?伊斯坦布尔Newmind AI团队首创检测系统

土耳其伊斯坦布尔Newmind AI团队开发出首个专门针对土耳其语的AI幻觉检测系统Turk-LettuceDetect,能够逐字识别AI生成内容中的虚假信息。该系统使用三种不同的AI模型,在包含17790个样本的数据集上训练,最佳模型达到…详细

人工智能自然语言处理幻觉检测

2025-10-09 10:14:03
法国团队打造"推理核心":让AI像数学家一样思考的训练场

法国研究团队开发了"推理核心"训练环境,专门培养AI的基础推理能力。该系统包含18个核心任务,涵盖逻辑推理、规划、因果分析等领域,能无限生成新题目并精确控制难度。与传统依赖固定题库的方法不同,推理核心专注于…详细

强化学习符号推理训练环境

2025-10-09 10:08:25
阿里巴巴Qwen团队打造史上最强多模态AI:一个模型搞定文字、语音、图像和视频,实时对话延迟仅234毫秒

阿里巴巴Qwen团队发布的Qwen3-Omni实现了AI领域的重大突破,首次让单一模型在文字、语音、图像、视频处理上都达到专业水平,无任何性能损失。该系统支持119种文字语言,实时对话延迟仅234毫秒,在36项测试中32项达到…详细

人工智能多模态融合实时语音交互

2025-10-09 10:03:07
字节跳动发布ByteWrist:让机器人手腕像人手一样灵活的革命性设计

字节跳动研究团队开发出革命性的ByteWrist并联机器人手腕,采用三层嵌套驱动机制和弧形连接杆设计,体积比传统手腕减少40%,承载能力提高60%。在狭窄空间操作测试中,搭载ByteWrist的机器人比传统Kinova机器人快一倍…详细

机器人技术并联机构新型设计

2025-10-09 09:55:45
Littelfuse推出IX3407B隔离栅极驱动器简化大功率设计

新型单通道驱动器采用2.5 kV电容隔离技术,可提升功率密度、加快开关速度、增强电机驱动器、逆变器及工业电源的可靠性。…详细

2025-10-09 09:54:38
Scale AI团队推出SWE-Bench Pro:AI编程助手能否胜任真正的企业级软件开发挑战?

Scale AI团队推出SWE-Bench Pro测试平台,专门评估AI编程助手在真实企业级软件开发中的表现。研究发现,即使是最先进的GPT-5和Claude模型,成功率也仅有23%左右,远低于在传统测试中70%的表现。该测试平台包含1865个…详细

人工智能软件工程AI编程助手

2025-10-09 09:46:22
图像编辑智能评分员:微软团队开发AI助手彻底改变图像修改质量评估

微软团队开发的EdiVal-Agent是首个针对AI图像编辑的自动化评估系统,能像专业评委一样从指令遵循、内容一致性和视觉质量三维度评分。该系统与人类评审一致性达81.3%,测试发现Nano Banana表现最均衡,GPT-Image-1指令…详细

人工智能图像编辑评估系统

2025-10-09 09:45:41
首次建立的"材料显微镜图像理解力测试"让AI暴露了重大盲区——中大深圳团队发现现有模型在专业领域表现堪忧

中大深圳团队创建MatCha测试平台,评估15个先进AI模型在材料显微图像理解方面的能力。结果显示,即使是最优秀的GPT-4模型准确率也仅59%,远低于人类专家的89%。研究揭示AI在专业领域存在知识缺乏和视觉感知不足的重大…详细

材料科学多模态大语言模型基准测试

2025-10-09 09:45:23
Meta推出RecoWorld:让推荐系统在虚拟世界里"练手",就像飞行员在模拟器中学习一样

Meta研究团队推出RecoWorld,这是首个专为智能推荐系统打造的虚拟训练环境。该系统通过虚拟用户与推荐系统的多轮对话互动,让算法在安全环境中学习理解和响应用户指令。RecoWorld支持文本、多模态和语义编码三种内容…详细

人工智能智能推荐系统虚拟训练环境

2025-10-09 09:44:54
大语言模型评测中的"空格陷阱":一个看似无关紧要的符号竟能让AI模型排名彻底颠倒

德国美因茨约翰内斯·古腾堡大学研究团队发现,在AI大语言模型的多选题评测中,"Answer:"后空格的处理方式竟能导致11%的准确率差异和模型排名颠倒。通过对15个主流模型的详尽测试,研究证实采用"空格+字母"的答案格式…详细

人工智能自然语言处理评测标准化

2025-10-09 09:44:18
开发者与AI助手的真实对话:当代码生成遇上现实编程场景

这项研究分析了82,845个真实开发者与AI助手的编程对话,发现AI回复比开发者提问长14倍,68%为多轮对话。Web开发和机器学习是最热门话题。AI代码质量存在问题:Python代码83.4%命名不规范,JavaScript代码75.3%有未定…详细

人工智能代码生成软件工程

2025-10-09 08:08:49
OpenAI发布Sora 2模型并推出视频社交应用挑战TikTok

OpenAI发布了音视频生成模型Sora 2,同时推出配套社交应用Sora,用户可生成包含自己的视频并在类似TikTok的信息流中分享。Sora 2在物理定律遵循方面有显著改进,视频更加真实。应用提供"客串"功能,允许用户将自己植…详细

人工智能视频生成物理建模优化

2025-10-09 08:08:00
大语言模型已遭遇瓶颈,是时候重新定义智能了吗?

大语言模型和生成式AI自诞生以来问题频发,从推理模型表现不佳到AI幻觉现象,再到版权诉讼,这些都表明当前技术路径可能并非通往真正智能的正确道路。专家认为,仅靠增加数据和算力的扩展模式已显现边际效应递减,无…详细

人工智能神经符号AI技术瓶颈

2025-10-09 08:07:12
微软推出智能体模式,让办公软件变身"氛围工作"助手

微软发布Microsoft 365新功能,知识工作者可通过文本提示生成复杂的Word文档或Excel电子表格。该功能包含两个产品:基于GPT-5的代理模式和基于Anthropic模型的Office代理。代理模式能进行多步骤工作规划和验证循环,…详细

人工智能办公自动化智能文档生成

2025-10-09 08:06:25
DeepSeek发布稀疏注意力技术降低AI推理成本

DeepSeek发布实验版本DeepSeek-V3.2-Exp,引入"稀疏注意力"技术来解决长对话处理中的计算瓶颈。该技术通过选择性处理词汇关系而非全量计算,将API成本降低50%。稀疏注意力并非新概念,OpenAI早在2019年就使用过类似技…详细

人工智能稀疏注意力成本优化

2025-10-09 08:05:29
Infinidat将全闪存阵列Infinibox SSA G4 F24容量提升一倍

Infinidat发布新款Infinibox SSA G4 F24全闪存阵列,存储容量从17PB提升至33PB,同时机架空间从14U缩减至11U。该产品采用8个78盘位的24TB驱动器替代原有的60盘位20TB配置。年内还将推出QLC驱动器选项,预计容量密度再…详细

存储系统全闪存技术容量优化

2025-10-09 08:04:19
CIO如何平衡新兴技术与技术债务管理

技术创新尤其是AI发展速度超越以往,CIO面临数字化转型压力,学会避免盲目追逐最新技术模型。同时他们正应对前所未有的技术堆栈复杂性挑战,持续产生大量技术债务。德勤数据显示70%技术领导者认为技术债务是最大生产…详细

数字化转型技术债务管理业务价值导向

2025-10-09 08:01:16
ServiceNow押注AI优先界面将定义企业AI未来

ServiceNow发布AI Experience多模态用户界面,主张界面而非模型将决定企业AI竞争胜负。该平台将AI代理、数据结构和工作流程整合到单一环境中,支持语音、图像和文本交互。公司已实现超3.5亿美元节省,AI代理可自动化…详细

人工智能多模态界面企业级平台

2025-10-09 08:00:30
AI时代数据中心液冷技术变革与热管理策略演进

AI技术发展推动数据中心基础设施重构,新一代AI加速器使机架密度超过100千瓦,部分高达600千瓦,传统冷却系统面临极限。液体冷却市场年复合增长率达20%,成为增长最快的数据中心冷却细分领域。这不仅是冷却升级,更是…详细

人工智能液冷技术热管理优化

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章