科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-10-24 10:02:07
AI助手可以"量身定制"了?首个个性化深度研究系统评测基准在OPPO等机构诞生

这项由OPPO等机构完成的研究首次建立了评估AI研究助手个性化能力的标准基准。研究团队构建了250个真实用户场景,开发了PQR三维评价框架,测试发现开源系统个性化能力更强,用户信息越详细AI表现越好,为推动AI从标准…详细

人工智能深度研究个性化评测

2025-10-24 10:01:43
首个VLM个性化基准测试MMPB:让AI助手真正懂你——首尔大学团队揭秘视觉语言模型个性化难题

首尔大学团队首次构建了评估视觉语言模型个性化能力的综合基准MMPB,包含111个概念和超万个测试样本。研究发现即使先进AI模型在个性化任务上表现不佳,存在安全机制过度保守、视觉信息利用不足、长对话记忆丢失等问题…详细

多模态个性化视觉语言模型基准测试

2025-10-24 09:44:53
浙江大学团队打造数据分析神器:让AI像人类专家一样解读复杂数据

浙江大学和阿里巴巴集团联合开发的DATAMIND系统,通过创新的数据合成和训练方法,让AI具备了专业数据分析师的能力。该系统使用12,000个高质量训练样本,采用动态权重调整的混合训练策略,最终的DATAMIND-14B模型在多…详细

人工智能数据分析开源模型

2025-10-24 09:44:41
复旦大学团队突破语言模型瓶颈:让AI对话变得更快更聪明

复旦大学团队针对掩码扩散语言模型提出三项关键技术:EOS早期拒绝解决句号陷阱问题,渐进式步长调度器将解码步骤从L/2降至log?L,一致性轨迹强化学习确保训练与实际运行的一致性。研究发现规划任务更适合并行解码而数…详细

人工智能掩码扩散语言模型强化学习优化

2025-10-24 09:44:29
上海AI实验室团队打造"火眼金睛":让AI学会像人类专家一样验证科学答案的神奇本领

上海AI实验室研究团队开发出具备推理能力的科学答案验证模型SCI-Verifier,解决了AI无法准确验证科学答案等价形式的关键问题。该模型覆盖数学、物理、化学、生物五大领域,验证准确率达86.28%,与GPT-5相当。通过构建…详细

人工智能科学验证推理模型

2025-10-24 09:44:16
南洋理工大学团队首创!让小模型在无线通信数学推理上"以小博大"的训练秘籍

南洋理工大学研究团队通过创新的GRPO强化学习方法,成功让70亿参数的小模型在无线通信数学推理上接近GPT-4o性能。他们构建了包含4027道题目的专业数据集,证明了专门化训练能够让小模型"以小博大",同时意外发现这种…详细

无线通信强化学习专门化训练

2025-10-24 09:44:03
上海交通大学发布SQL翻译神器:PARROT帮你解决数据库之间的语言不通问题

这项研究首次系统性地评估了大语言模型在跨数据库系统SQL翻译任务中的能力。研究团队构建了包含598个高质量翻译对的PARROT基准,涵盖22个主流数据库系统。实验结果显示,即使是最先进的AI模型,在SQL翻译任务上的准确…详细

跨系统SQL翻译大语言模型数据库评测基准

2025-10-24 09:43:49
香港科技大学团队揭露AI写代码的惊人盲点:单个功能很厉害,组合起来就"翻车"

香港科技大学团队通过DAFNYCOMP基准测试发现,当前最先进的AI模型在编写单个功能时表现优秀(95.67%语法正确率),但在需要多个功能协调工作的复杂程序中却表现糟糕(仅3.69%验证成功率)。研究揭示了AI在组合推理方…详细

人工智能形式化验证组合推理

2025-10-24 09:43:35
西班牙法律文档秒变"人话":西班牙国立远程教育大学和挪威国家图书馆联手破解法律条文的"天书"难题

西班牙国立远程教育大学联合挪威国家图书馆创建BOE-XSUM数据集,包含3648个西班牙法律文档的极简摘要,旨在将复杂法律条文转换为普通人可理解的语言。研究显示专门训练的小型模型在此任务上超越大型通用模型,为西班…详细

法律文档摘要自然语言处理数据集构建

2025-10-24 08:34:09
Aligned Data Centers部署"首创"数据中心电池储能项目

阿里纳德数据中心与Calibrant Energy合作开发首创电池储能系统,通过绕过传统电网升级时间线,使俄勒冈州希尔斯伯勒在建数据中心园区提前数年上线。该31兆瓦、62兆瓦时储能系统计划2026年投运,将作为响应电网的动态…详细

数据中心电池储能基础设施投资

2025-10-24 08:31:33
微软推出Edge浏览器Copilot模式挑战ChatGPT Atlas

微软在Edge浏览器中推出增强版Copilot模式,提供更强大的AI代理功能,目前在美国进行限量预览。该模式包含Actions和Journeys两大功能:Actions让浏览器能代表用户执行任务,如语音控制打开网页或查找文章特定内容;J…详细

人工智能智能体技术浏览器创新

2025-10-24 08:29:59
IBM与客户共谱AI长期发展蓝图

IBM正通过收购红帽和HashiCorp、为Power和z系统增加AI功能等方式,构建盈利能力强的AI产品服务组合。公司拥有超10万企业客户,将为其提供安全、熟悉的AI集成解决方案。IBM第三季度营收163.3亿美元,同比增长9.1%,净…详细

人工智能企业级AISpyre加速器

2025-10-24 08:29:03
MIT实验室推出sAIpien项目:让董事会能够审计AI决策

MIT媒体实验室推出可扩展AI智能网络演进项目(SAIpien),专注于可审计的人机交互系统。该项目将负责任AI从政策讨论转化为工程学科,连接用户体验标准与可追溯的治理机制。通过数字孪生、原型开发和跨领域设计,SAIp…详细

人工智能人机交互可审计系统

2025-10-24 08:27:51
AI道德记分卡如何建立人工智能系统信任

随着机器学习和大语言模型在企业中的广泛应用,AI系统的数据来源和使用方式日益受到关注。企业开始为客户提供详细的伦理评分卡,记录模型训练数据的来源、处理方式和使用情况。这些评分卡帮助组织建立客户信任,确保…详细

人工智能道德评估合规框架

2025-10-24 08:25:34
Twitch推出AI工具助力主播触达更大受众

亚马逊旗下直播平台Twitch在TwitchCon 2025大会上发布多项AI功能。其中Auto Clip功能可帮助主播快速剪辑多小时直播中的精彩片段,便于分享到TikTok等短视频平台。平台还将集成Meta的AI智能眼镜,支持直接通过眼镜进行…详细

直播平台人工智能视频剪辑自动化

2025-10-24 08:24:36
SAP称部分客户延迟合同签署影响云收入增长

SAP公布全年云收入位于指导区间下限,令投资者失望。高管表示制造业和公共部门客户签约周期延长。该欧洲软件巨头预计销售额将接近216-219亿欧元预测区间的下限,股价下跌2%。第三季度全球收入91亿欧元,同比增长7%,…详细

企业软件云计算合同延迟

2025-10-24 08:23:37
阿联酋数据中心建设热潮助力AI雄心与数字主权

阿联酋正经历数字基础设施转型,数据中心和云投资浪潮将该国重塑为人工智能和数字化转型的区域枢纽。据研究报告,阿联酋数据中心市场2024年价值约12.6亿美元,预计2030年将超过33亿美元。政府数字化议程、AI技术快速…详细

人工智能云基础设施数据主权

2025-10-24 08:19:26
谷歌宣称量子计算突破可加速药物发现

谷歌宣布在量子计算研究中取得重大突破,其量子回声算法运算速度比顶级经典超级计算机快13000倍。该算法在Willow量子芯片上运行,已成功计算分子结构,为药物发现等实际应用铺平道路。研究显示量子增强核磁共振技术可…详细

人工智能量子计算新型算法

2025-10-24 08:17:58
征服生成式AI成功路上的存储挑战

生成式AI快速发展带来巨大机遇,但也面临海量数据管理挑战。Gartner预测到2029年,键值对象存储将占本地非结构化数据50%,生成式AI存储需求将超2EB。传统存储系统在性能、扩展性和元数据管理方面存在瓶颈,无法满足A…详细

人工智能对象存储高性能架构

2025-10-23 20:14:18
全球首个 HDR10 AR 眼镜发布!雷鸟 Air 4 重塑口袋电视性能上限

2025 年第二季度,雷鸟创新以高达 39% 的市场份额,登顶全球 AR 眼镜市场第一,并且超越了苹果,成为了全球 XR 市场(含 VR 头显和 AR 眼镜)第三。…详细

雷鸟AI眼镜

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章