大语言模型 关键字列表
超级智能究竟长什么样?

超级智能究竟长什么样?

文章探讨如何通过自动化科研流程、数学证明与分布式系统,利用AI突破人类认知局限,推动科学创新和技术变革。

OpenAI寻求使其即将推出的开源 AI 模型成为行业最佳

OpenAI寻求使其即将推出的开源 AI 模型成为行业最佳

OpenAI 宣布将于今年晚些时候发布自 GPT-2 后首个开源语言模型,由研究副总裁 Aidan Clark 领导,预计初夏推出。该模型针对高端消费硬件,可灵活启用推理功能,并采用宽松许可证和严格安全评估,此举旨在应对 DeepSeek、Meta 等开源对手的竞争。

富士通借助日语大语言模型在 Nutanix 平台上发力私有 AI

富士通借助日语大语言模型在 Nutanix 平台上发力私有 AI

富士通与 Nutanix 合作,将经过日语优化的 Takane 模型部署在企业 AI 平台,实现私有及混合云环境中安全高效应用生成式 AI。

企业竞逐 AI 代理采用

企业竞逐 AI 代理采用

文章探讨了企业在 AI 智能代理领域中的快速布局与市场前景,分析了实际应用案例、面临的技术挑战及未来发展趋势。

微软 Copilot 个性化升级迎50周年

微软 Copilot 个性化升级迎50周年

从本周五起,Copilot 将记住用户会话和偏好信息(如宠物名、早餐口味及沟通风格),并试验个性化动画展示,同时支持在部分网站上预订票务、餐厅等服务,朝全面个人助理迈进。

今日大语言模型以闪电般的速度从补丁中构造漏洞利用

今日大语言模型以闪电般的速度从补丁中构造漏洞利用

生成式 AI 可在数小时内通过对比补丁差异自动识别并利用漏洞,极大降低防御响应时间。

OpenAI 新推理 AI 模型幻觉问题更严重

OpenAI 新推理 AI 模型幻觉问题更严重

OpenAI 最新推出的 o3 和 o4-mini 推理 AI 模型虽然在编程和数学等任务上表现出色,但幻觉率却远高于以往模型,引发了对准确性的严重担忧,亟待进一步研究。

Together AI 的增强功能使得 AI 微调更快更便捷

Together AI 的增强功能使得 AI 微调更快更便捷

Together AI 最新升级其微调平台,支持浏览器零代码操作、直接偏好优化、续接先前训练任务并调整消息权重,同时新定价更低廉,旨在简化AI模型持续迭代。

Google 在 Cloud Next 2025 的 AI 创新:CIO 需要了解的事项

Google 在 Cloud Next 2025 的 AI 创新:CIO 需要了解的事项

在 Cloud Next 2025 上,Google 公布一系列 AI 更新,包括新 TPU 芯片、专业化 LLM 及开放代理框架,助力企业降低集成复杂度和成本,实现 AI 部署、扩展及管理。

OpenAI 转变重点:GPT-4.1 优先关注编程与成本效率

OpenAI 转变重点:GPT-4.1 优先关注编程与成本效率

OpenAI 推出了 GPT-4.1 系列,专注提升编程效率、扩展长文本处理能力与指令执行准确性,同时大幅降低成本,为企业和开发者提供更灵活的 AI 工具。

Google 推出企业级 AI 智能体开发套件,助力快速原型开发和部署

Google 推出企业级 AI 智能体开发套件,助力快速原型开发和部署

Google 发布了新的智能代理开发工具包 (ADK) 和相关功能,简化了基于 Gemini 模型的多代理系统创建过程。ADK 支持 Model Context Protocol,可帮助企业快速构建、部署和管理 AI 代理。同时推出的还有 Agent Engine 和 Agent Garden,为企业提供了更全面的代理开发和管理解决方案。这些新工具旨在增强企业对 AI 代理的控制和安全性。

Nvidia 新型 Llama-3.1 Nemotron Ultra 以一半参数量超越 DeepSeek R1

Nvidia 新型 Llama-3.1 Nemotron Ultra 以一半参数量超越 DeepSeek R1

英伟达发布了基于 Meta 旧版 Llama-3.1 的全新开源大语言模型 Llama-3.1-Nemotron-Ultra-253B。该模型在多项第三方基准测试中表现出色,尽管参数量仅为 DeepSeek R1 的一半,但在许多任务上都超越了这个强大的竞争对手。新模型支持高级推理、指令跟随和 AI 助手工作流,采用了创新架构和针对性后训练来优化性能。

Gemini "正在以非常棒的方式融合在一起",谷歌在发布2.5 Pro后表示

Gemini "正在以非常棒的方式融合在一起",谷歌在发布2.5 Pro后表示

Google 在生成式 AI 领域起步较晚,但近期 Gemini 发展迅速。最新发布的 Gemini 2.5 Pro (实验版)在基准测试和用户体验方面均有显著提升,有望挑战 ChatGPT 的主导地位。Google 表示,这得益于长期投资的成果开始发挥作用。新版本在推理能力、性能效率等方面都有进步,但在技术细节透明度方面仍有待改进。

思科:微调后的大语言模型成为威胁放大器——恶意行为可能性增加22倍

思科:微调后的大语言模型成为威胁放大器——恶意行为可能性增加22倍

思科最新研究表明,经过微调的大语言模型正在重塑网络攻击格局。这些模型可以自动化侦察、身份模仿和实时检测规避,加速大规模社会工程攻击。一些专门用于攻击的模型月租低至75美元。研究还发现,微调过程会削弱模型的安全控制,使其更容易被利用。这迫使安全领导者必须重新制定防御策略,将大语言模型视为新的攻击面来加以防护。

扎克伯格:Meta最新Llama模型将开源AI推向领导地位

扎克伯格:Meta最新Llama模型将开源AI推向领导地位

Meta发布了Llama 4系列大型语言模型,包括适合单GPU运行的Scout和媲美GPT-4o的Maverick,均拥有170亿参数。更强大的Behemoth模型仍在开发中,将拥有2880亿活跃参数。这些模型采用专家混合系统技术,在性能、效率和安全性方面均有显著提升,体现了Meta推动开源AI成为行业领先力量的战略。

Google 发布 Gemini 模型的速度快于其 AI 安全报告

Google 发布 Gemini 模型的速度快于其 AI 安全报告

Google 近期加快了 AI 模型的发布节奏,推出了业界领先的 Gemini 2.5 Pro 和 Gemini 2.0 Flash。然而,公司尚未发布这些新模型的安全报告,引发了对透明度的担忧。Google 表示正在权衡快速迭代和获取反馈的方式,承诺未来会发布更多文档,但专家认为这种做法可能会树立不良先例。

Google 新实验性 Gemini 2.5 模型向免费用户开放

Google 新实验性 Gemini 2.5 模型向免费用户开放

Google 推出最新的 Gemini 2.5 Pro (实验版) AI 模型,并以罕见的速度向免费用户开放。该模型支持模拟推理,提高了准确性,并在 LMSYS 聊天机器人竞技场排行榜上名列前茅。免费用户可在网页上试用,但有使用限制,无法上传文件,且有未明确的token和使用次数限制。

大语言模型供应商面临"淘汰"危机,资本支出现实带来严峻考验

大语言模型供应商面临"淘汰"危机,资本支出现实带来严峻考验

Gartner 预测,大语言模型 (LLM) 提供商市场即将进入"灭绝"阶段。在竞争激烈的环境下,巨额资本投入成为主要挑战。预计到 2025 年,全球生成式 AI 支出将达到 6440 亿美元,较 2024 年增长 76%。专家认为,LLM 市场将经历类似云计算市场的整合,最终可能只剩少数几家主导者。

OpenAI 将发布自 2019 年以来首个"开放权重"模型

OpenAI 将发布自 2019 年以来首个"开放权重"模型

OpenAI计划今年晚些时候向开发者社区发布一个"开放权重"模型,这是该公司自2019年以来的首次尝试。新模型将具备推理能力,类似于现有的o3-mini模型。这一战略转变旨在应对来自竞争对手的压力,同时为开发者提供更多定制和使用灵活性。虽然不完全开源,但这种方式可能有助于OpenAI在保持技术领先的同时,满足市场对更开放AI发展的需求。

Databricks 与 Anthropic、Palantir 达成企业 AI 合作

Databricks 与 Anthropic、Palantir 达成企业 AI 合作

Databricks 与 Palantir 签署合作协议,开发出更优的大语言模型微调方法,并与 Anthropic 达成为期五年的战略联盟,将 Claude 大语言模型整合到其数据湖平台中。此次合作将为企业客户提供更强大的 AI 能力,包括军工级安全性、高效的模型训练以及全面的数据治理,助力企业打造专属 AI 应用。