自2022年末ChatGPT推出以来,专家们一直在讨论人工智能语言模型将如何影响世界。几年后,情况逐渐明朗。根据斯坦福大学领导的新研究,分析了跨多个行业的超过3亿条文本样本,发现人工智能语言模型现在在各行业的专业沟通中提供了高达四分之一的写作支持,尤其是在美国教育水平较低的地区影响显著。
Zoom Communications的研究团队开发了一种突破性技术,能够显著降低人工智能系统在处理复杂推理问题时所需的成本和计算资源,可能会改变企业大规模部署AI的方式。该方法称为草稿链(Chain of Draft,CoD),使大型语言模型能够用最少的文字解决问题——所需文本仅为当前方法的7.6%,同时保持或甚至提高准确性。研究结果上周在arXiv研究库中发表。
Opera浏览器现在拥有“代理AI”,用户可以请求内置的AI模型执行需要一系列浏览器内操作的任务。虽然这项技术展示可能有趣,但实际上它只是将网络浏览委托给一个能力有限的个人助手。AI代理被称为浏览器操作员,可以帮助用户找到可购买的12双10码Nike袜子。尽管用户可以在15秒内通过访问Walmart在线商店完成相同操作,但这项技术的推出标志着浏览器角色的转变。
一项新研究发现,深度搜索(DeepSeek)生成的文本中,有惊人的 74.2% 与 OpenAI 的 ChatGPT 输出在风格上有显著相似性。这一发现表明,深度搜索可能是基于 ChatGPT 的输出进行训练的。
Microsoft 终于为其免费的生成式 AI 聊天机器人 Copilot 推出了 macOS 应用。这款应用类似于 ChatGPT,可以帮助用户完成多项任务,如起草邮件、总结文档和撰写求职信等。新应用为 Mac 用户提供了专属体验,但需要 macOS 14.0 或更高版本,以及搭载 Apple M1 或更新芯片的 Mac 设备。
OpenAI推出的GPT-4.5企业版引发了争议,其高昂价格让许多人质疑其性价比。然而,作为OpenAI最大且最强大的非推理模型,GPT-4.5在知识储备、文档处理、任务规划等方面表现出色。尽管成本高昂,但随着推理成本的下降和未来潜在的强化学习训练,GPT-4.5仍有望成为企业应用的有力工具。
ServiceNow 携手 NVIDIA 推出电信行业专用 AI 智能代理,旨在提升客户服务和网络运营效率。这些 AI 代理能够自主分析网络数据、解决问题、优化账单等,有望为电信服务提供商带来显著的生产力提升和价值创造。新功能将于 3 月 12 日在 ServiceNow 平台的最新版本中向所有电信客户开放。
Inception Labs 于周四发布了 Mercury Coder,这是一种新的 AI 语言模型,利用扩散技术比传统模型更快地生成文本。与逐字生成文本的传统模型(如 ChatGPT)不同,基于扩散的模型(如 Mercury)能够同时生成完整的响应,并将其从最初的遮蔽状态逐步精炼为连贯的文本。
微软终于将其 AI 助手 Copilot 作为独立应用程序推出 macOS 版本。这款免费应用现已在 Mac App Store 上线,支持多种功能如文本翻译、问题解答、文档生成等。Copilot 采用 OpenAI 的 GPT-4 和 DALL-E 3 等模型,标志着微软在 AI 领域的重要布局。该应用要求 M1 或更新的 Mac 设备,以及 macOS 14 或更高版本。
OpenAI 发布 ChatGPT 4.5 预览版,承诺对话更自然、情感智能更强、知识面更广。新模型能更好理解语境和细微差别,创造力和协作能力提升,幻觉现象减少。这一升级体现了 AI 向着匹敌甚至超越人类能力的目标迈进,为未来更强大的 GPT-5 奠定基础。
亚马逊正在重塑其旗舰语音助手 Alexa,通过整合 AI 代理、模型混合和浏览器操作能力,打造更智能的 Alexa+。新版本不仅可以主动提供个性化信息,还能理解复杂指令并完成多步骤任务。亚马逊希望通过这种创新方式,让 Alexa 成为更强大、更智能的家庭语音助手。
亚马逊在周三分享了一个令人印象深刻的“代理”未来愿景——在这个未来中,改进后的 Alexa+ 将处理无数日常任务,从预订餐厅到寻找家电维修工。如果亚马逊能够实现这一目标,它可能会成为首个推出全面、以消费者为中心的代理工具的公司。该公司希望将更自然、更具表现力的 Alexa(由生成性 AI 模型驱动)与能够以完全自主、智能的方式接入第一方和第三方应用、服务及平台的能力结合起来。
Akool推出了一项创新技术,将生成式AI模型与2D头像相结合,创造出栩栩如生的虚拟角色。用户只需上传照片和录音,即可定制个性化头像,实现与AI模型的自然交互。这项技术可广泛应用于电商、教育、医疗等领域,大幅提升用户体验和参与度。Akool的解决方案已为多家全球品牌节省了大量制作成本,加速了市场拓展。
这篇文章探讨了如何使用人工智能工具 goblin.tools 来改善工作邮件的语气,避免不必要的冒犯。作者分享了自己在准备一项活动时的挫折感,并介绍了 goblin.tools 的功能,特别是其“Formalizer”工具,能够将邮件内容转化为更专业、更礼貌的表达。通过使用这个工具,作者发现自己能够更有效地传达需求,同时保持良好的沟通关系。
Flexport 推出一系列新产品和功能,大多基于 AI 技术。这是公司首次尝试半年一次的产品发布模式,灵感来自 Airbnb。新产品旨在提高物流效率,包括自然语言查询和全网络可视化控制等功能。Flexport 希望通过 AI 实现自动化,同时保持"以人为本"的服务理念。
埃隆·马斯克的人工智能公司 xAI 推出了备受期待的旗舰 AI 模型 Grok 3。新模型推出后,Grok 应用的下载量和活跃用户数大幅增长。然而,近期围绕 Grok 3 的争议可能会影响用户的热情。能否保持增长势头并留住用户,成为 xAI 面临的重要挑战。
Quora 旗下的 AI 平台 Poe 推出了新功能 Poe Apps,允许用户通过描述来创建基于 AI 模型的可视化应用。用户可以指定使用特定模型或提供一般规格。这些应用可以与 Poe 的聊天窗口并行运行或完全可视化,底层代码可供调整。Poe Apps 目前仅支持网页版,未来将支持 iOS 和 Android。
OpenAI 宣布向所有付费 ChatGPT 用户提供深度研究功能,这是一种能生成详尽研究报告的网络浏览代理。不同付费用户每月可获得不同数量的深度研究查询次数。此举与 Google 和 Perplexity 等公司的类似产品形成竞争,旨在提升 AI 订阅服务的价值。
Google 宣布将 Gemini 代码助手免费开放给所有用户,支持所有公开可用的编程语言。该工具每月提供18万次代码补全,远超其他免费编码助手。这一举措旨在帮助学生和业余程序员,同时推动 Google AI 服务的长期应用,标志着自然语言编程的重要进步。
Anthropic 推出 Claude 3.7 Sonnet 模型,为用户提供前所未有的 AI 思考时间控制能力,并发布 Claude Code 命令行编码助手。这标志着 Anthropic 积极进军企业 AI 市场,可能重塑企业软件开发和工作自动化方式。新模型在延长思考模式下在研究生级推理任务上达到 78.2% 的准确率,挑战 OpenAI 最新模型并超越 DeepSeek-R1,展现出强大的竞争力。