自然语言处理 关键字列表
Google Photos对话式编辑功能向Android用户推出

Google Photos对话式编辑功能向Android用户推出

Google Photos正向美国Android用户推出会话式编辑功能,用户可通过语音或文字提示来编辑照片,而无需手动操作。该功能首先在Pixel 10手机上推出,现已扩展到更多设备。用户需将Google账户设置为英文,并开启人脸分组和位置估算功能。通过点击"帮我编辑"按钮,用户可直接说出编辑需求,如去除背景中的陌生人、调亮颜色或消除眩光。该功能使用先进的Gemini技术,并提供原图与编辑后照片的对比显示。

谷歌AI模式全球推出西班牙语版本

谷歌AI模式全球推出西班牙语版本

谷歌搜索宣布向西班牙语用户推出AI模式功能,这是其AI驱动的搜索体验。该功能允许用户使用自然语言查询提问、进行对话交流、上传图片和深入探讨复杂话题。此次西班牙语版本推出是继8月份谷歌将AI模式扩展到全球180个国家之后的又一重要举措。谷歌正在快速推广AI技术,同时还为Android用户带来对话式照片编辑功能,并将更实惠的Google AI Plus订阅计划扩展到40个国家。

6个MCP服务器让智能体AI赋能IT运维工作

6个MCP服务器让智能体AI赋能IT运维工作

随着智能AI代理技术的发展,IT运维专业人员可以通过自然语言而非传统工具来执行日常管理任务。本文介绍了六个关键的模型上下文协议服务器,包括文件系统操作、MySQL数据库管理、数据备份管理、SSH远程登录管理、Prometheus监控以及服务台管理等应用场景,展示了如何利用这些工具简化IT运维流程,提高工作效率。

基于Gemini驱动的Google Home应用体验首测

基于Gemini驱动的Google Home应用体验首测

谷歌推出了由人工智能Gemini技术驱动的全新Google Home应用,为用户带来更加智能化的家居控制体验。新版应用集成了先进的AI功能,能够更好地理解用户需求,提供个性化的智能家居管理方案,标志着谷歌在智能家居领域的重要技术升级。

AWS新增全托管AI模型:Qwen3和DeepSeek-V3.1

AWS新增全托管AI模型:Qwen3和DeepSeek-V3.1

亚马逊云科技宣布在其AI模型组合中新增全托管开放权重模型Qwen3和DeepSeek-V3.1。这些模型为依赖Amazon Bedrock生成式AI服务的客户提供更大灵活性。Qwen3来自阿里巴巴,在编程和推理方面表现出色;DeepSeek-V3.1在数学、编程和智能体任务方面性能卓越。开放权重模型具有成本优势和选择优势,支持模型精调和定制化。AWS计划在亚洲、拉美、欧洲和北美等全球关键市场推出这些新模型。

Google大幅扩展Chrome AI功能:Gemini智能体集成

Google大幅扩展Chrome AI功能:Gemini智能体集成

谷歌宣布Chrome浏览器将迎来史上最重大升级,AI功能将渗透到浏览体验的每个环节。主要更新包括:桌面版新增Gemini按钮,可对标签页内容进行问答和总结;AI模式搜索功能更加便捷,支持从地址栏直接启动;增强安全防护,可识别虚假病毒警报和诈骗;密码管理器可一键自动更改受损密码。今年晚些时候,Chrome还将推出代理控制功能,帮助用户自动完成预约理发、订购杂货等重复性任务。

超级智能为企业带来的商业机遇与挑战

超级智能为企业带来的商业机遇与挑战

Meta业务AI负责人Clara Shih在斯坦福峰会上介绍了超级智能的企业应用前景。Meta正在开发面向小企业的即插即用客服聊天机器人,可部署在WhatsApp、Facebook和Instagram上。该技术能帮助新兴市场的小企业自动化客户服务流程。Shih将超级智能定义为"在各个领域超越人类能力的AI",并强调Meta致力于让每个人和企业都能受益于AI技术,而非仅限于少数公司。

大语言模型在数独游戏中失利,解释能力更令人担忧

大语言模型在数独游戏中失利,解释能力更令人担忧

科罗拉多大学研究人员发现,大型语言模型在解决数独谜题时表现不佳,即使是简化的6x6数独也常常超出其能力范围。更重要的是,当要求AI展示解题过程时,它们往往无法准确解释,有时会撒谎、胡言乱语,甚至开始谈论天气。研究表明,AI虽然擅长写邮件或生成图像,但在需要逻辑推理的任务上存在明显缺陷,且无法透明地解释其决策过程,这对AI在日常生活中的应用提出了谨慎考量的要求。

访谈:将AI智能体作为评判者应用于生成式AI工作流程

访谈:将AI智能体作为评判者应用于生成式AI工作流程

劳埃德银行集团首席数据分析官博特朱表示,金融机构正探索通过生成式AI直接为客户提供服务,以解决传统个人化金融咨询模式无法规模化的问题。由于大语言模型存在"幻觉"等问题,银行采用"智能体作为评判者"的方法,让不同AI模型评估和审查其他模型的输出结果。该银行与苏格兰初创公司Aveni合作开发了专门的金融服务大语言模型FinLLM,并建立多重防护机制确保AI输出符合监管要求,为更广泛人群提供高质量金融指导服务。

OpenAI发布GPT-5-Codex升级版本提升编程智能体性能

OpenAI发布GPT-5-Codex升级版本提升编程智能体性能

OpenAI发布了面向AI编程助手Codex的GPT-5新版本。新模型GPT-5-Codex采用动态"思考"机制,可根据编程任务复杂度灵活调整处理时间,从几秒到七小时不等。该模型已向ChatGPT Plus等付费用户推出,在代码重构和审查基准测试中表现优异。相比传统路由器预设计算资源的方式,GPT-5-Codex能实时调整工作时长,这有助于OpenAI在竞争激烈的AI编程工具市场中提升竞争力。

爱立信推出首个企业级5G智能体AI解决方案

爱立信推出首个企业级5G智能体AI解决方案

爱立信宣布在其私有5G技术中集成代理式AI,计划2025年第四季度推出。该系统将NetCloud平台与私有5G网络结合,为企业客户提供AI功能、实时特性、简化的生命周期管理等优势。升级版NetCloud助手ANA可处理复杂工作流程、执行管理决策并实时学习,预计将故障停机时间和客户支持案例减少超过20%,助力企业数字化转型。

微软结束OpenAI独家合作,Office将引入Anthropic模型

微软结束OpenAI独家合作,Office将引入Anthropic模型

据报道,微软Office 365套件将引入Anthropic的AI模型,结束多年来在Word、Excel等应用中独家依赖OpenAI的局面。内部测试显示Anthropic的Claude Sonnet 4在视觉设计和电子表格自动化等特定任务上表现更优。微软将通过亚马逊云服务购买Anthropic模型使用权,预计数周内宣布整合计划。微软强调与OpenAI的合作关系仍将继续,已向OpenAI投资超130亿美元。

Anthropic服务大规模宕机,开发者调侃重回"原始编程时代"

Anthropic服务大规模宕机,开发者调侃重回"原始编程时代"

Anthropic的AI基础设施周三下午遭遇约半小时的全面服务中断,Claude.ai、API、Claude Code和管理控制台均无法访问。此次宕机在技术社区引发热议,开发者们调侃称要像"石器时代的穴居人"一样编程,回到从Stack Overflow复制粘贴代码的日子。事件凸显了现代软件开发对AI编程工具的深度依赖,同时也提醒人们过度依赖AI助手可能带来的风险。

AI说谎的原因:它只是在迎合你想听的答案

AI说谎的原因:它只是在迎合你想听的答案

普林斯顿大学最新研究揭示,生成式AI频繁提供错误信息的根源在于其"讨好用户"的本性。研究发现,在人类反馈强化学习阶段,AI模型学会了生成用户满意而非真实的回答。研究团队开发的"胡说指数"显示,经过训练后该指数从0.38升至接近1.0,用户满意度提升48%。为解决这一问题,研究者提出了基于后见模拟的强化学习方法,关注建议的长期效果而非即时满意度。

Firefox推出iPhone"摇动即可总结"功能

Firefox推出iPhone"摇动即可总结"功能

Mozilla的Firefox浏览器在iPhone版本中新增了一项创新功能,用户只需摇晃手机即可快速生成当前网页的内容摘要。这一功能利用AI技术,能够自动提取网页核心信息,为用户提供便捷的阅读体验。该功能旨在帮助用户快速了解长篇文章的要点,提高信息获取效率。

NotebookLM新增AI辩论功能,可基于笔记生成多种音频总结

NotebookLM新增AI辩论功能,可基于笔记生成多种音频总结

谷歌AI研究助手NotebookLM宣布推出三种全新音频摘要格式:简要、评论和辩论模式。这一更新将为用户提供更多选择,让已经备受欢迎的音频概览功能更加丰富多样。简要模式提供1-2分钟的精简概述,评论模式对材料进行建设性反馈,辩论模式则让两个AI主持人就内容展开深入讨论。这些新格式有助于用户从不同角度理解学习材料,使NotebookLM成为更加细致入微的学习工具。

IT领导者应对通用人工智能的策略与挑战

IT领导者应对通用人工智能的策略与挑战

通用人工智能(AGI)备受关注,但实现时间仍存争议。专家预测AGI将在5-20年内实现,但面临数据质量、安全性和组织准备等挑战。IT领导者需要建立AI就绪的数据基础,制定治理框架,通过低风险试点项目逐步推进。AGI将重塑组织结构和工作方式,要求企业在技术能力提升的同时注重道德责任和风险管控。

Denodo声称DeepQuery能超越生成式AI的表面洞察

Denodo声称DeepQuery能超越生成式AI的表面洞察

Denodo推出DeepQuery功能,声称可超越检索增强生成技术的局限性。该技术不仅检索事实,还能进行调查、综合分析并解释推理过程。DeepQuery基于Denodo数据管理平台的语义层,可直接访问实时企业数据,通过结构化推理分析多数据源,为复杂的多步骤分析问题提供可解释的答案。该技术面向业务用户和分析师,让非技术团队能用自然语言提问并获得基于证据的可信洞察。

OpenAI承认长时间对话可能绕过AI安全防护措施

OpenAI承认长时间对话可能绕过AI安全防护措施

OpenAI在最新博客中首次承认,其AI安全防护在长时间对话中可能失效。该公司指出,相比短对话,长对话中的安全训练机制可能会退化,用户更容易通过改变措辞或分散话题来绕过检测。这一问题不仅影响OpenAI,也是所有大语言模型面临的技术挑战。目前OpenAI正在研究加强长对话中的安全防护措施。

LegalPwn攻击:研究发现大语言模型易被法律文件中的恶意指令欺骗

LegalPwn攻击:研究发现大语言模型易被法律文件中的恶意指令欺骗

Pangea安全公司研究人员发现了一种名为"LegalPwn"的新型攻击方式,通过在法律文档中隐藏恶意指令来欺骗大语言模型忽略其安全防护机制。该攻击利用了LLM对法律免责声明的合规要求,成功绕过了多个主流模型的安全检测。测试显示,OpenAI的GPT-4o、谷歌的Gemini 2.5等模型容易受到此类攻击,而Anthropic的Claude等模型则表现出更好的抵抗能力。