科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-07-11 09:52:55
从看图说话到看视频聊天:Salesforce带来史上最强多模态理解新突破

本研究提出了VLM2Vec-V2多模态嵌入模型和MMEB-V2评估基准,首次实现对文本、图片、视频和文档的统一理解。该模型在78个任务上全面领先现有基线,展示了从专门化向通用化发展的重要趋势,为多媒体内容理解、智能搜索和…详细

多模态理解视频文档处理统一嵌入模型

2025-07-11 09:52:38
AI预测师挑战超级人类:谁能更准确地预测未来?——乔治梅森大学实证研究揭秘

乔治梅森大学研究发现,最新AI模型在预测准确性上首次超越普通人群,但仍显著落后于人类顶级预测专家。通过464个真实预测问题的测试,OpenAI的o3模型表现最佳,但"超级预测师"的表现仍是AI的六倍。研究揭示AI在政治预…详细

人工智能预测技术人机对比

2025-07-11 09:52:23
AI智能体的"万能翻译官":卡内基梅隆大学提出Mod-X架构,让不同AI系统也能无障碍交流

这项由卡内基梅隆大学团队提出的Mod-X框架,旨在解决AI智能体之间无法有效协作的核心问题。通过分层架构设计,包括通用消息总线、语义翻译层、状态管理和区块链安全机制,实现了不同技术背景的AI系统无障碍通信。该框…详细

人工智能架构智能体通信协议区块链安全机制

2025-07-11 09:52:09
SAP实验室重磅突破:让AI助手告别"糊里糊涂",精准识别企业工具的革命性方法

SAP实验室研究团队开发了DIAFORGE系统,通过三阶段训练显著提升AI助手在企业环境中的工具调用准确性。该方法专门解决AI助手面对相似工具时的选择困难,通过模拟真实企业场景训练AI主动澄清用户需求。实验结果显示,经…详细

企业AI助手工具调用优化消歧训练技术

2025-07-11 09:51:22
AI智能演示制作助手:让文档秒变生动演讲视频的黑科技来了

澳大利亚研究团队开发出PresentAgent,这是一个能将任何文档自动转换为专业演示视频的AI系统。该系统集成了文档解析、幻灯片设计、语音合成等功能,并创建了全新的多维度评价体系。实验显示,AI生成的演示视频在多项…详细

人工智能多模态生成自动化演示制作

2025-07-11 09:50:13
Meta 让视频生成像聊天一样轻松:实时AI导演帮你随时拍出想要的画面

Meta和加州大学伯克利分校的研究团队开发了StreamDiT技术,实现了首个真正意义上的实时AI视频生成系统。该技术能够像熟练摄影师一样根据文字描述即时生成高质量视频,支持用户在生成过程中实时调整内容。通过创新的"…详细

实时视频生成流式AI模型多模态交互

2025-07-11 09:50:04
OmniDraft:高通AI研究院让小模型秒变万能助手,一个68M模型竟能给多个大模型当"草稿员"

这项由高通AI研究院完成的研究提出了OmniDraft框架,通过跨词汇表翻译、在线蒸馏学习和自适应草稿调整三大创新技术,让一个68M参数的小模型能够为多个不同的大型AI模型提供通用加速服务,在数学推理、编程和文本生成…详细

人工智能推理加速模型优化

2025-07-11 09:49:32
物理模拟也能"压缩"?Flatiron研究院探索AI模型如何在虚拟世界中偷懒却不失精度

Flatiron研究院团队探索了在压缩的"潜在空间"中进行物理模拟的新方法,发现即使压缩1000倍,AI模型仍能准确预测复杂物理现象如流体流动和湍流。研究对比了扩散模型和神经求解器两种方法,发现扩散模型不仅更准确,还…详细

潜在扩散模型物理模拟计算效率优化

2025-07-11 09:48:53
斯坦福大学突破:AI能否像人类一样判断创意写作的好坏?

斯坦福大学研究团队创建了全球首个创意写作评估基准LitBench,通过分析Reddit写作社区的4万多对故事比较数据,训练AI模型判断创意写作质量。研究发现专门训练的小型奖励模型(78%准确率)能超越大型语言模型评委(73…详细

人工智能创意写作奖励模型

2025-07-11 09:48:28
清华大学团队突破AI学习限制:让机器在零数据环境下自己跟自己下棋变聪明

清华大学团队提出"绝对零度"AI训练新方法,让AI系统完全不依赖人类数据,仅通过自己出题解题的方式实现自主学习。该方法在编程和数学推理任务上超越了使用大量人工数据训练的传统模型,展现了AI超出预期的自主学习潜…详细

强化学习自主学习零数据训练

2025-07-11 09:47:57
复旦和腾讯联手开发出能"深度思考"的AI评委——彻底改变视觉内容评分游戏规则

复旦和腾讯联合开发的UnifiedReward-Think是全球首个具备链式思维推理能力的统一多模态奖励模型。该系统能像专业评委一样进行多维度深度分析,在图像和视频评估任务中全面超越现有方法,准确率提升5-25%。更重要的是…详细

人工智能多模态评估链式思维推理

2025-07-11 09:47:23
TUM团队突破性发现:AI模型竟能用"错误"数据学会完美推理!

慕尼黑工业大学研究团队首次将"grokking"现象成功应用于真实世界的复杂推理任务,通过巧妙的数据增强策略,让仅有1.24亿参数的小型AI模型在多步推理任务上达到95-100%准确率,超越了GPT-4o等大型模型。更令人惊讶的是…详细

人工智能多步推理数据增强

2025-07-11 09:45:32
AI语音助手终于能像《她》里一样自然聊天了!加州圣地亚哥大学等团队推出Voila模型

加州大学圣地亚哥分校等机构联合开发的Voila语音AI系统实现了真正的实时双向语音交互,响应速度仅195毫秒,支持情感表达和主动对话。该系统采用端到端架构,拥有百万预制声音库,仅需10秒音频即可定制新声音。Voila在…详细

语音人工智能端到端语音模型实时语音交互

2025-07-11 08:01:00
Citrix重返主流虚拟化市场,但承认产品尚未就绪

Citrix宣布通过XenServer产品重返主流虚拟化市场,尽管该公司承认产品尚未完全就绪。云软件集团表示XenServer正扩大支持范围以涵盖各类工作负载。Citrix早在2010年代初就基本放弃了XenServer作为主流虚拟化产品的定位…详细

云计算虚拟化技术市场重新定位

2025-07-11 07:54:37
Docker推出新功能支持AI智能体开发

Docker公司发布重大新功能,旨在简化智能体AI应用的构建、运行和部署。公司扩展了Docker Compose工具以支持AI智能体和模型的大规模部署,并推出Docker Offload服务,允许开发者将AI工作负载转移到云端。新功能还支持…详细

人工智能容器化技术云端部署

2025-07-11 07:50:17
欧盟AI新规让科技巨头深恶痛绝的条款

欧盟发布AI法案实施细则,要求谷歌、Meta、OpenAI等公司承诺不使用盗版材料训练AI,详细披露训练数据来源和模型设计理念。新规还要求公司尊重付费墙和网站爬虫限制,公开训练和推理的总能耗,并在5-10天内向欧盟AI办…详细

人工智能透明度新规法案

2025-07-11 07:48:27
AI流利度的4C框架:为未来职场做好准备

随着ChatGPT等AI技术的普及,入门级岗位预计将减少32%。仅掌握AI素养已不足以在职场保持竞争力。本文提出从AI素养向AI流利度的转变,通过概念、情境、能力、创造力四个维度深入阐述。AI素养是基础能力,而AI流利度则…详细

人工智能深度学习新型框架

2025-07-11 07:46:51
Monday.com推出AI工具助力用户构建、自动化和执行工作

云端项目管理服务商Monday.com发布三项AI功能更新:monday sidekick智能助手可根据用户角色和工作风格提供个性化帮助;monday magic让用户通过简单描述即可自动构建完整工作流程;monday vibe支持用户用自然语言构建…详细

人工智能自然语言处理智能体协作

2025-07-11 07:45:27
AI绿色推理模型有望借助风力发电变革数据中心

微软研究团队提出"AI绿色推理"新模式,将AI计算集群直接部署在风电场等可再生能源站点,绕过电网瓶颈直接利用绿色能源。该方案通过Heron软件路由器动态管理工作负载,根据实时电力供应情况智能分配计算任务。研究显示…详细

人工智能可再生能源新型算法

2025-07-11 07:44:06
AI基础设施重塑IPO市场的12个迹象:RAISE峰会洞察

人工智能正在重塑资本市场,AI基础设施已成为企业扩张、竞争和上市的关键支柱。投资者不再只关注表面增长,而是深入审视企业如何将AI融入商业模式,确保运营韧性和长期盈利能力。在RAISE峰会上,来自纽交所、谷歌云、…详细

人工智能基础设施IPO市场

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章