科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-09-16 11:16:04
OpenAI发布GPT-5-Codex模型,可自动处理耗时编程任务

OpenAI推出新AI模型GPT-5-Codex,能够在无用户协助下完成数小时的编程任务。该模型是GPT-5的改进版本,使用额外编码数据训练。测试显示,GPT-5-Codex可独立工作超过7小时,能自动发现并修复编码错误。在重构基准测试…详细

人工智能代码生成自动化编程

2025-09-16 11:12:50
英伟达与CoreWeave达成63亿美元GPU算力担保协议

英伟达与新兴云服务商CoreWeave签署协议,承诺在2032年前为其提供63亿美元GPU计算容量担保。作为CoreWeave 7%股东,英伟达此举旨在培养与AWS、微软和谷歌抗衡的合作伙伴。该协议平均每年担保9亿美元容量,相当于约94…详细

人工智能GPU计算投资担保

2025-09-16 11:11:18
Divergent获2.9亿美元融资,扩大军用部件生产

先进制造公司Divergent Technologies融资2.9亿美元,用于扩大导弹零部件及其他军用专业组件的生产。此轮融资对公司估值23亿美元,客户包括洛克希德·马丁、RTX和通用动力等主要国防承包商。新资金将用于扩建洛杉矶制…详细

先进制造3D打印技术融资扩张

2025-09-16 11:10:47
VideoRefer套件:阿里达摩院让视频AI真正"看懂"复杂场景中的每个物体

阿里达摩院联合浙江大学推出VideoRefer套件,这是首个能够精确理解视频中特定物体的AI系统。该系统不仅能识别整体场景,更能针对用户指定的任何物体进行详细分析和跨时间追踪。研究团队构建了包含70万样本的高质量数…详细

视频理解物体识别多模态AI

2025-09-16 11:09:55
UC默塞德等高校联合推出Sa2VA:让AI同时看懂图像和视频的智能助手

Sa2VA是由UC默塞德等高校联合开发的突破性AI系统,首次实现图像视频的统一理解与精确分割。通过巧妙融合SAM-2视频分割技术和LLaVA多模态对话能力,Sa2VA能够同时进行自然对话和像素级物体标注。研究团队还构建了包含…详细

人工智能视频分割多模态交互

2025-09-16 11:09:43
Lightricks团队打造视频生成新利器:2秒生成5秒视频的LTX-Video模型

LTX-Video是由以色列Lightricks公司开发的革命性开源视频生成模型,能够在2秒内生成5秒高质量视频,实现了比实时播放更快的生成速度。该模型创新性地整合了视频压缩和生成过程,采用1:192的超高压缩比和共享去噪机制…详细

人工智能视频生成开源技术

2025-09-16 11:09:29
上海AI实验室重磅推出多模态奖励模型IXC-2.5-Reward:让AI更懂你的偏好

上海AI实验室推出的IXC-2.5-Reward是首个开源多模态奖励模型,能同时理解文本、图像和视频内容并评判AI回答质量。该模型在VL-RewardBench测试中达到70%准确率,超越所有开源模型,可用于AI训练优化、推理时最优选择和…详细

多模态奖励模型强化学习AI对齐技术

2025-09-16 11:09:14
苏州大学团队揭示AI推理的秘密:从快速反应到深度思考的完整进化图谱

苏州大学等机构联合发表的这项研究首次系统性梳理了AI测试时计算技术的发展全貌。研究揭示了AI正在经历从快速直觉反应向深度推理思考的重大转变,通过重复采样、自我纠错、树搜索等策略显著提升推理能力。这种"给AI更…详细

人工智能测试时推理深度学习

2025-09-16 11:08:56
人工智能专家团队首次让AI"专家"自己选择任务:中美研究团队颠覆混合专家模型传统设计

中美研究团队提出专家自主选择的AI新架构,让AI专家根据内在激活强度自主选择处理任务,避免传统路由器分配的不匹配问题。在40亿参数模型验证中,新方法在多项任务上超越传统混合专家模型,实现更均衡的负载分配和更…详细

人工智能混合专家模型自主选择机制

2025-09-16 11:08:42
上海AI实验室团队让GPT-4o数学推理能力飞跃4.6%:一种让AI在解题时"边做边学"的革命性方法

上海AI实验室团队提出BoostStep方法,通过步骤级情境学习显著提升大语言模型数学推理能力。该方法在AI解题过程中实时提供精准指导,而非传统的完整例题参考,在GPT-4o上实现4.6%性能提升,超越传统方法的1.2%。研究发…详细

人工智能数学推理步骤级学习

2025-09-16 11:06:47
Spotify将允许免费用户挑选和播放指定歌曲

Spotify宣布为全球免费用户推出新功能,允许他们搜索并播放任意歌曲,或播放朋友和关注艺人分享的音乐。新功能包括"Pick & Play"、"Search & Play"和"Share & Play"。尽管如此,免费用户仍有每日点播时长限制,超出后…详细

音乐流媒体用户体验优化商业模式创新

2025-09-16 10:35:06
北京航空航天大学 鲲鹏昇腾科教创新孵化中心揭牌,推动中国自主计算生态建设

9月11日,北京航空航天大学与华为技术有限公司签署合作协议,宣布“北京航空航天大学 鲲鹏昇腾科教创新孵化中心”(以下简称“孵化中心”)正式揭牌成立。…详细

2025-09-16 10:31:52
清华大学发现:当前顶级AI视频模型连"跳跃"都看不懂!MotionBench揭示视频理解盲区

清华大学研究团队通过MotionBench发现,当前最先进的AI视频理解模型在精细动作理解方面存在严重不足,准确率不足60%。他们提出的通过编码器融合技术TE Fusion有效改进了这一问题。这项研究揭示了视频AI理解的基础能力…详细

人工智能视频理解通过编码器融合

2025-09-16 10:31:39
上海人工智能实验室重磅发布:视频AI距离理解真实世界的在线视频还有多远?

上海人工智能实验室联合多家机构推出OVO-Bench评测体系,首次系统评估视频AI的在线理解能力。研究发现当前最先进的模型如GPT-4o在实时视频理解任务中表现远不如人类,缺乏时间感知、实时记忆和主动响应能力。该研究为…详细

视频理解在线视频处理人工智能评测

2025-09-16 10:31:25
华中科技大学团队破解AI绘画难题:让图像生成模型既快又好的秘密武器

华中科技大学团队破解了AI绘画系统中长期存在的优化困境:高质量图像重建与高效图像生成之间的矛盾。他们提出的VA-VAE技术通过视觉基础模型对齐,让图像压缩器在保持高精度的同时为生成器提供更易学习的环境。结合Li…详细

潜在扩散模型图像生成优化训练效率提升

2025-09-16 10:31:11
香港中文大学团队首次让AI绘画也能像人类一样"边画边思考"

香港中文大学团队首次将"链式思维推理"技术应用于AI绘画领域,教会AI像人类画家一样"边画边思考"。通过开发专门的PARM评估模型和多种训练策略,让AI绘画在复杂场景描述上提升24%,超越知名的Stable Diffusion 3模型1…详细

人工智能链式思维推理潜力评估奖励模型

2025-09-16 10:30:57
从看电视到AI眼中的世界:Meta和UC Berkeley如何让机器像人类一样"看"视频

Meta和UC Berkeley联合研究团队开发了名为Toto的AI模型,通过"看前猜后"的方式学习理解视频。该模型观看了超过十万小时视频内容,在图像分类、视频理解、物体跟踪和机器人操作等多个任务中表现出色,甚至自然涌现了"…详细

视频理解自回归预训练多模态学习

2025-09-16 10:30:42
清华大学联合团队发布重磅报告:大语言模型如何学会推理,距离真正的AI思考还有多远?

清华大学联合多所知校发布的这项重磅研究全面分析了大语言模型推理能力发展现状,深入探讨了强化学习如何让AI学会思考。研究涵盖了从数据构建到模型训练、从测试时增强到开源项目的完整技术图景,特别分析了OpenAI o…详细

人工智能强化学习大语言模型

2025-09-16 10:30:20
微软亚洲研究院重磅突破:让大模型用上4位浮点数训练,算力压缩四分之三

微软亚洲研究院提出首个FP4量化训练框架,通过可微分梯度估计器和离群值处理技术,在保持模型性能的同时实现接近4倍的计算加速。该技术在130亿参数模型上验证有效,为降低大模型训练成本、促进AI技术普及提供了新路径…详细

人工智能量化训练算力优化

2025-09-16 10:30:03
哈佛与浙江大学联手突破:AI绘画新技术让多物体精准放置成为现实

这项由哈佛医学院和浙江大学联合开发的3DIS-FLUX技术,成功解决了AI绘画中多物体精确控制的难题。通过将复杂任务分解为布局规划和精细渲染两个阶段,并采用创新的注意力控制机制,该技术实现了比现有方法高出41%的成…详细

多实例图像生成FLUX模型注意力控制机制

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章