科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-07-30 12:00:57
Skywork UniPic开源了!从零预训练打造图片生成、理解和编辑一体化模型,生图效果达SOTA

7月30日,昆仑万维正式推出并开源采用自回归路线的「多模态统一预训练模型 Skywork UniPic」,在单一模型中深度融合图像理解、文本到图像生成、图像编辑三大核心能力。…详细

2025-07-30 11:58:05
安全可靠 酝建未来 | 华为携手古井贡酒共建数据中心样板点,打造白酒行业数智新标杆

以“安全可靠 酝建未来”为主题的华为数据中心古井贡酒样板点发布会在亳州成功举行。…详细

2025-07-30 11:40:03
2025开放原子开源生态大会开源鸿蒙交流区亮点迭出,社区与伙伴单位共筑万物智联新图景

7月23日-24日,开放原子开源生态大会在北京国家会议中心二期盛大举办。开源鸿蒙主题演讲作为本次大会的核心分论坛之一,聚焦开源鸿蒙生态构建、技术创新与行业赋能等核心议题,深度剖析了开源鸿蒙在万物智联时代的无…详细

2025-07-30 10:43:11
微软与OpenAI谈判:确保AGI里程碑后技术访问权限

微软正与OpenAI进行高级谈判,旨在确保即使OpenAI实现通用人工智能后仍能继续使用其技术。据报道,双方谈判进展积极,可能在几周内达成协议。该协议将为OpenAI向完全商业化企业转型扫清关键障碍。微软已投资137.5亿美…详细

人工智能通用人工智能股权谈判

2025-07-30 10:41:27
Arcee推出企业级可定制AI模型AFM-4.5B,基于严格筛选的清洁数据训练

AI初创公司Arcee.ai发布45亿参数的企业级AI模型AFM-4.5B,采用严格筛选的清洁数据训练。该模型专为商业和企业用途设计,年收入低于175万美元的企业可免费使用。相比数百亿参数的大模型,AFM-4.5B在保持强劲性能的同时…详细

人工智能自然语言处理企业定制模型

2025-07-30 10:40:33
SOSV押注等离子体技术将改变半导体到航天器的一切

SOSV投资者认为等离子技术将成为从核聚变发电到半导体制造等多领域的关键工具。该公司计划未来五年投资超过25家等离子相关初创企业,并与新泽西州经济发展局和美国能源部普林斯顿等离子物理实验室合作开设新的Hax实验…详细

等离子体技术半导体制造新型应用

2025-07-30 10:38:25
Arm 洞察与思考:为什么 AI 向边缘迁移的速度超乎想象

Arm 最新发布了《AI 效率热潮:更小的模型与加速的计算正驱动 AI 无处不在》报告,该报告深度解析了驱动这一转变的核心因素,以及其如何重塑半导体、AI 和终端设备生态系统。…详细

ARM

2025-07-30 10:01:42
为创意写作量身定制:Midjourney团队如何让AI写作变得更有趣更多样化

这项由Midjourney团队主导的研究解决了AI创意写作中的关键问题:如何让AI既能写出高质量内容,又能保持创作的多样性和趣味性。通过引入"偏差度"概念和开发DDPO、DORPO两种新训练方法,他们成功让AI学会从那些被传统方…详细

人工智能创意写作优化算法

2025-07-30 10:01:14
改写多模态AI的"火眼金睛":上海AI实验室让机器学会逐步推理判断

上海AI实验室联合多所高校开发出VisualPRM系统,这是首个专门用于多模态推理的过程奖励模型。该系统能像老师批改作业一样逐步检查AI的推理过程,显著提升了AI在视觉推理任务上的表现。研究团队构建了包含40万样本的训…详细

多模态推理过程奖励模型AI逐步推理

2025-07-30 10:00:55
上海AI实验室团队提出LEGO-Puzzles:揭露多模态大模型在空间推理上的惊人短板

上海AI实验室团队通过LEGO积木设计了创新评测基准LEGO-Puzzles,系统测试了20个先进多模态大语言模型的空间推理能力。研究发现即使最强AI模型准确率仅57.7%,远低于人类93.6%的表现,揭示了当前AI在三维空间理解和多…详细

多模态人工智能空间推理LEGO积木评测

2025-07-30 10:00:39
字节跳动团队突破性成果:让AI记住你的脸,随心所欲重塑照片的新技术

字节跳动团队突破了AI图像生成领域的三大难题:身份识别不准确、文字理解偏差和图片质量不佳。他们开发的InfiniteYou技术采用创新的InfuseNet架构和多阶段训练策略,能够根据用户照片和文字描述生成高质量个性化图像…详细

人工智能图像生成个性化定制

2025-07-30 10:00:17
AI推理能力再次升级!新加坡国立大学团队发布多模态思维链推理全面调研报告

这份由新加坡国立大学等顶尖学府研究团队发布的调研报告,系统梳理了多模态思维链推理这一前沿AI技术的发展现状。该技术让AI具备了同时处理文字、图像、音频等多种信息并进行逐步推理的能力,在医疗诊断、自动驾驶、…详细

多模态推理思维链技术人工智能

2025-07-30 09:59:14
机器人也能从"失败"中学习?上海交大团队让机器人训练数据少用80%却更聪明

上海交大等机构联合提出ADC方法,通过双人协作的对抗性数据收集策略,让机器人仅用20%的训练数据就能获得更强的环境适应能力和指令理解能力。该方法引入"对抗操作员"在训练过程中制造视觉和语言扰动,迫使主操作员实…详细

机器人学习对抗性训练数据效率优化

2025-07-30 09:58:49
让静态人像"开口说话":Hedra公司推出MagicInfinite,用声音和文字让照片动起来

Hedra公司推出的MagicInfinite技术能够让静态人像照片"开口说话",支持通过声音和文字双重控制生成高质量动态视频。该系统采用3D全注意力机制和两阶段训练方案,可处理各种风格人像(真实照片、动漫、艺术作品),实…详细

人工智能数字人像动画视频生成技术

2025-07-30 09:58:27
视频生成AI的"读心术":VBench-2.0如何测试AI是否真的理解我们的世界

这项由上海人工智能实验室等多家机构联合开展的研究,开发了VBench-2.0评估系统,专门测试视频生成AI对真实世界的理解能力。与关注视觉效果的传统评估不同,VBench-2.0从人体逼真度、可控性、创造力、物理学和常识推…详细

视频生成AI深度评估人工智能

2025-07-30 09:57:43
大语言模型终于学会了边查资料边思考:Search-R1让AI像人类一样搜索推理

伊利诺伊大学研究团队开发的Search-R1系统让AI学会了像人类一样边思考边搜索的能力。通过强化学习,AI能够主动决定何时搜索外部信息、如何整合搜索结果进行推理。该系统在七个问答数据集上平均提升20-24%的准确率,代…详细

人工智能强化学习搜索推理

2025-07-30 09:51:47
斯坦福和伯克利联手出招:AI能看出你动作哪里不标准了!

斯坦福和伯克利研究团队推出VidDiff技术,让AI学会像专业教练一样精准识别动作差异。该技术通过三步走方法解决视频动作比较难题,构建了包含549对视频的大型数据集VidDiffBench。虽然当前AI模型准确率有限,但已展现…详细

人工智能视频动作分析多模态学习

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章