新加坡南洋理工大学团队提出Visual Jigsaw训练方法,通过图像拼图、视频片段重排和3D深度排序三种"拼图游戏"来提升AI模型的视觉理解能力。该方法无需改变模型架构,仅通过强化学习训练就能显著改善细节感知、时间推理…详细
哈佛医学院研究团队开发的ToolUniverse系统让普通人也能构建自己的AI科学家助手。该系统集成超过600种科学工具,能够自动搜索、使用和创造研究工具,支持从文献检索到实验设计的完整科学研究流程。在药物研发案例中,…详细
北大清华等研究机构联合发布RealUnify测试平台,首次系统评估统一多模态AI模型的协同能力。研究发现当前模型虽能同时处理理解和生成任务,但两种能力缺乏真正融合,在需要协同工作的复杂任务中表现远不如预期。这一发…详细
清华大学团队发布OpenGPT-4o-Image数据集,包含8万个精心设计的指令-图像配对样本,系统性地提升AI图像生成和编辑能力。该数据集首次建立了完整的能力分类体系,涵盖风格控制、复杂指令理解、文字渲染、空间推理和科…详细
浙江大学研究团队开发的EasySteer框架,通过操控AI模型内部"思维向量"实现精准行为控制,性能比现有框架提升5.5-11.4倍。该系统支持安全控制、推理优化等八大应用场景,提供完整工具套件和可视化界面,将AI控制从复杂…详细
北京人工智能研究院等机构联合开发了EditScore系统,解决了AI图像编辑评价难题。该研究建立了包含13种编辑任务的评价标准EditReward-Bench,开发了专业的AI评价模型EditScore,并首次在图像编辑领域成功应用强化学习…详细
浙江大学研究团队通过开发GSM8K-V视觉数学推理基准,发现了AI技术的一个重大盲点:最先进的视觉语言模型在处理图片形式的数学题时表现远不如文字版本。该研究将1319道数学题转换为连环画式的多图场景,测试结果显示即…详细
NVIDIA联合多所顶尖大学开发的SANA-Video模型实现重大突破,仅需RTX 5090显卡就能在29秒内生成5秒720p视频,速度比传统模型快16倍,成本降低99%。该模型采用线性注意力机制和固定内存设计,支持生成长达1分钟的高质量…详细
新加坡国立大学研究团队开发出SparseD技术,针对扩散语言模型的注意力机制进行优化。通过发现并利用注意力头的个性化模式、跨步骤的模式稳定性以及早期生成阶段的关键性,实现了在保持文本质量的同时将生成速度提升最…详细
伊利诺伊大学团队通过精心设计的字符串转换实验,证明大型语言模型能够通过强化学习学会组合已有技能形成新能力。研究发现仅提供组合数据还不够,必须配合强化学习才能激发真正的组合推理能力。这种技能还能跨任务迁…详细
清华大学团队开发出InfLLM-V2密集-稀疏可切换注意力框架,解决了大型语言模型处理长文本时的计算瓶颈问题。该技术能让AI模型根据文本长度自动调整注意力模式,实现4倍速度提升的同时保持98%以上的准确率。研究团队通…详细
上海AI实验室开发的SDLM技术革命性地解决了AI语言模型生成速度慢的问题。通过"下一序列预测"和智能置信度检测,SDLM能根据内容复杂程度动态调整生成长度,在保持高准确性的同时将生成速度提升一倍以上,为AI助手的实…详细
近日,高途集团与复旦大学人工智能创新与产业研究院(以下简称研究院)合作签约仪式在上海举行,高途集团AI研发部负责人金欣和复旦大学人工智能创新与产业研究院教授徐盈辉参与仪式,高途集团联合创始人罗斌现场见证…详细
为了确保生成内容的专业度,夸克算法团队已经与通义实验室成立了联合研发小组,专注于搜索推理与可信生成。…详细
近日,PTC全球资深副总裁兼大中华区总裁刘强先生通过官方公众号发表了题为《“数字主线+AI” 双驱助力智能制造》的精彩演讲。…详细
为了确保生成内容的专业度,夸克算法团队已经与通义实验室成立了联合研发小组,专注于搜索推理与可信生成。…详细
6G时代曙光初现,移动生态系统正迈入技术定义与协同创新的关键阶段。第三代合作伙伴计划(3GPP)、AI-RAN联盟及O-RAN联盟等组织正协同推进工作,共同塑造首个大规模人工智能(AI)原生无线网络。…详细
中国深圳,2025年10月22日 – 全球知名的可信身份与物理门禁解决方案供应商 HID 将于10月28-31日亮相在深圳举办的 2025 CPSE 安博会。…详细
这项由伊利诺伊大学厦巴纳-香槟分校和滑铁卢大学联合完成的研究,开发了名为VideoScore2的AI视频评估系统,能够像人类专家一样从视觉质量、文本对齐和物理一致性三个维度对AI生成视频进行详细评估,并提供透明的分析…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。