苹果公司研究团队通过精心设计的拼图游戏实验,揭示了当前"思维型"AI模型的真实能力边界。这些模型在简单问题上反而表现不佳,只有在中等复杂度问题上才显示优势,而在困难问题上会完全崩溃并减少思考时间。更令人震…详细
斯坦福大学研究团队提出Cartridges技术,通过"自学"训练方法将长文档知识压缩成小型数据包,使AI处理长文档时内存消耗降低38.6倍,运行速度提升26.4倍,同时保持回答质量。该方法采用预处理思路,让AI提前学习文档内…详细
蚂蚁集团研究团队提出了γ-PO方法,通过动态调节AI训练中的目标边距来提升大语言模型对齐效果。该方法能够自动识别训练数据中答案质量差距的大小,对明显好坏的答案对加大学习强度,对模糊不清的答案对适当降低学习强…详细
UCLA研究团队开发了名为Dreamland的创新系统,能够将简陋的计算机模拟画面转换为逼真的真实世界图像。该系统采用分层世界抽象方法,巧妙结合物理模拟器的精确控制和生成式AI的视觉质量,在图像质量和可控性方面分别提…详细
生成式 AI 普及激增的同时,企业面临风险加剧。CrowdStrike 与 Nvidia 联手,将安全防护深度嵌入 AI 全生命周期,实现实时监控和零信任保护。…详细
Vast Data推出面向AI的数据存储平台,目前正寻求新一轮融资,目标估值250亿美元,远超此前9B美元的估值。平台整合各类数据,加速检索、降低模型训练成本,吸引众多资本关注。…详细
文章介绍 AWS 数据中心峰会要点,指出 AI 与云基础设施已转变为国家战略重点,依托巨额投入和公私协作推动公共服务与经济转型。…详细
6月11日-13日,第十八届 (2025) 国际太阳能光伏与智慧能源大会暨展览会(简称SNEC)在国家会展中心(上海)隆重举行。…详细
Dia 预置 AI 功能应对传统浏览器面临压力,整合搜索、问答和自动编程等任务,通过邀请制内测,为用户提供一站式 AI 交互体验。…详细
6月11日,2025火山引擎原动力大会·春在北京国家会议中心举办。本次大会聚焦大模型与AI云原生等前沿技术,深入探讨AI转型机遇与创新产品落地路径。…详细
Pinterest正在试验一项自动拼贴功能,利用AI将产品图片智能组合成交互性拼贴图,不仅省时省力,还提高了用户参与度,同时更新的趋势工具协助预测消费者购买需求。…详细
本文讲述数字孪生与 AI 融合,利用数字孪生模型模拟 CPU、疾病、网络及商业流程,通过数据驱动实现故障诊断、网络安全防御及运营决策,展现其在企业数字化转型中的巨大潜力。…详细
文章探讨企业搜索由单纯关键词匹配向语义理解及自主AI代理转变,通过向量搜索、知识图谱、NL2SQL与RAG技术,实现数据整合与高效决策。…详细
文章探讨了从建设、运营到退役全过程的数据中心环境影响评估方法,旨在全面揭示数字基础设施的真实环境成本,同时分析其优缺点及潜在数据滥用风险。…详细
复旦大学联合多所知名院校开发了GeometryZero模型,通过创新的群体对比策略优化(GCPO)方法,让小尺寸AI模型具备了类似数学专家的几何推理能力。该模型能智能判断何时使用辅助构造工具,在多个几何基准测试中表现优…详细
特拉维夫大学研究团队发现AI在思考时具备类似人类的"进度感知"能力,并开发出"超频"技术让AI思考更高效。通过提取AI内部的"思考进度向量",不仅能实时显示AI的思考进展,还能主动调节思考速度。实验显示该技术在数学…详细
华南理工大学研究团队构建了迄今最大的中文字符识别数据集MegaHan97K,包含97,455个汉字类别和超过460万个样本,是此前最大数据集的六倍。该数据集首次完全支持最新的GB18030-2022中文标准,通过手写、历史文献和合成…详细
武汉大学团队开发了EVOREFUSE系统,通过进化算法生成能触发AI过度拒绝的伪恶意指令。研究发现AI存在"捷径学习"问题,过度关注敏感词汇而忽略语境。团队创建的测试数据集在9个模型上的触发率比现有最佳方案高140%,训…详细
中科院团队首次开发出1比特视觉-语言-动作模型BitVLA,实现机器人智能操作的革命性突破。该模型将每个参数限制为{-1,0,1}三值表示,通过创新的蒸馏感知训练策略,在仅使用29.8%内存的情况下达到与先进模型相当的性能…详细
新加坡科技大学研究团队发现小型AI语言模型存在"长思维链退化"现象:当用少量复杂推理样本训练时,模型性能反而大幅下降。研究显示用8000个样本训练的小模型准确率可降75%,但大规模训练(12万+样本)配合强化学习能…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。