牛津大学研究团队发现大型语言模型存在"深度诅咒"现象:深层网络对模型贡献微乎其微,造成计算资源浪费。研究揭示Pre-LN架构中方差指数增长是根本原因,并提出层归一化缩放(LNS)解决方案。LNS通过简单的缩放因子控…详细
从11岁就梦想造人形机器人的Bernt Bornich,用'huggable'形容他的Neo Gamma机器人——这个能举起150磅的66磅'运动员',正以家庭为试验场突破AI学习瓶颈:'工厂20小时就触及学习天花板,而家庭环境的多样性才是通往AG…详细
这场变革在加速各行业数智化转型进程的同时,直接催生了算力需求的快速攀升,尤其是对智能算力的需求呈现出“爆发式”增长态势。…详细
在当今数字化时代,操作系统是企业 IT 架构的核心,其稳定性和安全性直接关系到业务连续性。…详细
开学进入倒计时!面对新校园、新课程、新朋友,是不是既充满期待、又对“新手村任务”心情忐忑呢?宿舍生活需要准备哪些东西?社团面试i人如何破冰?学校周边有哪些好吃的?军训防晒怎么更有效?鸿蒙系统级智能体小艺…详细
从金冠到雅客、友臣、蜡笔小新,这些曾风靡小卖铺与超市货架的老牌零食厂商,一度因渠道滞后、品牌老化而淡出人们视野。而如今,它们在拼多多上正迎来一场集体复兴。…详细
斯坦福大学研究发现,主要用英语训练的大型语言模型竟能自发学会处理其他语言任务,无需明确教学。这种跨语言迁移能力随模型规模增大而显著提升,通过形成"通用语义空间"实现不同语言间的知识迁移。研究为降低多语言…详细
8 月 13 日至 16 日,以 “绿动算力 超智融合” 为主题的第 21 届 CCF 全国高性能计算学术大会(CCF HPC China 2025)在鄂尔多斯国际会展中心盛大举办并圆满落幕。…详细
在刚刚闭幕的第八届世界人工智能大会(2025 WAIC)上,各式各样的机器人活跃于展馆内外,智能网联的自动驾驶汽车在会场间往来穿梭,大模型与智能体也纷纷嵌入各类机械设备和边缘盒子,以“软硬件一体化”之姿,生动展…详细
随着谷歌搜索和亚马逊主页在电商领域影响力下降,AI助手如ChatGPT、Claude等成为消费者新的购物入口。品牌必须掌握生成式引擎优化(GEO)技术才能保持可见性。传统SEO策略已失效,AI系统更青睐结构化、问答式的高质量内…详细
2025年第一季度网络攻击激增126%,英国新法案要求数据中心强制报告网络安全事件。现代威胁已演变为同时攻击IT和OT系统,而许多数据中心的备用电源系统仍使用90年代的过时技术。电池储能系统(BESS)通过分布式架构、加…详细
阿姆斯特丹大学与Salesforce合作开发的奖励引导推测解码(RSD)技术,通过让小模型处理简单任务、大模型解决复杂问题的智能分工,在保持推理准确率的同时大幅提升计算效率。该技术在数学推理等任务中表现出色,计算量…详细
微软研究院开发出LongRoPE2技术,能让大型语言模型的记忆容量扩展64倍至12.8万字,同时保持98.5%的原有性能。该方法通过发现AI位置编码训练不均衡问题,采用智能搜索和混合训练策略,仅用传统方法八十分之一的资源就…详细
华中科技大学联合地平线机器人开发RAD自动驾驶训练系统,首次将3D高斯点云渲染技术应用于强化学习,在逼真虚拟环境中让AI通过试错学习驾驶技能。该方法巧妙结合模仿学习与强化学习,将碰撞率降低3倍至8.9%,同时保持…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。