微软研究院突破性AI编程技术RPG能够像建筑师绘制蓝图一样规划整个软件项目,通过图形化结构替代模糊的自然语言描述,实现从零开始构建大规模代码库。ZeroRepo系统基于RPG生成的代码平均达3.6万行,比竞争对手多4倍,…详细
中科院团队发布BaseReward多模态奖励模型,通过系统性实验建立了构建高性能多模态奖励模型的完整方法论。该模型采用简洁的两层架构设计,在精心筛选的280万偏好数据上训练,在多个权威基准测试中创下新纪录,准确率提…详细
IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最…详细
意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美…详细
思科发布8223路由器,搭载自研Silicon One P200 ASIC芯片,提供51.2 Tbps带宽。结合800 Gbps相干光学技术,可支持1000公里跨度连接。该架构理论上可实现3 EB/s聚合带宽,足以连接当今最大的AI训练集群,支持数百万GP…详细
GPU租赁公司CoreWeave发布无服务器强化学习平台,旨在让企业更容易使用强化学习技术。该平台基于其收购的OpenPipe和Weights & Biases构建,客户无需手动配置虚拟机或裸机服务器,仅需为生成的令牌付费。据称该方案比…详细
微软研究院提出潜在分区网络(LZN),首次实现生成建模、表示学习和分类任务的真正统一。该框架通过共享高斯潜在空间和创新的潜在对齐机制,让原本独立的AI任务协同工作。实验显示LZN不仅能增强现有模型性能,还能独…详细
上海AI实验室开发的VLAC模型让机器人首次具备真实世界自主学习能力。该系统如同给机器人配备智能导师,能实时评估动作效果并从中学习。在四个操作任务测试中,机器人成功率从30%提升至90%,仅需200次练习。技术结合视…详细
台湾大学研究团队通过大规模人类听觉测试,首次系统评估了五个主流AI语音系统对自然语言指令的理解准确度。研究发现GPT-4o-mini-TTS在程度副词和情感强度控制方面表现最佳,但所有系统在年龄模仿和重音控制上都存在明…详细
康卡斯特和UCL研究团队开发了WhisTLE技术,解决语音识别模型在新领域适应中只能依赖昂贵语音数据的问题。该方法通过训练变分自编码器模拟语音编码器输出,实现仅用文本进行深度监督适应。实验显示平均降低12.3%词错误…详细
复旦大学团队开发出Ask-to-Clarify机器人框架,让机器人首次具备主动询问澄清模糊指令的能力。该系统采用双组件架构和两阶段训练策略,在8项真实任务中全面超越现有技术,成功率达90-98%。这一突破将机器人从被动执行…详细
苹果公司发布突破性AI模型Manzano,首次实现单一模型同时具备图像理解和生成能力。该模型采用创新的混合视觉标记器设计,通过统一的语义空间有效解决了传统多模态模型中理解与生成任务的冲突问题。在多项基准测试中,…详细
伊利诺伊大学团队开发出ROS-Cam系统,仅需普通RGB视频即可精确重建动态三维场景,无需激光雷达等额外传感器。该技术通过补丁式追踪过滤器、异常值感知优化和两阶段策略,在多个数据集上超越现有方法,处理速度提升2-…详细
小米研究院推出的BTL-UI是一个革命性的GUI智能代理框架,通过模拟人类"眨眼-思考-执行"的认知过程,让AI能够像人类一样自然地操作各种应用界面。该技术在多个基准测试中实现了显著性能提升,为未来的人机交互和自动化…详细
Y Combinator合伙人Ankit Gupta与Anthropic预训练负责人Nick Joseph最近进行了一次深度对话。…详细
随着 AI 正逐步走入办公与个人应用场景,用户对高性能轻薄本和高端商务本的需求正在发生变化。设备不仅要足够便携,还要能处理多任务和 AI 相关工作负载,这对设备性能、散热和续航都提出了更高要求。…详细
NBA中国将利用阿里云的人工智能和云计算服务,支持一系列数字球迷互动计划。双方将基于阿里巴巴通义千问大模型,开发一个专属AI模型。…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。