在生成式AI浪潮席卷各行各业的今天,企业纷纷探索如何借助AI提升生产力、优化运营流程。然而,真正将AI深度融入业务环境、实现规模化应用并持续创造价值的企业,尚不足5%。工具分散、入口不一、知识协同困难、数据孤…详细
传统测试模式普遍存在三大痛点:高度依赖人工操作、维护成本居高不下以及技术要求门槛较高。这些因素仍在制约着大多数企业的测试效率提升。随着AI测试技术的不断发展,软件质量保障体系正在重构。…详细
在软件开发的世界中,测试一直是一座难以彻底翻越的大山。它至关重要,却往往受限于人力、时间和技术门槛,成为产品迭代中隐蔽却关键的瓶颈。…详细
微软与Anthropic达成合作协议,为Microsoft 365 Copilot用户提供Claude AI引擎选项。商业版Frontier Copilot用户可选择Claude Opus 4.1和Sonnet 4等模型,但需管理员权限。这标志着微软正在超越OpenAI,采用更开放的…详细
日前,第四届全球数字贸易博览会在杭州盛大启幕。作为产业技术的全球领导者,施耐德电气以“数智光控、卓效领航”为主题,携全套KNX能源管理方案重磅亮相智慧空间展区,并分享前沿洞见,深度剖析KNX技术发展趋势、KN…详细
哥本哈根大学等机构研究发现,主流视觉语言模型在将图像转换为文字描述时会丢失40%-90%的视觉信息。研究开发了两种创新方法来量化这种信息丢失:邻居关系分析和嵌入重建技术。实验表明信息丢失直接影响AI的检索和问答…详细
阿联酋研究团队创建了PersonaX数据库,包含超过1.3万人的多模态性格分析数据。通过整合面部照片、背景信息和AI生成的行为特征描述,研究首次实现了大规模的跨模态性格分析。团队开发的双层分析框架不仅能发现统计关联…详细
香港浸会大学团队开发了HumbleBench,这是目前最大的AI幻觉评估基准,包含22,831个测试题,专门评估多模态大语言模型的"认知谦逊"能力。与传统只测试选择正确答案的基准不同,HumbleBench的每个问题都包含"以上都不对…详细
香港科技大学研究团队提出GAPrune方法,通过双重评估机制实现AI模型的智能压缩。该方法结合Fisher信息和梯度对齐分析,在保持领域专业性的同时大幅降低计算资源需求。实验表明,GAPrune在50%参数削减下性能损失仅2.5…详细
印度理工学院研究员创建了首个专门评估心理健康AI伦理推理能力的数据集EthicsMH,包含125个涵盖保密信任、偏见识别、自主权冲突等核心伦理挑战的情境。通过人机合作构建方式和多维评估框架,该工具不仅能测试AI决策准…详细
亚马逊和圣母大学研究团队提出动态奖励权重调整方法,解决了大语言模型多目标训练中的固定权重局限性。该方法包括超体积引导和梯度优化两种策略,能根据不同目标的学习进度自动调整训练重点。在数学推理任务测试中,…详细
蒙特利尔理工大学研究团队开发了Visual-TableQA数据集,通过多AI协作生成2500个复杂表格和6000个推理问答对,仅成本不到100美元。该数据集专门训练AI理解表格图像的视觉布局和复杂推理,实验显示微调后的模型在多个基…详细
华为全联接大会2025期间,以“智启新航旅,畅行无忧途”为主题的全球航空分论坛在上海成功召开。…详细
华为全联接大会2025期间,以“不眠智慧港,货运不停歇”为主题的港口圆桌会议在上海成功举办。会议旨在推动港口与AI等前沿技术深度融合,提升运营效率与安全管控水平。…详细
智慧物流“1+N”解决方案,实现了应用标准化、数据平台化、枢纽网络化、投资集约化、作业智慧化、运营可视化,让冷链供应链全链条可视可控可管,运营管理更高效。…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。