ByteDance Seed研究团队提出AttentionInfluence方法,让13亿参数小模型为70亿参数大模型筛选训练数据。该方法利用模型内部注意力机制判断数据质量,无需人工标注。实验显示在推理密集型任务上性能提升1.4-3.5%,展现…详细
Adobe研究院开发出让AI学会准确引用信息来源的新方法,通过简单的"对错判断"策略和注意力机制分析,显著提升了AI系统在归因任务上的表现,为解决AI"胡说八道"问题提供了实用解决方案。…详细
当前企业面临引入AI的机遇与挑战。管理层需要了解机器学习算法基础,包括线性回归、神经网络等核心技术。专家建议从小规模试点开始,优先选择高影响用例,投资数据治理,提升员工技能。对于影子IT现象,应将其视为机…详细
美国垃圾收集行业2024年创收690亿美元,近18万辆垃圾车每周运营六至七天,每日停靠超千次。设备故障成为行业最大隐性成本,每辆车年均故障费用超5000美元。AI技术通过实时监控传感器数据,能提前数周预测故障,优化零…详细
全球气候危机加剧之际,人工智能技术呈现双面性特征。一方面,AI可通过智能电网减少20%能源浪费,精准农业技术优化水资源利用,智能交通系统降低30%城市排放。另一方面,训练单个大型AI模型耗电数千兆瓦时,排放数百…详细
人工智能正在全面改变互联网,从ChatGPT的火爆到谷歌在搜索结果中嵌入AI摘要。本文整理了53个重要的AI术语,涵盖从基础概念到前沿技术的完整词汇表。包括人工通用智能、大语言模型、神经网络、机器学习等关键概念,以…详细
部分ChatGPT订阅用户发现工具列表中出现名为"Study Together"的新功能。该模式旨在提升教育工具效果,不直接提供答案而是引导用户思考并回答问题,类似谷歌LearnLM。用户猜测可能支持多人学习小组模式。ChatGPT在教育…详细
在数字浪潮席卷全球、科技产业变革加速的当下,网络安全已从单一技术议题,跃升为关乎国家战略、企业发展与个人安全的核心命题。…详细
在这个AI技术日新月异的时代,智能手机不再只是通讯工具或娱乐设备,而是逐渐进化为一个懂你所需、感知所想的智能服务中枢。而这场变革背后,一场由终端厂商共同发起的智慧服务生态建设正悄然拉开序幕。…详细
杜克大学研究团队开发了MOG-DFM技术,这是首个能够同时优化生物分子多种特性的AI系统。该方法成功解决了传统药物设计中"顾此失彼"的难题,能够设计出既安全又有效的治疗性分子。实验证明,MOG-DFM在肽类药物和DNA序列…详细
印度理工学院团队开发REFINE-AF框架,让小型AI模型通过强化学习自动生成训练指令,无需大量人工标注。该方法在119项测试任务中,63-66%的表现超越传统方法,证明了小模型也能通过巧妙设计获得优异效果,为降低AI训练…详细
港中文团队发布首个AI网站生成能力基准测试WebGen-Bench,评估结果显示即使最强模型准确率仅27.8%,但通过专门训练的WebGen-LM-32B模型达到38.2%,为AI建站技术发展提供重要参考。…详细
斯特拉斯堡大学团队提出POLAR方法,创新性地将多视角点云配准问题转移到自编码器潜在空间中求解。该方法专门设计了处理各向异性噪声、遮挡和外点的损失函数,并采用多起点优化策略实现全局收敛。在合成和真实数据上的…详细
该研究首次通过实验揭示了人类在战略博弈中如何对待大语言模型(LLM)对手。爱丁堡大学研究者发现,在p-美丽竞赛游戏中,人类面对LLM对手时会选择显著较低的数字,特别是增加了选择"零"的频率。高战略推理能力的参与者…详细
这篇研究来自丹麦奥尔堡大学的团队,探讨了大语言模型的推理过程如何影响事实准确性。研究者通过从高级推理模型中提取思考轨迹,并用知识图谱增强这些轨迹,然后对不同规模的模型进行微调并在六个数据集上测试。结果…详细
Qwen3是阿里巴巴Qwen团队发布的最新大语言模型系列,最大创新在于将"思考模式"和"非思考模式"融合到单一框架中,允许用户根据需求动态切换推理深度。模型规模从0.6B到235B不等,包括密集和混合专家架构,支持119种语…详细
南洋理工大学研究团队揭示了智能音箱存在安全隐患,可通过特制音频绕过唤醒词检测机制。这种"隐藏命令攻击"能让音箱执行普通人听不出的指令,潜在威胁家庭安全和隐私。研究通过逆向工程分析设备内部语音处理系统,发…详细
MLE-Dojo是一个创新的交互式环境,专为训练和评估大语言模型(LLM)在机器学习工程领域的能力而设计。由乔治亚理工学院和斯坦福大学研究者共同开发,这个类似健身房的框架基于200多个真实Kaggle竞赛,支持LLM代理通过结…详细
阿里巴巴Qwen团队首次进行全球最大规模人类偏好建模实验,使用1500万真实偏好样本训练AI理解人类喜好。研究发现偏好建模存在类似语言模型的缩放规律,AI在识别错误信息方面能力稳步提升,但在主观偏好判断上表现复杂…详细
研究团队通过DanceGRPO框架首次实现了不同视觉生成技术的统一优化,解决了AI生成内容与人类偏好不匹配的关键问题。该方法在多个权威基准测试中取得显著性能提升,部分指标改进达181%,为AI视觉生成技术的实用化应用奠…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。