科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-07-01 15:53:37
沙特32B医疗AI突破:Gazal-R1凭借双阶段训练击败12倍大模型

沙特TachyHealth团队开发的32亿参数医疗AI模型Gazal-R1,通过创新的双阶段训练方法在医疗推理任务上超越了12倍大的模型,在MedQA等测试中取得87.1%的优异成绩,展现了精巧训练策略胜过规模扩张的重要启示,为资源有限…详细

医疗人工智能强化学习参数高效微调

2025-07-01 15:53:15
奥地利医科大学团队的"视觉魔法师":用文字描述让眼科AI模型变得更聪明

奥地利维也纳医科大学研究团队开发了RetFiner技术,通过让眼科AI模型同时学习OCT图像和医疗文字描述,显著提升了诊断准确率。该方法采用四种训练任务让AI模型建立图像与文字的深层联系,在三个主流眼科AI模型上实现了…详细

视网膜诊断多模态学习医学人工智能

2025-07-01 15:52:58
BlenderFusion:谷歌DeepMind让普通图片秒变3D魔法工场

这项由谷歌DeepMind研究团队开发的BlenderFusion技术,实现了将普通2D照片转换为可精确编辑的3D场景的突破。该系统通过三步流程:物体分层提取、Blender 3D编辑、生成式合成,解决了传统图像编辑中控制精度与真实感之…详细

3D视觉编辑生成式图像合成多模态AI技术

2025-07-01 15:52:41
当AI开始懂电影:上海人工智能实验室重新定义机器视觉的电影语言理解

上海人工智能实验室联合多所高校开发出首个AI电影语言理解评测平台ShotBench,发现当前最先进AI模型在专业视觉理解方面存在重大缺陷。团队构建7万样本数据集ShotQA,开发出突破性模型ShotVL,在电影语言理解上创造新…详细

人工智能计算机视觉电影语言理解

2025-07-01 15:52:18
西安交通大学DenseDiT:让AI在现实世界"看图说话"不再是天方夜谭

西安交通大学研究团队开发了DenseDiT,一个基于生成式AI的视觉分析框架,能在仅使用15张训练图片的情况下处理25种复杂现实场景的视觉任务。该系统巧妙利用已训练生成模型的视觉知识,通过参数复用和轻量级分支设计,…详细

人工智能计算机视觉数据高效学习

2025-07-01 15:50:07
瑞金医院联合华为开源RuiPath病理模型,加速行业智能化落地

6月30日,由上海交通大学医学院附属瑞金医院(以下简称“瑞金医院”)主办、华为技术有限公司协办的“瑞金医院RuiPath病理模型开源及成果发布会”在上海举行。…详细

2025-07-01 15:02:51
瞄准AGI等四大前沿领域,蚂蚁集团2025“蚂蚁InTech奖”提名启动

蚂蚁集团正式启动2025“蚂蚁InTech奖”提名推荐工作,面向计算机科学领域的优秀青年学者与在读博士生,提供公益性科研资金支持。…详细

蚂蚁

2025-07-01 15:00:58
红帽OpenShift Lightspeed正式发布,生成式AI助力混合云生产力提升

全球领先的开源解决方案提供商红帽公司近日宣布正式发布红帽OpenShift Lightspeed。该产品是一款基于生成式AI(gen AI)的虚拟助手,已集成至红帽OpenShift。…详细

红帽

2025-07-01 15:00:26
让创新创造被更多看见,2025Inclusion·外滩大会创新者舞台全球征集正式启动!

2025Inclusion·外滩大会创新者舞台公开征集创新项目,企业、团体、个人皆可报名。…详细

外滩大会

2025-07-01 14:56:59
安富利:30载深耕中国市场,长期主义构筑可持续发展护城河

在电子行业百年发展长卷中,创立于1921年的安富利,始终以行动印证着企业创造社会价值的重要意义。…详细

安富利

2025-07-01 14:30:02
开亚客与亿客行竞相开发AI旅行智能体,将社交媒体转化为行程规划

旅游预订巨头Kayak和Expedia正在开发基于AI的智能旅行助手,能够将社交媒体内容转化为实际行程。Kayak推出了基于ChatGPT的AI聊天助手,提供个性化旅行规划服务。Expedia则发布了Trip Matching功能,用户可发送Instag…详细

人工智能智能体技术个性化服务

2025-07-01 14:28:48
AI重塑电商格局:亚马逊沃尔玛百思买面临变革挑战

传统大型在线零售商的时代即将结束。OpenAI、Gemini等AI助手正在重新定义购物方式,消费者不再从零售商主页开始购物之旅。AI成为策展人和购物向导后,传统数字商城将面临死亡。这与十年前社交媒体颠覆新闻媒体的情况…详细

人工智能电子商务商业模式创新

2025-07-01 14:16:51
香港大学团队突破多图理解难题:让AI像人类一样"看懂"图像之间的细微差别

香港大学团队开发了MiCo多图对比框架,通过自监督学习让AI学会像人类一样比较多张图片的细微差异。该方法无需人工标注,仅使用图像内在约束作为监督信号,在多项视觉理解测试中超越了GPT-4o等先进模型,为解决AI多图…详细

人工智能多图推理自监督学习

2025-07-01 14:16:33
突破性空间推理技术:伊利诺伊大学研究团队开发出让AI"看懂"空间关系的新方法

这项由伊利诺伊大学香槟分校研究团队开发的突破性AI技术,首次让机器具备了类似人类的空间推理能力。通过创新的细粒度偏好优化训练方法,SpatialReasoner-R1不仅能准确判断图片中的空间关系,还能提供完整的逻辑推理…详细

空间推理偏好优化视觉语言模型

2025-07-01 14:16:18
噪声一致性训练:让AI绘画工具一步到位的香港科技大学新突破

香港科技大学团队提出噪声一致性训练(NCT),这是首个专为一步生成器设计的原生控制添加方法。NCT通过在噪声空间进行一致性训练和边界约束,无需重新训练基础模型即可为预训练的一步生成器添加新的控制能力。实验显…详细

人工智能图像生成一步生成器

2025-07-01 14:16:03
南开大学团队推出LLaVA-Scissor:让AI视频理解快如闪电的"语义剪刀"技术

南开大学团队开发的LLaVA-Scissor技术通过创新的"语义连通组件"算法,实现了视频AI理解的高效压缩。该技术采用两步时空压缩策略,在保持99.7%准确率的同时将计算量减半,为解决视频AI系统计算瓶颈提供了突破性方案。…详细

视频理解标记压缩语义连通组件

2025-07-01 14:15:47
伊利诺伊大学新突破:让AI像搭积木一样改变照片中的物体位置

伊利诺伊大学研究团队开发出"生成式积木世界"系统,通过将照片分解成3D几何积木,让用户能够直观地编辑图像中物体的位置、大小和角度,同时保持原有质感。该技术突破了传统图像编辑在3D空间操作上的限制,为专业设计…详细

图像编辑3D空间操作AI图像生成

2025-07-01 14:15:30
NewsBreak团队推出DuaShepherd:让AI数学推理更聪明的双重奖励系统

NewsBreak团队与伊利诺伊大学合作开发DuaShepherd,这是一个创新的AI数学推理奖励模型。该系统独创性地结合了两种评估维度:步骤正确性判断和解题潜力评估,通过多任务学习和复合概率融合,在MATH500和ProcessBench测…详细

人工智能数学推理多任务学习

2025-07-01 14:15:05
YouTube移动视频编辑器即将登陆iOS平台

谷歌正准备将YouTube Create视频编辑应用带到iOS设备,距离该应用在Android平台独家发布已近两年。招聘信息显示,谷歌正在印度积极招聘工程师开发iOS版本。尽管YouTube Create提供免费移动视频编辑工具,但在与ByteD…详细

人工智能移动应用开发市场竞争分析

2025-07-01 14:12:46
伊利诺伊大学团队突破传统动画技术:让虚拟角色拥有真实的物理身体

伊利诺伊大学团队开发了PhysRig系统,突破传统角色动画技术局限。该系统通过嵌入真实物理原理,将虚拟角色建模为具有弹性材料特性的立体结构,解决了传统线性混合蒙皮技术中的体积变形、不自然弯曲等问题。研究创新性…详细

物理仿真角色动画材料建模

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章