科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-08-19 12:37:31
史丹佛AI突破:一秒钟预测十年后——机器学习中的超越人类能力边界探索

史丹佛大学AI实验室的突破性研究显示,机器学习模型在复杂时间序列预测任务中展现出超越人类专家的能力。研究涵盖金融、气候、生物三大领域,AI预测准确率比人类专家高出15-25%,处理速度从几天缩短至几秒。这一发现…详细

人工智能深度学习超越人类预测

2025-08-19 12:36:27
首个生成全身数字人的超级AI模型!斯坦福等顶尖高校联手,让静态照片瞬间"活"起来

斯坦福大学等顶尖机构联合研发的MegaPortrait技术实现重大突破,首次让单张静态照片生成高质量全身动态视频成为现实。该技术通过创新的AI架构,能够从一张照片中推断人物特征并生成自然流畅的动作和表情,在视频质量…详细

人工智能计算机视觉深度学习

2025-08-19 12:36:09
当AI开始从声音就能"看出"你的样子:复旦团队揭秘音频重建人像的神奇技术

复旦大学研究团队开发出突破性AI技术,能够仅通过声音重建说话者面部图像。该技术基于声音特征与面部结构的生理关联,使用多层深度学习系统实现声音到图像的精确映射。测试显示生成图像与真实面孔高度相似,在执法、…详细

人工智能深度学习多模态技术

2025-08-19 12:35:48
多模态AI学会了自己"动手":清华、科大携手Kwai发布会自主编程处理图像的智能助手

清华、中科大联合Kwai团队开发的Thyme系统实现了多模态AI的重大突破,让AI模型具备了自主编写代码处理图像和进行数学计算的能力。通过创新的两阶段训练策略和GRPO-ATS算法,Thyme在近20个评测基准上都表现出显著性能…详细

多模态大语言模型代码生成强化学习

2025-08-19 12:35:22
中科院软件所首创"论文树状图书馆":让科研搜索像点餐一样精准到位

中科院软件所开发的PaperRegister系统通过分层索引技术革新学术论文搜索,将传统基于摘要的粗粒度检索升级为支持技术细节的精细化搜索。该系统为每篇论文建立树状信息结构,从概况到具体实现细节分层组织,配合智能视…详细

人工智能学术搜索信息检索

2025-08-19 12:35:08
南洋理工大学最新突破:让静态3D模型"活"起来,自动骨骼绑定与动画生成技术

南洋理工大学研究团队开发了名为Puppeteer的自动化系统,可将静态3D模型转换为完整的动画资产。该系统包含自动骨骼生成、智能皮肤绑定和视频引导动画制作三大核心功能,基于5.94万个高质量样本的大规模数据集训练。相…详细

3D动画制作自动骨骼绑定视频引导动画生成

2025-08-19 10:46:28
香港中文大学团队让AI成为卡通制作神器:一张图加几笔线稿就能生成完整动画片

香港中文大学等机构联合研发的ToonComposer系统实现了动画制作的重大突破,仅需一张彩色图片和几张线稿草图即可自动生成完整卡通动画。该系统通过稀疏草图注入机制和空间低秩适配器技术,将传统的中间帧绘制和上色工…详细

人工智能图像生成动画制作

2025-08-19 10:40:49
新加坡南洋理工大学重新定义3D重建:像智能手机看视频一样理解三维世界

新加坡南洋理工大学研究团队开发的STREAM3R系统革命性地改变了3D重建方式,采用流式处理技术像阅读故事一样按序处理图像,而非传统的同时处理所有图像。该系统实现每秒12-33帧的实时处理速度,准确度高达94.7%,特别…详细

3D重建流式处理实时计算

2025-08-19 10:40:37
阿里巴巴发布最强语言模型挑战者:扩散模型能否颠覆ChatGPT?

阿里巴巴AI实验室发布扩散语言模型综述,揭示了一种可能颠覆ChatGPT的新技术。该技术采用并行生成方式,不再逐词生成文本,而是像画家作画般同时处理多个位置,实现数倍速度提升。最新模型LLaDA-8B性能已接近LLaMA3-…详细

人工智能扩散模型语言生成

2025-08-19 10:40:23
日本大阪大学和捷克技术大学联合研究:CLIP能"读出"你的相机型号?揭秘AI模型中隐藏的图像痕迹

日本大阪大学和捷克技术大学研究发现,CLIP等AI视觉模型能从图像中识别相机型号、压缩方式等技术细节,准确率超80%。这种能力会影响模型对图像语义的判断,导致检索和识别结果出现偏差。研究分析了47种模型,发现视觉…详细

计算机视觉视觉编码模型模型偏差

2025-08-19 10:19:47
慕尼黑工业大学重磅发现:AI隐私保护与解释性能否双全?

慕尼黑工业大学研究团队首次系统性探讨了AI系统中隐私保护与解释性之间的关系,发现两者并非完全对立。通过对三种差分隐私方法和四种解释技术的大规模实验,研究证明在特定条件下适度隐私保护可提升解释质量,并提出…详细

人工智能差分隐私后验解释性

2025-08-19 10:19:29
StepFun团队发布NextStep-1:让机器像人类一样逐步生成图像的新突破

StepFun团队发布的NextStep-1代表了AI图像生成领域的重要突破,采用自回归方式逐步生成图像,像艺术家作画般一点点构建视觉内容。这个14B参数的模型在多项测试中表现优异,不仅能高质量生成图像,还具备强大的编辑能…详细

人工智能自回归模型图像生成

2025-08-19 10:19:15
腾讯WeChat AI团队重磅推出PRELUDE:一个真正需要"读懂故事"才能解题的AI评测基准

腾讯WeChat AI团队联合多所高校发布PRELUDE评测基准,这是首个专门测试AI长文本真实理解能力的评测系统。通过让AI判断虚构角色前传是否与原著一致,该研究发现现有先进AI模型在深度文本理解方面仍比人类低15个百分点…详细

人工智能长文本理解模型评测

2025-08-19 10:18:56
蚂蚁集团推出UI-Venus:让AI也能像人一样"看懂"并操作电脑界面

蚂蚁集团推出UI-Venus系统,这是一个能够仅通过屏幕截图就理解和操作用户界面的AI模型。该系统采用强化微调技术,在多个基准测试中达到业界最佳水平,其72B版本在界面识别任务上准确率达95.3%,在复杂的安卓操作任务…详细

人工智能强化学习用户界面

2025-08-19 10:18:43
西安交通大学与蚂蚁集团联合发布:AI如何真正理解人类情感并给出贴心回应

西安交通大学与蚂蚁集团联合发布HumanSense研究,首次建立了AI情感智能的系统性评估框架。通过3882道真实场景测试题,研究发现当前最先进AI在人际互动理解方面仍有巨大提升空间,人类得分87.5%而AI仅57.8%。研究团队…详细

人工智能多模态推理情感计算

2025-08-19 10:18:30
上海交通大学开创口译自动评估新纪元:让AI解释为什么给你打这个分

上海交通大学研究团队开发出首个可解释的口译自动评估系统,解决了传统AI评估"黑盒子"问题。该系统通过SHAP技术不仅能准确评分,还能详细解释评分依据,为学生提供个性化学习建议。研究采用数据增强技术克服样本不足…详细

口译评估可解释人工智能SHAP分析技术

2025-08-19 10:03:39
谷歌Gemini大模型登陆甲骨文云平台

谷歌Gemini模型登陆甲骨文云,标志着企业AI应用的重要转变。该集成允许企业用户通过甲骨文云基础设施直接访问Gemini模型,而非仅作为外部API。甲骨文采用多供应商策略,为客户提供更灵活的模型选择。这一合作使Gemin…详细

人工智能云计算跨云集成

2025-08-19 10:03:14
Linux的微内核替代方案?Debian/Hurd证明微内核Unix梦想仍在继续

Debian GNU/Hurd 2025是基于Mach微内核的实验性操作系统最新版本。该版本首次提供可用的x86-64版本,支持USB磁盘和CD驱动器,移植了Rust语言,具备"相当可用"的SMP支持,能够运行约72%的Debian软件包。虽然这是一个高…详细

操作系统微内核技术实验系统

2025-08-19 10:03:01
你的每一个问题、每一条评论,我都在记录

最近OpenAI用户震惊地发现他们的搜索记录出现在Google搜索中。实际上OpenAI明确告知了这一做法,但多数用户未仔细阅读条款。虽然OpenAI已移除相关功能,但因版权诉讼的法院命令,所有用户对话仍被保留。Google的Gemi…详细

人工智能数据隐私用户记录保存

2025-08-19 09:57:59
2035年最热门的十大颠覆性产业

文章分析了2035年可能改变游戏规则的十大产业:包括量子计算和神经形态计算等新一代计算机技术、太空商业化、个性化基因医疗、空间计算与脑机接口、城市农业、空中交通管理、海水淡化技术、沉浸式娱乐、器官按需制造…详细

人工智能量子计算新型算法

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章