CUDA Tile和cuTile Python打通了这个瓶颈。英伟达在开发者博客中提到,一个15行的Python内核性能可以媲美200行手动优化的CUDA C++代码。
中经记者 李玉洋 上海报道近日,英伟达CUDA迎来重大更新,正式推出NVIDIA CUDA 13.1,该公司AI开发者账号在社媒平台自我评价称:“这是20年来最大的一次更新。”《中国经营报》记者了解到,全新的编程模型CUDA Tile是CUDA 13 ...
作者:紫晗编辑:李宝珠转载请联系本公众号获得授权,并标明来源2025 年 12 月,在 CUDA 发布近二十年后,NVIDIA 推出新的 GPU 编程入口「cuTile」,通过 Tile-based 编程模型重构 GPU 内核,使开发者无需深入 ...
在 GPU 计算领域,CUDA 曾是无可替代的 "武林秘籍"—— 掌握它,就意味着手握 GPU 加速计算的钥匙。但 2025 年末,英伟达用 CUDA Toolkit 13.1 掀起了一场颠覆性变革,Tile 编程模型横空出世,让 GPU 编程从专业开发者的 "专属特权",变成了普通开发者触手可及的工具,堪称自 2006 年 CUDA 诞生以来最彻底的范式升级。
今年,英伟达可谓是全力押注,明确表示要确保 Python 成为 CUDA 并行编程框架中的“一等公民”。 多年以来,英伟达为 GPU 开发的 CUDA 软件工具包始终缺少原生 Python 支持,现如今这种情况终于有所转变。在近期的 GTC 大会上,英伟达宣布其 CUDA 工具包将为 Python ...
很少有人像他一样,在 通用CPU、移动SoC、车载SoC、AI加速器 上都做过一线设计和架构决策。近几年他频繁在TSMC、三星等论坛谈未来工艺与架构,被称为「半导体设计传奇」。
CUDA 13.1的意义,不仅在于新增功能或优化性能,更在于为构建新一代高层、跨架构的GPU计算库和框架奠定了基础,通过引入Tile IR和高层抽象,NVIDIA在硬件和软件之间增加了一个更厚的中间层。
IT之家 12 月 7 日消息,英伟达本周四发布了全新的 CUDA 13.1,这是自 2006 年 CUDA 平台问世以来规模最大的一次功能扩展更新。 英伟达介绍称,本次更新的重点在于引入了一种名为 CUDA Tile 的全新 GPU 编程方式,旨在让更广泛的开发者群体能够更轻松地运用强大的 AI 与加速计算能力。
硅谷人工智能公司Nexa AI发布端侧AI部署新思路,安卓,端侧,sdk,工具包,nexa,python ...
NVIDIA近日正式推出CUDA Toolkit 13.1版本,官方宣称这是该平台自2006年问世以来最具颠覆性的重大更新。此次升级引入基于分块(Tile)的编程模型、Green ...
11 天on MSN
NVIDIA再筑技术壁垒:CUDA 13.1携Tile模型开启GPU编程新纪元
NVIDIA近日正式发布了CUDA 13.1版本,官方称其为自2006年CUDA平台问世以来最具突破性的全面升级。此次更新最引人注目的创新是引入了基于数据块(Tile)的编程模型,将GPU编程范式推向更高层次的抽象阶段。传统GPU开发依赖单指令多线程(SIMT)架构,开发者需要手动管理线程分配、内存访问和同步机制等底层细节。而新推出的CUDA Tile模型允许开发者以数据块为单位组织计算任务,编译 ...
当前正在显示可能无法访问的结果。
隐藏无法访问的结果