在这一成功背后,Neural Magic 扮演了关键角色。这家由 MIT 研究员创立的企业,在巨头林立的 AI 优化领域中,以独特的“免费平台 + 开源工具”策略脱颖而出。通过深入贡献 vLLM,Neural Magic ...
点击上方“Deephub Imba”,关注公众号,好文章不错过 !深度学习模型参数量和训练数据集的爆炸式增长,以 Llama 3.1 为例:4050 亿参数、15.6 万亿 token 的训练量,如果仅靠单 GPU可能需要数百年才能跑完,或者根本无法加载模型。并行计算(Parallelism)通过将训练任务分发到多个 ...
点击上方“Deephub Imba”,关注公众号,好文章不错过 !单机 PyTorch 模型跑推理没什么问题,但数据量一旦上到万级、百万级,瓶颈就暴露出来了:内存不够、GPU 利用率低、I/O ...
快科技9月25日消息,在2025年Computex大会上,AMD承诺将通过ROCm为Windows系统带来PyTorch支持,如今这一承诺终于兑现。 AMD发布了ROCm 6.4.4预览版本,为Windows系统下的Radeon RX 9000和RX 7000系列显卡以及Ryzen AI系列APU带来了PyTorch支持。 ROCm是由AMD开发的开源GPU计算生态系统 ...
v5 版本将 PyTorch 确立为唯一核心后端,并聚焦于四大维度的进化:极致的简洁性、从微调迈向预训练、与高性能推理引擎的互操作性,以及将量化提升为核心功能。
快科技10月31日消息,摩尔线程宣布,针对PyTorch深度学习框架的MUSA插件“Torch-MUSA”,迎来重大更新新版本v1.3.0,全面兼容PyTorch 2.2.0。 新版进一步提升了PyTorch在摩尔线程GPU MUSA架构上的模型性能与覆盖度,能更友好地支持模型迁移到摩尔线程GPU。 PyTorch是全球 ...
AI自动生成的苹果芯片Metal内核,比官方的还要好? Gimlet Labs的最新研究显示,在苹果设备上,AI不仅能自动生成Metal内核,还较基线内核实现了87%的PyTorch推理速度提升。 更惊人的是,AI生成的Metal内核还在测试的215个PyTorch模块上实现了平均1.87倍的加速,其中一些 ...
6 天on MSN
摩尔线程CEO将亮相MUSA开发者大会 发布新GPU架构及全栈布局
摩尔线程创始人、董事长兼CEO张建中近日宣布,公司将在首届MUSA开发者大会上全面介绍以MUSA为核心的全栈发展战略与未来规划。此次大会不仅将发布新一代GPU架构,还将展示涵盖产品体系、核心技术及行业解决方案的完整生态布局,同时分享多领域应用案例与生 ...
16 天on MSN
摩尔线程发布,增强AI模型训练与推理支持
11 月 28 日消息,近日,摩尔线程正式发布 PyTorch 深度学习框架的 MUSA 扩展库 ——Torch-MUSA v2.7.0,新版本在功能集成、性能优化与硬件支持方面实现进一步突破。Torch-MUSA 在短短一个月内,连续完成 v2.5.0 和 v2.7.0 两次版本更新。 据介绍,自 v2.5.0 起,Torch-MUSA 版本号已与 ...
CNMO科技 on MSN
摩尔线程CEO:将发布新一代GPU架构 阐述全栈发展战略
【CNMO科技消息】12月9日,摩尔线程创始人、董事长兼CEO张建中宣布将在摩尔线程首届MUSA开发者大会中,系统阐述以MUSA为核心的全栈发展战略与未来愿景,并重磅发布新一代GPU架构,推出涵盖产品体系、核心技术及行业解决方案的完整布局,分享多领域 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果