IBM宣布与AMD合作部署AMD Instinct MI300X加速器
11月20日消息,据外媒报道,IBM和AMD宣布合作部署AMD Instinct MI300X加速器,作为IBM Cloud上的一项服务。该产品预计将于2025年上半年推出,旨在提高通用AI模型的性能和能效,以及面向企业客户的高性能计算(HPC)应用。此次合作还将支持IBM的watsonx人工智能和数据平台中的AMD Instinct MI300X加速器,以及红帽®企业Linux®人工智能推理支持。
IBM和AMD将合作在IBM Cloud上提供MI300X加速器作为一项服务,以支持利用人工智能的企业客户。具体来看:
1、支持大模型推理:AMD Instinct MI300X加速器配备192GB高带宽内存(HBM3),支持最大模型推理和微调。大内存容量还可以帮助客户用更少的gpu运行更大的模型,从而潜在地降低推理成本。
2、增强的性能和安全性:在IBM Cloud Virtual Servers上为VPC提供AMD Instinct MI300X加速器作为服务,以及通过IBM Cloud Kubernetes service和IBM Red Hat OpenShift在IBM Cloud上的容器支持,可以帮助运行AI应用程序的企业优化性能。
3、对于生成式AI推理工作负载,IBM计划在IBM的watsonx人工智能和数据平台中支持AMD的本能MI300X加速器,为Watsonx客户提供额外的人工智能基础设施资源,以便在混合云环境中扩展其人工智能工作负载。此外,红帽企业Linux AI和红帽OpenShift AI平台可以使用MI300X加速器上的InstructLab校准工具运行Granite系列大模型。
据悉,搭载AMD Instinct MI300X加速器的IBM Cloud预计将于2025年上半年全面上市。
相关阅读
- 英特尔发布锐炫 Pro B系列GPU:面向准专业用户和AI开发者
- 比特网早报:OpenAI因算力瓶颈暂缓GPT-5发布,苹果推迟低价版VisionPro量产
- 比特网早报:Snap发布新一代Spectacles AR眼镜,黄仁勋近三个月出售近600万股股票
- 艾为AI眼镜方案赋能下一代个人智能设备小米 Glasses
- 西部数据iNAND AT EU552 UFS 3.1嵌入式闪存驱动器获“年度影响力产品奖”
- AMD苏姿丰:DeepSeek的出现是件好事
- IAR推出新版IAR Embedded Workbench for Arm功能安全版,该版本配备经过认证的静态代码分析功能
- Stellantis 宣布终止氢燃料电池技术开发项目:加氢难、成本高
- 全球首个抗量子密码迁移解决方案发布,“芯片内生”重新定义源头安全
- 比特网早报:OpenAI考虑建立数据中心,Manus将举行线下活动