IBM宣布与AMD合作部署AMD Instinct MI300X加速器
11月20日消息,据外媒报道,IBM和AMD宣布合作部署AMD Instinct MI300X加速器,作为IBM Cloud上的一项服务。该产品预计将于2025年上半年推出,旨在提高通用AI模型的性能和能效,以及面向企业客户的高性能计算(HPC)应用。此次合作还将支持IBM的watsonx人工智能和数据平台中的AMD Instinct MI300X加速器,以及红帽®企业Linux®人工智能推理支持。
IBM和AMD将合作在IBM Cloud上提供MI300X加速器作为一项服务,以支持利用人工智能的企业客户。具体来看:
1、支持大模型推理:AMD Instinct MI300X加速器配备192GB高带宽内存(HBM3),支持最大模型推理和微调。大内存容量还可以帮助客户用更少的gpu运行更大的模型,从而潜在地降低推理成本。
2、增强的性能和安全性:在IBM Cloud Virtual Servers上为VPC提供AMD Instinct MI300X加速器作为服务,以及通过IBM Cloud Kubernetes service和IBM Red Hat OpenShift在IBM Cloud上的容器支持,可以帮助运行AI应用程序的企业优化性能。
3、对于生成式AI推理工作负载,IBM计划在IBM的watsonx人工智能和数据平台中支持AMD的本能MI300X加速器,为Watsonx客户提供额外的人工智能基础设施资源,以便在混合云环境中扩展其人工智能工作负载。此外,红帽企业Linux AI和红帽OpenShift AI平台可以使用MI300X加速器上的InstructLab校准工具运行Granite系列大模型。
据悉,搭载AMD Instinct MI300X加速器的IBM Cloud预计将于2025年上半年全面上市。
相关阅读
- 传英伟达因DRAM短缺已停止向GPU主板合作伙伴提供显存
- 拥抱人工智能时代,百行千企是否已经准备就绪?
- 荣耀X60手机预热:全新超深度钢化玻璃 耐刮能力提升23%
- Alif与Telit合作开发边缘AI相机参考设计
- Quantinuum 与 Microsoft 合作进行可靠逻辑量子比特的突破性演示,迈入可靠量子计算的新阶段
- 京东方CTO刘志强: “双京赋能 ” 三周年,价值升维开启显示产业共生时代
- 恩智浦半导体公布2025年第一季度业绩,宣布管理层继任计划
- 亿咖通科技联手smart成立合资公司
- MIKROE推出新开源软硬件解决方案使数百个Click板能够热插拔到Linux开发环境中
- 比特早报:特斯拉明年将生产Optimus机器人,上海科技影都AI创制生态中心启动