IBM宣布与AMD合作部署AMD Instinct MI300X加速器
11月20日消息,据外媒报道,IBM和AMD宣布合作部署AMD Instinct MI300X加速器,作为IBM Cloud上的一项服务。该产品预计将于2025年上半年推出,旨在提高通用AI模型的性能和能效,以及面向企业客户的高性能计算(HPC)应用。此次合作还将支持IBM的watsonx人工智能和数据平台中的AMD Instinct MI300X加速器,以及红帽®企业Linux®人工智能推理支持。
IBM和AMD将合作在IBM Cloud上提供MI300X加速器作为一项服务,以支持利用人工智能的企业客户。具体来看:
1、支持大模型推理:AMD Instinct MI300X加速器配备192GB高带宽内存(HBM3),支持最大模型推理和微调。大内存容量还可以帮助客户用更少的gpu运行更大的模型,从而潜在地降低推理成本。
2、增强的性能和安全性:在IBM Cloud Virtual Servers上为VPC提供AMD Instinct MI300X加速器作为服务,以及通过IBM Cloud Kubernetes service和IBM Red Hat OpenShift在IBM Cloud上的容器支持,可以帮助运行AI应用程序的企业优化性能。
3、对于生成式AI推理工作负载,IBM计划在IBM的watsonx人工智能和数据平台中支持AMD的本能MI300X加速器,为Watsonx客户提供额外的人工智能基础设施资源,以便在混合云环境中扩展其人工智能工作负载。此外,红帽企业Linux AI和红帽OpenShift AI平台可以使用MI300X加速器上的InstructLab校准工具运行Granite系列大模型。
据悉,搭载AMD Instinct MI300X加速器的IBM Cloud预计将于2025年上半年全面上市。
相关阅读
- 筑牢“防火墙”:TUV莱茵青岛网络与信息安全检测实验室全面升级
- 优必选签署小批量人形机器人采购合同,将用于汽车工厂等
- 比特网早报:腾讯混元OCR模型宣布开源,百度新设两个大模型研发部
- 湖南衡阳配电网5MW/10MWh储能系统项目预计2024年4月正式投产
- 国内首个,大亚湾核电基地累计供电突破 1 万亿千瓦时
- 比特网早报:2025年探索推进“人工智能+标准化”,腾讯发布2024年度ESG报告
- TCL中环:当前开工率已下调至80%,共筑产业生态建设
- 图灵新智算采用IBM watsonx平台及AI软件,构建全能AI平台
- 全栈式持续助力新能源车电力创新,泰克参加ATC汽车测试技术周
- 蓬勃发展的生成式AI,将如何重塑跨境电商未来