苹果推出AI图像工具MGIE,可以通过自然语言指令编辑图像
科技IT 2024-02-09 kjkhf54565
2月9日消息,苹果与加州大学圣巴巴拉分校合作开发了一款AI图像工具MGIE,可以通过文本提示对图像进行裁剪、调整大小、翻转和添加滤镜。
MGIE模型(mllm引导的图像编辑),可以应用于简单和更复杂的图像编辑任务,比如修改照片中的特定物体,使它们具有不同的形状或更亮。该模型混合了多模态语言模型的两种不同用法。首先,它学习如何解释用户提示。然后,它会“想象”编辑后的样子。例如,要求在照片中添加更蓝的天空,就会增加图像中天空部分的亮度。
MGIE不是简单而模糊的指导,而是衍生出明确的视觉感知意图,并导致合理的图像编辑。我们从各个编辑方面进行了广泛的研究,并证明我们的MGIE在保持竞争效率的同时有效地提高了性能。我们也相信mllm指导的框架可以为未来的视觉和语言研究做出贡献,”研究人员在论文中说。
与微软、Meta或谷歌不同,苹果在生成式AI领域并不是一个大玩家,但苹果首席执行官蒂姆・库克表示,该公司希望今年在其设备中添加更多人工智能功能。2023年12月,苹果研究人员发布了一个名为MLX的开源机器学习框架,使在苹果硅芯片上训练AI模型变得更容易。
The End
相关阅读
- 领先三星:SK 海力士被曝推进 1c DRAM 六层 EUV 工艺
- 零信任+微分段,Akamai为企业筑牢安全防御体系
- 消息称三星 8 层 HBM3E 存储芯片已通过英伟达测试,有望第四季度供货
- 估值180亿美元,xAI寻求融资60亿美元
- TUV莱茵为南通瑞翔颁发“零碳工厂”认证证书
- Gartner:到2026年,30%的企业将因为AI生成的深度伪造而无法起到可靠的隔离作用
- 比特早报:奥特曼被解除OpenAI CEO后又正被邀回,脑机接口产品第三方评测工作正式启动
- Shure打造移动音频:MV7+与MoveMic,让每一刻都动听
- 三星开发SbS新型封装技术,Exynos 2700将率先采用
- ADI与宝马集团合作推出业界领先的10Mb车载以太网技术,开启软件定义汽车新篇章