OpenAI推出GPT-4 Turbo with Vision,能够在处理文本的同时处理视觉数据
科技IT 2024-04-13 user6583
4月11日消息,据外媒报道,OpenAI正式推出GPT-4 Turbo with Vision(GPT-4V),标志着其人工智能大语言模型的进步。此新版本通过集成Vision增强了GPT-4 Turbo的功能,从而能够在处理文本的同时处理视觉数据。这一发展可能会彻底改变开发人员使用人工智能的方式,特别是在需要分析图像的应用程序中。
GPT-4V引入了几个关键功能,旨在简化开发过程。值得注意的是,它支持JSON模式和函数调用,便于更容易地与现有的代码库集成。该模型在其前身GPT-4 Turbo的上下文窗口中维护了令人印象深刻的128000个令牌,允许在单个请求中进行广泛的数据处理。开发人员现在可以通过直接链接或传递base64编码的图像来输入图像,从而扩展了该模型在各种应用程序中的实用性。
GPT-4V的一个突出方面是其解释和分析图像的能力。虽然它可以识别图像中的对象,但注意一些限制是很重要的。例如,模型可能难以确定特定项目在视野内的精确位置或颜色。这一限制突显了人工智能对复杂视觉环境的理解现状,这一挑战仍然是一个积极研发的领域。
The End
相关阅读
- Supermicro推出搭载全新第五代Intel Xeon 处理器,专为AI、云端服务供应商、存储和边缘计算优化的机柜级解决方案
- vivo 30周年再出发:宣布影像技术新战略,发布Vision探索版
- 德州仪器在APEC 2024前夕发布新型GaN功率级和DC-DC模块
- 比特网早报:全国空间计量技术委员会成立,银河麒麟操作系统上架微信Linux4.0.0版本
- TUV莱茵扩展服务能力,获三项关键物联网协议测试授权
- ABC布局提速!爱旭股份签署2.38亿元设备订单
- 东莞连接器,线缆线束加工展,展位销售火爆
- 先进技术赋能多领域应用,创新成果展现强大实力
- 5月24日,2024年第四届数博会在福州隆重开幕
- 比特早报:华为申请注册“华为云山”图形商标,AI发现冠心病罕见变异基因