OpenAI推出GPT-4 Turbo with Vision,能够在处理文本的同时处理视觉数据

科技IT 2024-04-13 user6583

  4月11日消息,据外媒报道,OpenAI正式推出GPT-4 Turbo with Vision(GPT-4V),标志着其人工智能大语言模型的进步。此新版本通过集成Vision增强了GPT-4 Turbo的功能,从而能够在处理文本的同时处理视觉数据。这一发展可能会彻底改变开发人员使用人工智能的方式,特别是在需要分析图像的应用程序中。

  GPT-4V引入了几个关键功能,旨在简化开发过程。值得注意的是,它支持JSON模式和函数调用,便于更容易地与现有的代码库集成。该模型在其前身GPT-4 Turbo的上下文窗口中维护了令人印象深刻的128000个令牌,允许在单个请求中进行广泛的数据处理。开发人员现在可以通过直接链接或传递base64编码的图像来输入图像,从而扩展了该模型在各种应用程序中的实用性。

  GPT-4V的一个突出方面是其解释和分析图像的能力。虽然它可以识别图像中的对象,但注意一些限制是很重要的。例如,模型可能难以确定特定项目在视野内的精确位置或颜色。这一限制突显了人工智能对复杂视觉环境的理解现状,这一挑战仍然是一个积极研发的领域。

The End
免责声明:本文内容来源于第三方或整理自互联网,本站仅提供展示,不拥有所有权,不代表本站观点立场,也不构成任何其他建议,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容, 请及时联系我们进行处理。

Copyright © 2099 搜索科技

苏ICP备2023036119号-10 |——:

|—— TXT地图 | 网站地图 |