OpenAI推出GPT-4 Turbo with Vision,能够在处理文本的同时处理视觉数据
科技IT 2024-04-13 user6583
4月11日消息,据外媒报道,OpenAI正式推出GPT-4 Turbo with Vision(GPT-4V),标志着其人工智能大语言模型的进步。此新版本通过集成Vision增强了GPT-4 Turbo的功能,从而能够在处理文本的同时处理视觉数据。这一发展可能会彻底改变开发人员使用人工智能的方式,特别是在需要分析图像的应用程序中。
GPT-4V引入了几个关键功能,旨在简化开发过程。值得注意的是,它支持JSON模式和函数调用,便于更容易地与现有的代码库集成。该模型在其前身GPT-4 Turbo的上下文窗口中维护了令人印象深刻的128000个令牌,允许在单个请求中进行广泛的数据处理。开发人员现在可以通过直接链接或传递base64编码的图像来输入图像,从而扩展了该模型在各种应用程序中的实用性。
GPT-4V的一个突出方面是其解释和分析图像的能力。虽然它可以识别图像中的对象,但注意一些限制是很重要的。例如,模型可能难以确定特定项目在视野内的精确位置或颜色。这一限制突显了人工智能对复杂视觉环境的理解现状,这一挑战仍然是一个积极研发的领域。
The End
相关阅读
- 英特尔暂不考虑业务拆分:短期主攻 AI 市场,IFS 暂未获得大规模量产订单
- “你好BOE”五周年盛典北京站盛大启幕 携手生态伙伴打造“科技+生活”新场景
- TITAN Core触觉DIY大赛:激发中国触觉技术的创新潜力
- 方建华:“双碳”战略背景下以科技创新驱动新能源汽车可持续发展
- 博世采用 DELO 粘合剂制造轻度混动电池
- 消息称新凯来正寻求 200 亿元首轮融资,追逐更多客户和影响力
- 跨境电商报关如何选择合适的报关模式,1039市场采购模式,9810海外仓模式
- 布勒亮相2025上海国际压铸展,全球大型一体化压铸订单突破50套
- 诺德股份拟收购云财富期货90.2%股权
- TrendForce:2030年AR设备出货量或将达到2550万台