GPT4 API进行图片识别Python

openai在几个月前发布了一款对话模型gpt-4-vision-preview,可以识别文章中的图片,下面介绍其用法。

只需要在message中的发送消息的content就不能再传入字符串了,而是传入一个数组。

将type设置为text,并在text字段中设置提问的文本。

将type设置为image_url,并设置image_url对象中的url位图片地址。当然也可以将url设置为图像的base64编码。

在python中

from openai import OpenAI

client = OpenAI()

response = client.chat.completions.create(
  model="gpt-4-vision-preview",
  messages=[
    {
      "role": "user",
      "content": [
        {"type": "text", "text": "What’s in this image?"},
        {
          "type": "image_url",
          "image_url": {
            "url": "https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg",
          },
        },
        # 或者
        {
          "type": "image_url",
          "image_url": {
            "url": f"data:image/jpeg;base64,{base64_image}"
          }
        }
      ],
    }
  ],
  max_tokens=300,
)

print(response.choices[0])


评论列表
0/1000
共 0 评论