GPT4 API进行图片识别Python
openai在几个月前发布了一款对话模型gpt-4-vision-preview,可以识别文章中的图片,下面介绍其用法。
只需要在message中的发送消息的content就不能再传入字符串了,而是传入一个数组。
将type设置为text,并在text字段中设置提问的文本。
将type设置为image_url,并设置image_url对象中的url位图片地址。当然也可以将url设置为图像的base64编码。
在python中
from openai import OpenAI
client = OpenAI()
response = client.chat.completions.create(
model="gpt-4-vision-preview",
messages=[
{
"role": "user",
"content": [
{"type": "text", "text": "What’s in this image?"},
{
"type": "image_url",
"image_url": {
"url": "https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg",
},
},
# 或者
{
"type": "image_url",
"image_url": {
"url": f"data:image/jpeg;base64,{base64_image}"
}
}
],
}
],
max_tokens=300,
)
print(response.choices[0])
评论列表
0/1000
共 0 评论