AI 最强组合:GPT-4V + DALL·E 3 ─ ChatGPT 开放 GPT-4V、DALL·E 3 功能!

内容分享24小时前发布
1 0 0

上周日介绍过 Bing 的 DALL·E 3 免费工具,今天发现我的 ChatGPT 终于解锁先前发布的两大新功能——“GPT-4V”和“DALL·E 3”。

AI 最强组合:GPT-4V + DALL·E 3 ─ ChatGPT 开放 GPT-4V、DALL·E 3 功能!

实则早在9月21日文章《OpenAI新一代 AI 图像生成工具DALL·E 3,ChatGPT驱动》就已经提到 DALL-E 3 将于 10 月陆续向 ChatGPT Plus 和 ChatGPT Enterprise 用户发布。

身边朋友最早在10月4日就使用上了,但我的直到今天才更新。

如果目前还没有这项功能的朋友也不要着急,OpenAI的确 是在“陆续”发布。

▋功能实践

以杭州亚运会韩国队提前庆祝中国台北极限反超这一场面为例,将 GPT-4V、DALL·E 3 搭配使用,只使用 ChatGPT 做出各种风格的图片。

1. GPT-4V:“描述”上传图片

2. DALL·E 3:“生成”描述的图片

AI 最强组合:GPT-4V + DALL·E 3 ─ ChatGPT 开放 GPT-4V、DALL·E 3 功能!

▋ 步骤一:使用 GPT-4 V(ision) 功能

更新后的ChatGPT 在“Default”输入对话框可以上传图片,做到识别图片的功能。

结果可以发现,GPT-4V 可以清楚描述图片场景,甚至能清楚分辨运动员身穿的运动服上的字母。

▋ 步骤二:使用 DALL·E 3 功能

切换到 DALL·E 3 功能,复制粘贴上一步骤的描述。

经过测试,以中文描述生成的图片,会不准,所以需要让 ChatGPT 使用英文来生成图片。

每次输出都会生成 4 张图片供你选择,可以告知 ChatGPT 你喜爱哪张,或是需要改哪些地方。

例如:运动制服上的国旗、国名不对、动作不好看等等。

也能告知 ChatGPT 要生成什么样的风格,例如:

– 插画风(左上)

– 水彩风(右上)

– 漫画风(左下)

– 真实相片(右下)

最后点击“下载按钮”就能下载!

AI 最强组合:GPT-4V + DALL·E 3 ─ ChatGPT 开放 GPT-4V、DALL·E 3 功能!

▋ ChatGPT DALL·E 3 与 Bing DALL·E 3 差异

• ChatGPT 能够调整不同的尺寸,只要输入例如 1024*1024 就可以生成特定尺寸,Bing 则不稳定。

• ChatGPT 能够不断调整图片的细节,不用重新生成。

• ChatGPT 生成速度较慢,Bing 生成速度较快。

• ChatGPT 限制较严格,无法直接用艺术家名字生成图片,它只会用类似风格的 Prompt。

▋ 那什么时候该用什么版本?

Bing:特定角色,例如:名人、动漫人物、Prompt 简短。

ChatGPT:需要描述细节、要不断调整。

不管是 Bing 还是 ChatGPT 版本的 DALL·E 3 都不错!

而且每天 Bing 都有 50 点的快速使用点,加上 ChatGPT 的次数,几乎可以无限生成图片,根本用不完!

© 版权声明

相关文章

暂无评论

none
暂无评论...