上周日介绍过 Bing 的 DALL·E 3 免费工具,今天发现我的 ChatGPT 终于解锁先前发布的两大新功能——“GPT-4V”和“DALL·E 3”。

实则早在9月21日文章《OpenAI新一代 AI 图像生成工具DALL·E 3,ChatGPT驱动》就已经提到 DALL-E 3 将于 10 月陆续向 ChatGPT Plus 和 ChatGPT Enterprise 用户发布。
身边朋友最早在10月4日就使用上了,但我的直到今天才更新。
如果目前还没有这项功能的朋友也不要着急,OpenAI的确 是在“陆续”发布。
▋功能实践
以杭州亚运会韩国队提前庆祝中国台北极限反超这一场面为例,将 GPT-4V、DALL·E 3 搭配使用,只使用 ChatGPT 做出各种风格的图片。
1. GPT-4V:“描述”上传图片
2. DALL·E 3:“生成”描述的图片

▋ 步骤一:使用 GPT-4 V(ision) 功能
更新后的ChatGPT 在“Default”输入对话框可以上传图片,做到识别图片的功能。
结果可以发现,GPT-4V 可以清楚描述图片场景,甚至能清楚分辨运动员身穿的运动服上的字母。
▋ 步骤二:使用 DALL·E 3 功能
切换到 DALL·E 3 功能,复制粘贴上一步骤的描述。
经过测试,以中文描述生成的图片,会不准,所以需要让 ChatGPT 使用英文来生成图片。
每次输出都会生成 4 张图片供你选择,可以告知 ChatGPT 你喜爱哪张,或是需要改哪些地方。
例如:运动制服上的国旗、国名不对、动作不好看等等。
也能告知 ChatGPT 要生成什么样的风格,例如:
– 插画风(左上)
– 水彩风(右上)
– 漫画风(左下)
– 真实相片(右下)
最后点击“下载按钮”就能下载!

▋ ChatGPT DALL·E 3 与 Bing DALL·E 3 差异
• ChatGPT 能够调整不同的尺寸,只要输入例如 1024*1024 就可以生成特定尺寸,Bing 则不稳定。
• ChatGPT 能够不断调整图片的细节,不用重新生成。
• ChatGPT 生成速度较慢,Bing 生成速度较快。
• ChatGPT 限制较严格,无法直接用艺术家名字生成图片,它只会用类似风格的 Prompt。
▋ 那什么时候该用什么版本?
Bing:特定角色,例如:名人、动漫人物、Prompt 简短。
ChatGPT:需要描述细节、要不断调整。
不管是 Bing 还是 ChatGPT 版本的 DALL·E 3 都不错!
而且每天 Bing 都有 50 点的快速使用点,加上 ChatGPT 的次数,几乎可以无限生成图片,根本用不完!

