梦晨 发自 凹非寺
量子位 | 公众号 QbitAI笑不活了家人们,最近突然流行起一个新玩法:
给AI发自拍,看AI如何描述你。
比如这位勇敢晒出自拍的纽约大学助理教授,他的笑容在AI看来居然是“兽人式微笑”。
AI还吐槽他胡子没有打理,但他表示拍照那天胡子要比平常整齐多了。
在评论区里还有一位也被评价为兽人微笑的网友现身。
两位“部落勇士”就这样赛博认了个亲。
这还不算完,有了AI生成的描述就可以再当作提示词喂回给AI,看看能画出些什么来。
不得不说,与他本人还是有一些神似的~
AI绘画逆着玩,火到服务器被挤爆
上面这个玩法,相当于把最近火爆的AI绘画逆过来玩,输入图片输出文字描述。
负责文字描述的正是大名鼎鼎的CLIP,也就是DALL·E、Stable Diffusion等AI绘画模型中负责理解语言的那部分。
目前这个CLIP Interrogator(CLIP审问官),在HuggingFace上已有现成的Demo可玩。
玩法也非常简单,只需打开网页→上传图片→一键提交即可,另外还提供了简单的裁剪编辑功能,方便选择图片中想要描述的对象。
(地址放在文末)
不过因为现在实在是太火爆,服务器资源有限经常排不上队,要多尝试几次才行。
除了上传自拍之外,更实用的玩法是上传一张心仪的图片,看看AI给出怎样的提示词。
因为与市面上常见的AI绘画模型使用了同款算法,所以这些提示词也就格外准确。
(谷歌系的Imagen等用的是自家T5语言模型,其他大部分用的是CLIP。)
先来举个栗子。
AI生成的描述会包含主体内容“海龟”、艺术风格“水彩画”、作者或风格相似的作者、可能出现在什么网站、主要颜色、饱和度等等,甚至还能给出专业的绘画技法“wet-on-wet”。
拿着这段提示词,就可以再喂回给指定的AI轻松出图了。
如果稍作修改,也可以做到更换画风,或保留画风更换主体内容等众多玩法。
HuggingFace的一位工程师,还用这套流程搞出了想要很久的羊驼纹身。
看到这里,你有没有产生一些大胆的想法?
作者的个人网站是个宝藏
应用的作者,是AI绘画圈子里的大佬@pharmapsychotic。
他之前做过一套高质量的机器人图集也非常火。
CLIP Interrogator最早8月就推出第一版,不过一开始还不够完善,经常出现离谱的结果。
他在网友提的建议下不断改进,也越来越流行。
甚至最近HuggingFace官方还给他特批了4张GPU,让更多人能够玩上。
在作者的个人网站上,还收集了从去年7月以来诞生的AI艺术相关工具和资源大全。
除了AI画画模型以外,还有超分辨等后续步骤的工具,音乐生成、视频生成工具等等,以及相关学习资料。
也是一个宝藏了~
在线试玩:
https://huggingface.co/spaces/pharma/CLIP-Interrogator工具大全:
https://pharmapsychotic.com/tools.html参考链接:
[1]https://twitter.com/moyix/status/1582769088807305218[2]https://pharmapsychotic.com/—完—
@量子位 · 追踪AI技术和产品新动态
深有感触的朋友,欢迎赞同、关注、分享三连վᴗ ի ❤
暂无评论内容