OpenAI CLIP 关键点 - 连接图像和文字_今日快讯
2023-05-08 04:40:42来源:博客园
(资料图片仅供参考)
A photo of a {label}, a type of pet.
(其中{label}
替换成boxer
)那么boxer就可以被理解为一种狗(其中在生成数据的时候,比如a type of pet部分也是可以自动拼进去的,比如图片本来就来自牛津词典宠物图片集,那么自然就可以增加这样的分类信息,这会进一步让图像识别变得更加精准)。主要用途:图像搜索(基于文本)、自然语言描述图像等。限制:参考论文P18(6. Limitations)结果:CLIP在Zero-Shot的情况下,在大部分常见数据集上都比特定训练的模型表现的好。在一些特别的模型基础上,Zero-Shot可能不一定有很好的效果,但是进行Few-shot则比特定训练的模型表现要好,因此模型具备很强的迁移能力。引发的思考:数据量大,就可以获得不一样的研究方法和模型效果。其实CLIP用到的方法并不新鲜,前人也有用过类似的方法,但是因为没有采用这么大的数据量,所以没有达到SOTA的效果。模型的输入输出都变成了token,也可以理解都都是文本,它和NLP领域的GPT模型带来的颠覆性相似。因为是一般性的文本描述,而不是特定分类描述,所以模型具备了多模态的特性。因为是一般性的文本描述,所以模型可以用于自然语言描述图像。这个项目的训练方法没有开源,但是训练结果的模型开源了。基于CLIP延展的项目StyleCLIP:变化发型、眼睛等。CLIPDraw :CLIPDraw: Exploring Text-to-Drawing Synthesis through Language-Image Encoders 可以通过CLIP绘制一些蜡笔画。Paper:Open-Vocabulary Object Detection Using Captions 基于字幕的开放词汇目标检测 目标检测。Contrastive Language-Image Forensic Search 基于文本对视频中的内容进行检索。参考资料Paper: Learning Transferable Visual Models From Natural Language Supervision 从自然语言监督中学习可迁移的视觉模型CLIP 论文逐段精读【论文精读】OpenAI | CLIP: Connecting text and imagesCLIP:连接文本和图像转载请注明出处:https://www.cnblogs.com/volnet/p/openai-clip.html
相关新闻
- OpenAI CLIP 关键点 - 连接图像和文字_今日快讯
- 我的世界斗罗大陆服务器_我的世界斗罗大陆-新资讯
- 警惕!这5件不起眼的小事正在加速你的衰老,快别做了!
- 全涤是什么面料_什么是全涤面料
- 百事通!魅力卡通全程训练基础造型篇_关于魅力卡通全程训练基础造型篇简述
- 当前热讯:签订无固定期限劳动合同具有哪些好处
- 中国从南非进口首船饲料玉米专家:进口玉米“美国独大”格局正被改写
- 全球短讯!茂名市茂南区木屋烧烤店_关于茂名市茂南区木屋烧烤店的简介
- 世界时讯:君实生物:特瑞普利单抗联合化疗一线治疗广泛期小细胞肺癌的III期临床达到主要研究终点
- 超能世界法里内利的试炼怎么过_精选
- 江西暴雨中,大水漫村24小时
- 世界快看:蔡天凤被碎尸案明日将再度提讯,香港警方至今已拘捕七人
- 层板固定墙上配件_大相框怎么固定在墙上 天天通讯
- 看这销量数据……手机市场是真蔫了啊? 热点在线
- 扎冲十三味丸说明书副作用_扎冲十三味丸是治什么病的-环球聚焦
- 天气丨雨水收尾 明起苏州将迎来好天气_世界要闻
- 2023年全球票房破100亿美元,《阿凡达:水之道》暂列年榜冠军
- 观察:卡瓦哈尔:维尼修斯是一架飞机,在90分钟里他都没有停止冲刺
- 看着“嫌弃”,喝着“真香”!喝过这4款白酒,才说明你真的懂酒-短讯
- 上海读书的好处有哪些 在上海读书是一种怎样的体验 快看