【论文+代码+开源】在我小助理的网pan里↓加我助理领取:https://dnu.xet.tech/s/Xq4b0
https://www.youtube.com/watch?v=yM9S3fLp5GcFlamingo模型是Deepmind提出的视觉语言模型,在语言模型的基础上,通过perceiver组件,将视觉和语言联系起来,并在大量的图文数据上训练而得到。该模型在few-shot场景下图片理解、图生文等任务,取得了非常惊艳的效果。