感知机(perceptron)是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取$+1$和$-1$二值。感知机对应于输入空间(特征空间)中将实例划分为正负两类的分离超平面,属于判别模型。
Stacked Cross Attention for Image-Text Matching
这篇文章做了什么?
通过对图像中的对象或者突出内容与句子中的单词进行潜在语义对齐,使得图文匹配过程能够捕获到视觉与语言之间细粒度的相互关系,使得图文匹配更具有可解释性。目的是将单词和图像区域映射到同一嵌入空间(common embedding space)从而推断整个图像与句子之间的相似度。