北京哪个治白癜风医院好 http://www.bdfyy999.com/index.html

[1]LinTY,RoyChowdhuryA,MajiS.Bilinearcnnmodelsforfine-grainedvisualrecognition[C]//ProceedingsoftheIEEEInternationalConferenceonComputerVision.:-.[2]LinTY,RoyChowdhuryA,MajiS.BilinearCNNsforFine-grainedVisualRecognition//arXiv..

摘要

定义:双线性CNN模型:包含两个特征提取器,其输出经过外积(外积WiKi)相乘、池化后获得图像描述子。

优点:

该架构能够以平移不变的方式,对局部的对级(pairwise)特征交互进行建模,适用于细粒度分类。

能够泛化多种顺序无关的特征描述子,如Fisher向量,VLAD及O2P。实验中使用使用卷积神经网络的作为特征提取器的双线性模型。

双线性形式简化了梯度计算,能够对两个网络在只有图像标签的情况下进行端到端训练。

实验结果:

对ImageNet数据集上训练的网络进行特定领域的微调,该模型在CUB-数据集上,训练时达到了84.1%的准确率。

作者进行了实验及可视化以分析微调的效果,并在考虑模型速度和精确度的情况下选择了两路网络。

结果显示,该架构在大多数细粒度数据集上都可以与先前算法相媲美,并且更加简洁、易于训练。更重要的是,准确率最高的模型可以在NVIDIATeslaK40GPU上以8f/s的速度高效运行。代码链接:



转载请注明地址:http://www.nanjizeiou.com/njzotz/7534.html