TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Fine-Grained Image Classification	CUB-200-2011	CAP	Accuracy	91.8%	# 8
Fine-Grained Image Classification	CUB-200-2011	CAP	Accuracy	91.8	# 3
Fine-Grained Image Classification	FGVC Aircraft	CAP	Accuracy	94.9%	# 3
Fine-Grained Image Classification	FGVC Aircraft	CAP	PARAMS	34.2	# 2
Fine-Grained Image Classification	Food-101	CAP	Accuracy	98.6	# 1
Fine-Grained Image Classification	Food-101	CAP	PARAMS	34.2	# 1
Fine-Grained Image Classification	NABirds	CAP	Accuracy	91.0%	# 6
Fine-Grained Image Classification	Stanford Cars	CAP	Accuracy	95.7%	# 7

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/context-aware-attentional-pooling-cap-for/fine-grained-image-classification-on-food-101)](https://paperswithcode.com/sota/fine-grained-image-classification-on-food-101?p=context-aware-attentional-pooling-cap-for)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/context-aware-attentional-pooling-cap-for/fine-grained-image-classification-on-cub-200-1)](https://paperswithcode.com/sota/fine-grained-image-classification-on-cub-200-1?p=context-aware-attentional-pooling-cap-for)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/context-aware-attentional-pooling-cap-for/fine-grained-image-classification-on-fgvc)](https://paperswithcode.com/sota/fine-grained-image-classification-on-fgvc?p=context-aware-attentional-pooling-cap-for)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/context-aware-attentional-pooling-cap-for/fine-grained-image-classification-on-nabirds)](https://paperswithcode.com/sota/fine-grained-image-classification-on-nabirds?p=context-aware-attentional-pooling-cap-for)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/context-aware-attentional-pooling-cap-for/fine-grained-image-classification-on-stanford)](https://paperswithcode.com/sota/fine-grained-image-classification-on-stanford?p=context-aware-attentional-pooling-cap-for)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/context-aware-attentional-pooling-cap-for/fine-grained-image-classification-on-cub-200)](https://paperswithcode.com/sota/fine-grained-image-classification-on-cub-200?p=context-aware-attentional-pooling-cap-for)`

Context-aware Attentional Pooling (CAP) for Fine-grained Visual Classification

17 Jan 2021 · Ardhendu Behera, Zachary Wharton, Pradeep Hewage, Asish Bera ·

Deep convolutional neural networks (CNNs) have shown a strong ability in mining discriminative object pose and parts information for image recognition. For fine-grained recognition, context-aware rich feature representation of object/scene plays a key role since it exhibits a significant variance in the same subcategory and subtle variance among different subcategories. Finding the subtle variance that fully characterizes the object/scene is not straightforward. To address this, we propose a novel context-aware attentional pooling (CAP) that effectively captures subtle changes via sub-pixel gradients, and learns to attend informative integral regions and their importance in discriminating different subcategories without requiring the bounding-box and/or distinguishable part annotations. We also introduce a novel feature encoding by considering the intrinsic consistency between the informativeness of the integral regions and their spatial structures to capture the semantic correlation among them. Our approach is simple yet extremely effective and can be easily applied on top of a standard classification backbone network. We evaluate our approach using six state-of-the-art (SotA) backbone networks and eight benchmark datasets. Our method significantly outperforms the SotA approaches on six datasets and is very competitive with the remaining two.

PDF Abstract

Code

Add Remove Mark official

ArdhenduBehera/cap

Tasks

Add Remove

Fine-Grained Image Classification

General Classification

Informativeness

Object

Datasets

CUB-200-2011

Oxford 102 Flower

Stanford Cars

Food-101

FGVC-Aircraft

NABirds

Results from the Paper

Edit

Ranked #1 on Fine-Grained Image Classification on Food-101

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Fine-Grained Image Classification	CUB-200-2011	CAP	Accuracy	91.8%	# 8	Compare
Fine-Grained Image Classification	CUB-200-2011	CAP	Accuracy	91.8	# 3	Compare
Fine-Grained Image Classification	FGVC Aircraft	CAP	Accuracy	94.9%	# 3	Compare
Fine-Grained Image Classification	FGVC Aircraft	CAP	PARAMS	34.2	# 2	Compare
Fine-Grained Image Classification	Food-101	CAP	Accuracy	98.6	# 1	Compare
Fine-Grained Image Classification	Food-101	CAP	PARAMS	34.2	# 1	Compare
Fine-Grained Image Classification	NABirds	CAP	Accuracy	91.0%	# 6	Compare
Fine-Grained Image Classification	Stanford Cars	CAP	Accuracy	95.7%	# 7	Compare

Methods

Add Remove

No methods listed for this paper. Add relevant methods here

Edit Social Preview

Context-aware Attentional Pooling (CAP) for Fine-grained Visual Classification

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove