FSDSoundScapes

Introduced by Veluri et al. in Real-Time Target Sound Extraction

A synthetic sound mixture specification dataset for the Target Sound Extraction (TSE) task. Dataset samples consist of a .jams file specifying the mixture components, and a metadata file with target labels. Mixtures are 6 seconds long and contain 3-5 unique foreground sounds over a 6 second long background sound. Each sample is provided with 3 target labels, and sounds corresponding to all target labels are guaranteed to be present in the mixture. FSDKaggle2018 is used as the source for foreground sounds and TAU Urban Acoustic Scenes 2019 is used as the source for background sounds.

Split

Train: 50K
Val: 5K
Test: 10K

Homepage

Benchmarks

Add a new result Link an existing benchmark

Trend	Task	Dataset Variant	Best Model	Paper	Code
	Target Sound Extraction	FSDSoundScapes	Waveformer
	Streaming Target Sound Extraction	FSDSoundScapes	Waveformer

Papers

Paper	Code	Results	Date	Stars

Dataset Loaders

Add Remove

No data loaders found. You can submit your data loader here.

Tasks

Similar Datasets

TAU Urban Acoustic Scenes 2019

FSDKaggle2018

Usage

License

MIT License

FSDSoundScapes

Split

Benchmarks

Add a new result Link an existing benchmark

Papers

Dataset Loaders

Add Remove

Tasks

Similar Datasets

TAU Urban Acoustic Scenes 2019

FSDKaggle2018

Usage

License

Modalities

Languages

FSDSoundScapes

Split

Benchmarks Edit Add a new result Link an existing benchmark

Papers

Dataset Loaders Edit Add Remove

Tasks Edit

Similar Datasets

TAU Urban Acoustic Scenes 2019

FSDKaggle2018

Usage

License Edit

Modalities Edit

Languages Edit

Benchmarks

Add a new result Link an existing benchmark

Dataset Loaders

Add Remove

Tasks

License

Modalities

Languages