In this work I proposed apply Stacking with Convolutional Neural Network to improve Audio Tag Classification.
M1 - Utilize Stacking technique with CNN to improve Audio Tag Classification;
M2 - Utilize Stacking technique with CNN and Autoencoders to improve Audio Tag Classification;
poetry shell
poetry install
bash menu.sh
After running bash menu.sh select database
├── config-project.yml
├── database
│ └── FMA
│ ├── data
│ │ ├── processed
│ │ │ ├── annotations
│ │ │ │ ├── train.csv
│ │ │ │ ├── test.csv
│ │ │ │ └─ validation.csv
│ ├── __init__.py
│ ├── models
│ ├── out
│ └── src
│ ├── model-1
│ │ ├── first_stage.py
│ │ ├── __init__.py
│ │ ├── model.py
│ │ └── second_stage.py
│ ├── model-2
│ │ ├── first_stage.py
│ │ ├── __init__.py
│ │ ├── model.py
│ │ └── second_stage.py
│ ├── model-3
│ │ ├── first_stage.py
│ │ ├── __init__.py
│ │ ├── model.py
│ │ └── second_stage.py
│ ├── model-4
│ │ ├── first_stage.py
│ │ ├── __init__.py
│ │ ├── model.py
│ │ └── second_stage.py
│ └── model-5
│ ├── first_stage.py
│ ├── __init__.py
│ ├── model.py
│ └── second_stage.py
├── LICENSE
├── menu.sh
├── poetry.lock
├── pyproject.toml
├── README.md
├── scripts
│ └── get_database.sh
└── src
├── __init__.py
├── check_data.py
├── generate_autoencoders_chromagram.py
├── generate_autoencoders_mel_spectrogram.py
├── generate_autoencoders_mfcc.py
├── generate_autoencoders_stft.py
├── generate_graph.py
├── generate_holdout.py
├── generate_info_data.py
├── generate_spectrogram.py
├── generate_structure.py
├── metrics.py
├── model_autoencoders_chromagram.py
├── model_autoencoders_mel_spectrogram.py
├── model_autoencoders_mfcc.py
└── model_autoencoders_stft.py
Project based on the cookiecutter data science project template. #cookiecutterdatascience