Skip to content

jdonini/stacking-audio-tagging

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

95 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Stacking Audio Tagging

In this work I proposed apply Stacking with Convolutional Neural Network to improve Audio Tag Classification.

The project is organized into 2 main projects:

M1 - Utilize Stacking technique with CNN to improve Audio Tag Classification;
M2 - Utilize Stacking technique with CNN and Autoencoders to improve Audio Tag Classification;

Install Dependencies:

poetry shell
poetry install

Run Project:

bash menu.sh
After running bash menu.sh select database

Project Organization


├── config-project.yml
├── database
│   └── FMA
│       ├── data
│       │   ├── processed
│       │   │   ├── annotations
│       │   │   │   ├── train.csv
│       │   │   │   ├── test.csv
│       │   │   │   └─ validation.csv
│       ├── __init__.py
│       ├── models
│       ├── out
│       └── src
│           ├── model-1
│           │   ├── first_stage.py
│           │   ├── __init__.py
│           │   ├── model.py
│           │   └── second_stage.py
│           ├── model-2
│           │   ├── first_stage.py
│           │   ├── __init__.py
│           │   ├── model.py
│           │   └── second_stage.py
│           ├── model-3
│           │   ├── first_stage.py
│           │   ├── __init__.py
│           │   ├── model.py
│           │   └── second_stage.py
│           ├── model-4
│           │   ├── first_stage.py
│           │   ├── __init__.py
│           │   ├── model.py
│           │   └── second_stage.py
│           └── model-5
│               ├── first_stage.py
│               ├── __init__.py
│               ├── model.py
│               └── second_stage.py
├── LICENSE
├── menu.sh
├── poetry.lock
├── pyproject.toml
├── README.md
├── scripts
│   └── get_database.sh
└── src
    ├── __init__.py
    ├── check_data.py
    ├── generate_autoencoders_chromagram.py
    ├── generate_autoencoders_mel_spectrogram.py
    ├── generate_autoencoders_mfcc.py
    ├── generate_autoencoders_stft.py
    ├── generate_graph.py
    ├── generate_holdout.py
    ├── generate_info_data.py
    ├── generate_spectrogram.py
    ├── generate_structure.py
    ├── metrics.py
    ├── model_autoencoders_chromagram.py
    ├── model_autoencoders_mel_spectrogram.py
    ├── model_autoencoders_mfcc.py
    └── model_autoencoders_stft.py


Project based on the cookiecutter data science project template. #cookiecutterdatascience