OOD-robust Hybrid Code Networks

A suite of methods for improving robustness of task-oriented dialogue models.

Code for paper "Improving Robustness of Dialog Systems in a Data-Efficient Way with Turn Dropout" by Igor Shalyminov and Sungjin Lee. [Paper - presented at ConvAI Workshop@NeurIPS 2018] [Poster]

HCN implementation is based on https://github.com/johndpope/hcn

Repo with OOD-augmented data

Setup with Conda

conda create -n ood_robust_hcn python=3.7 cython tensorflow-gpu==1.14.0
conda activate ood_robust_hcn
pip install -r requirements.txt

Dialog control with HCN

0.1 Download word2vec vectors:

cd hcn/data; sh get_word2vec.sh

0.2 Initialize the datasets

git submodule update --init

cd icassp-ood-dataset; unzip *.zip

Training:

cd hcn; python train.py data ../icassp-ood-dataset/babi_task6 ../icassp-ood-dataset/babi_task6_ood_0.2_0.4 <model folder> configs/<config-json> [--custom_vocab <vocab file>]

Evaluation:

cd hcn; python evaluate.py data ../icassp-ood-dataset/babi_task6 ../icassp-ood-dataset/babi_task6_ood_0.2_0.4 <model folder> [clean/noisy]

Standalone OOD detection

Autoencoder-based

Making a dataset for AE:

python make_dataset_for_autoencoder.py hcn/data <result folder>

Training an AE:

cd ae_ood; python train_ae.py <AE dataset folder>/trainset <AE dataset folder>/devset <AE dataset folder>/testset <model folder>

Evaluating the AE:

cd ae_ood; python evaluate.py <model folder> <AE dataset folder>/devset <AE dataset folder>/evalset --decision_type [min/max/avg]

VAE-based

Training a VAE:

cd vae; python train.py <AE dataset folder>/trainset <AE dataset folder>/devset <AE dataset folder>/testset <model folder>

Evaluating the VAE:

`cd vae; python evaluate_vae_ood.py /devset /evalset --decision_type [min/max/avg] --loss_components [kl_loss(,nll_loss)]``

Custom OOD data generation

bAbI Dialog Task 6 augmentation:

Run the notebooks:

mining_ood_reddit.ipynb, mining_ood_twitter.ipynb, mining_foreign_domain_ood.ipynb, mining_ood_breakdown.ipynb

cd babi_tools; sh make_ood_dataset.sh ../hcn/data ../data/babi_task6_ood_dataset_<parameters>

ood_augmentation.json config file will be used which sets the probabilities of OOD sequence start and continuation respectively.

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
__legacy/vae_ood		__legacy/vae_ood
ae_ood		ae_ood
babi_tools		babi_tools
hcn		hcn
icassp2019-ood-dataset @ a0286e7		icassp2019-ood-dataset @ a0286e7
utils		utils
vae		vae
.gitmodules		.gitmodules
README.md		README.md
__init__.py		__init__.py
load_sungjin_data.ipynb		load_sungjin_data.ipynb
looking_at_babi_task6.ipynb		looking_at_babi_task6.ipynb
looking_at_vae_z.ipynb		looking_at_vae_z.ipynb
make_dataset_for_autoencoder.py		make_dataset_for_autoencoder.py
mining_breakdown_ood.ipynb		mining_breakdown_ood.ipynb
mining_foreign_domain_ood.ipynb		mining_foreign_domain_ood.ipynb
mining_ood_reddit.ipynb		mining_ood_reddit.ipynb
mining_ood_ticktock.ipynb		mining_ood_ticktock.ipynb
mining_ood_twitter.ipynb		mining_ood_twitter.ipynb
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

OOD-robust Hybrid Code Networks

Setup with Conda

Dialog control with HCN

Standalone OOD detection

Custom OOD data generation

About

Releases

Packages

Contributors 2

Languages

ishalyminov/ood_robust_hcn

Folders and files

Latest commit

History

Repository files navigation

OOD-robust Hybrid Code Networks

Setup with Conda

Dialog control with HCN

Standalone OOD detection

Custom OOD data generation

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages