Quantum Diffusion Models

The official implement of "Quantum Generative Models for Image Generation: Insights from MNIST and MedMNIST". A novel approach to image generation using quantum-enhanced diffusion models. This project implements diffusion models enhanced with quantum circuits for medical and standard image generation.

📋 Overview

This repository explores the integration of quantum computing into diffusion models for image generation. The implementation provides both classical and quantum-enhanced versions of diffusion models for MNIST and PathMNIST datasets.

Key features:

Quantum-enhanced attention mechanism for diffusion models
Classical vs quantum model comparison framework
Evaluation metrics (FID, SSIM) for generated images
Support for MNIST and PathMNIST medical datasets
We trained the quantum diffusion model with fewer than 100 images, demonstrating the advantage of quantum layers in low-data regimes.

🚀 Models

Diffusion Model Architecture

U-Net backbone with residual blocks and skip connections
Flexible channels for both MNIST (grayscale) and PathMNIST (RGB)
Timestep embedding using sinusoidal positional encoding
Cosine beta scheduling for improved sampling
Exponential Moving Average (EMA) for stable training

Quantum Enhancement

Hybrid quantum-classical model with quantum attention layers
Parameterized quantum circuits implemented using PennyLane
RY and RZ rotations with CNOT entanglement structure
Quantum feature re-weighting mechanism

💿 Datasets

MNIST

Standard handwritten digit recognition dataset
Trained on individual digit classes (0-9)
Grayscale images (1-channel, 28×28)

PathMNIST

Medical imaging dataset from MedMNIST collection
Colorectal cancer histology patches
RGB images (3-channel, 28×28)
Class-conditional training

📊 Results

Training Progression Comparison

The following GIFs demonstrate the training progression of both classical and quantum diffusion models for each MNIST digit. Notice how the models learn to generate increasingly refined digit representations over 30 epochs:

Digit 0

Classical Model	Quantum Model

Digit 1

Classical Model	Quantum Model

Digit 2

Classical Model	Quantum Model

Digit 3

Classical Model	Quantum Model

Digit 4

Classical Model	Quantum Model

Digit 5

Classical Model	Quantum Model

Digit 6

Classical Model	Quantum Model

Digit 7

Classical Model	Quantum Model

Digit 8

Classical Model	Quantum Model

Digit 9

Classical Model	Quantum Model

Quantitative Evaluation

The project evaluates generated images using:

Fréchet Inception Distance (FID): measures the similarity between generated and real image distributions
Structural Similarity Index (SSIM): measures the perceptual difference between images

Sample results comparing classical and quantum models:

Model	Dataset	FID↓	SSIM↑
Classical	MNIST	271.05	0.1085
Quantum	MNIST	259.25	0.1263
-------	---------	------	-------
Classical	PathMNIST	95.72	0.4107
Quantum	PathMNIST	84.40	0.0931

I tried using the full skip-connection U-Net (v8) for this generation as well, but it didn’t outperform the lightweight one.

Model	Dataset	FID↓	SSIM↑
Classical	MNIST	275.68	0.0267
Quantum	MNIST	288.40	0.0323

🔧 Implementation

Training

# Train classical diffusion model on MNIST
python quantum_difussion_mnist_v7.py  # --use_quantum=False

# Train quantum diffusion model on MNIST
python quantum_difussion_mnist_v7.py  # --use_quantum=True

# Train on PathMNIST
python quantum_difussion_pathmnist_v7.py  # --use_quantum=True/False

Evaluation

# Evaluate generated PathMNIST samples
python cal_fid_ssim_medmnist.py

# Evaluate generated MNIST samples
python cal_fid_ssim.py

# Debug image splitting for FID calculation
python debug_img.py

📦 Installation

# Clone the repository
git clone https://github.com/ChiShengChen/Quantum_MNIST_Diffusion.git
cd Quantum_MNIST_Diffusion

# Create a conda environment
conda create -n quantum-diffusion python=3.8
conda activate quantum-diffusion

# Install dependencies
pip install torch torchvision tqdm matplotlib pennylane medmnist scikit-image scipy

📝 Citation

If you use this code for your research, please cite:

@article{chen2025quantum,
  title={Quantum Generative Models for Image Generation: Insights from MNIST and MedMNIST},
  author={Chen, Chi-Sheng and Hou, Wei An and Hu, Siang-Wei and Cai, Zhen-Sheng},
  journal={arXiv preprint arXiv:2504.00034},
  year={2025}
}

📄 License

This project is licensed under the MIT License - see the LICENSE file for details.

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
full_unet		full_unet
result_gif		result_gif
README.md		README.md
cal_fid_ssim.py		cal_fid_ssim.py
cal_fid_ssim_medmnist.py		cal_fid_ssim_medmnist.py
quantum_difussion_mnist_v7.py		quantum_difussion_mnist_v7.py
quantum_difussion_pathmnist_v7.py		quantum_difussion_pathmnist_v7.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Quantum Diffusion Models

📋 Overview

🚀 Models

Diffusion Model Architecture

Quantum Enhancement

💿 Datasets

MNIST

PathMNIST

📊 Results

Training Progression Comparison

Digit 0

Digit 1

Digit 2

Digit 3

Digit 4

Digit 5

Digit 6

Digit 7

Digit 8

Digit 9

Quantitative Evaluation

🔧 Implementation

Training

Evaluation

📦 Installation

📝 Citation

📄 License

About

Uh oh!

Releases

Packages

Languages

ChiShengChen/Quantum_MNIST_Diffusion

Folders and files

Latest commit

History

Repository files navigation

Quantum Diffusion Models

📋 Overview

🚀 Models

Diffusion Model Architecture

Quantum Enhancement

💿 Datasets

MNIST

PathMNIST

📊 Results

Training Progression Comparison

Digit 0

Digit 1

Digit 2

Digit 3

Digit 4

Digit 5

Digit 6

Digit 7

Digit 8

Digit 9

Quantitative Evaluation

🔧 Implementation

Training

Evaluation

📦 Installation

📝 Citation

📄 License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages