IMProv: Inpainting-based Multimodal Prompting for Computer Vision Tasks

This repository is the official implementation of IMProv introduced in the TMLR 2024 paper:

IMProv: Inpainting-based Multimodal Prompting for Computer Vision Tasks

Jiarui Xu, Yossi Gandelsman, Amir Bar, Jianwei Yang, Jianfeng Gao, Trevor Darrell, Xiaolong Wang

Visual Results

More in project page: https://jerryxu.net/IMProv/

Links

Jiarui Xu's Project Page (with additional visual results)

HuggingFace 🤗 Model
Run the demo on Google Colab:
arXiv Page

Citation

If you find our work useful in your research, please cite:

@article{xu2023improv,
  author    = {Xu, Jiarui and Gandelsman, Yossi and Bar, Amir and Yang, Jianwei and Gao, Jianfeng and Darrell, Trevor and Wang, Xiaolong},
  title     = {{IMProv: Inpainting-based Multimodal Prompting for Computer Vision Tasks}},
  journal   = {arXiv preprint arXiv: 2312.01771},
  year      = {2023},
}

🏷️ TODO

Release inference code and demo.
Release checkpoints.
Release S2CV dataset.
Release training codes.

🛠️ Environment Setup

Install dependencies by running:

conda install pytorch=2.0 torchvision pytorch-cuda=11.7 -c pytorch -c nvidia
git clone https://github.com/xvjiarui/IMProv.git
pip install -e IMProv

▶️ Demo

python demo/demo.py --output demo/output.png

The output is saved in demo/output.png.

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
demo		demo
figs		figs
improv		improv
.gitignore		.gitignore
README.md		README.md
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

IMProv: Inpainting-based Multimodal Prompting for Computer Vision Tasks

Visual Results

Links

Citation

🏷️ TODO

🛠️ Environment Setup

▶️ Demo

About

Releases

Packages

Languages

qxy6463/IMProv

Folders and files

Latest commit

History

Repository files navigation

IMProv: Inpainting-based Multimodal Prompting for Computer Vision Tasks

Visual Results

Links

Citation

🏷️ TODO

🛠️ Environment Setup

▶️ Demo

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages