Projeto de Mestrado - Visão Computacional
Discente: Frankson Souza
A geração automática de imagens artísticas e estilizadas a partir de prompts textuais e imagens de estilo vem se destacando como uma das aplicações mais populares da inteligência artificial generativa. Este projeto propõe a criação de uma interface interativa com Streamlit, integrando modelos de difusão como o Stable Diffusion e variações com fine tuning, para gerar imagens estilizadas a partir de:
- Prompt textual
- Imagem de referência (opcional)
- Modelo de estilo artístico
Essas técnicas se enquadram na Redes Generativas, com impacto relevante em áreas como design gráfico, entretenimento e educação.
- Geração de imagem com modelos base de Stable Diffusion
- Aplicação de estilos com modelos ajustados (Van Gogh, Ghibli, Pixar)
- Interface amigável via Streamlit
- Download direto das imagens geradas
- Suporte a aceleração com GPU via PyTorch
- Python 3.12+
- Poetry (gerenciador de dependências)
- Streamlit
- Diffusers (HuggingFace)
- PyTorch e CUDA
- PIL (Pillow) para manipulação de imagens
- Python 3.12+
- GPU com suporte a CUDA (opcional, mas recomendado)
- Clone o repositório:
git clone https://github.com/seu-usuario/nome-do-projeto.git
cd nome-do-projeto
- Instale o Poetry:
curl -sSL https://install.python-poetry.org | python3 -
- Instale as dependências:
poetry install
- Ative o ambiente virtual:
poetry shell
Execute o aplicativo Streamlit com:
streamlit run app.py
dallinmackay/Van-Gogh-diffusion
nitrosocke/Ghibli-Diffusion
lavaman131/cartoonify
— estilo Pixar/Disney
Interface - Tela 1 | Interface - Tela 2 |
---|---|
![]() |
![]() |