PhotoZen AI

PhotoZen AI 是一个集成了 OCR、CLIP 和人像识别功能的智能相册 AI 服务中心。该项目基于 FastAPI 框架构建，提供了强大的图像处理和分析能力。

项目截图

主界面展示

API接口服务

主要功能

OCR 文字识别：支持从图片中提取文字信息
CLIP 图像理解：基于 OpenAI 的 CLIP 模型，实现图像语义理解
人像识别：支持人脸检测和特征提取
Docker 部署：提供完整的容器化部署方案
API 接口：提供 RESTful API 接口，方便集成
系统监控：支持服务状态监控和日志查看

技术栈

FastAPI
Docker
CLIP
InsightFace
OpenCV
PaddleOCR

安装说明

使用 Docker 部署

构建镜像：

docker build -t xhongc/photozen-ai .

运行容器：

docker run -d -p 8060:8060 -v /var/run/docker.sock:/var/run/docker.sock --name photozen-ai photo-ai

使用 Docker Compose 部署

确保已安装 Docker 和 Docker Compose
使用 docker-compose 启动服务：

docker-compose up -d

查看服务状态：

docker-compose ps

停止服务：

docker-compose down

API 接口

OCR 接口

路径：/ocr
方法：POST
功能：图片文字识别
示例：

curl -X POST "http://localhost:8060/ocr" \
     -H "api-key: your-api-key" \
     -F "file=@/path/to/your/image.jpg"

CLIP 接口

路径：/clip/img 和 /clip/txt
方法：POST
功能：图像语义理解和文本匹配
示例：

# 图像理解
curl -X POST "http://localhost:8060/clip/img" \
     -H "api-key: your-api-key" \
     -F "file=@/path/to/your/image.jpg"

# 文本匹配
curl -X POST "http://localhost:8060/clip/txt" \
     -H "api-key: your-api-key" \
     -H "Content-Type: application/json" \
     -d '{"text": "描述图片内容的文本"}'

人像识别接口

路径：/represent
方法：POST
功能：人脸特征提取
示例：

curl -X POST "http://localhost:8060/represent" \
     -H "api-key: your-api-key" \
     -F "file=@/path/to/your/face.jpg"

系统管理接口

/check：服务状态检查

常见问题

Q: 如何获取 API 密钥？

A: 在首次部署时，系统会自动生成 API 密钥，可以在环境变量中配置。

Q: 服务启动失败怎么办？

A: 请检查以下几点：

确保 Docker 和 Docker Compose 已正确安装
检查端口 8060 是否被占用
查看容器日志：docker logs photozen-ai

Q: 如何提高识别准确率？

A: 可以尝试以下方法：

确保图片质量清晰
调整环境变量中的检测阈值
使用更高性能的 GPU

许可证

本项目采用 MIT 许可证，详情请参见 LICENSE 文件。

贡献

欢迎提交 Issue 和 Pull Request 来帮助改进项目。

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
docs		docs
templates		templates
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
bert_tokenizer.py		bert_tokenizer.py
clip.py		clip.py
config.py		config.py
docker_compose.yml		docker_compose.yml
main.py		main.py
model_manager.py		model_manager.py
readme.md		readme.md
requirements.txt		requirements.txt
sources.list		sources.list
vocab.txt		vocab.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

PhotoZen AI

项目截图

主要功能

技术栈

安装说明

使用 Docker 部署

使用 Docker Compose 部署

API 接口

OCR 接口

CLIP 接口

人像识别接口

系统管理接口

常见问题

Q: 如何获取 API 密钥？

Q: 服务启动失败怎么办？

Q: 如何提高识别准确率？

许可证

贡献

About

Uh oh!

Releases

Packages

Uh oh!

Languages

License

xhongc/photozen-ai

Folders and files

Latest commit

History

Repository files navigation

PhotoZen AI

项目截图

主要功能

技术栈

安装说明

使用 Docker 部署

使用 Docker Compose 部署

API 接口

OCR 接口

CLIP 接口

人像识别接口

系统管理接口

常见问题

Q: 如何获取 API 密钥？

Q: 服务启动失败怎么办？

Q: 如何提高识别准确率？

许可证

贡献

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages