자연어 이미지 검색

Streamlit과 sentence-transformers/clip-ViT-B-32-multilingual-v1 모델을 사용하여 텍스트로 유사 이미지를 검색하는 웹 애플리케이션입니다.

주요 기능

여러 이미지 파일을 한 번에 업로드
FAISS를 사용하여 이미지 검색 인덱스 구축
clip-ViT-B-32-multilingual-v1 모델을 사용한 다국어 자연어 이미지 검색
실시간 유사도 검색 결과 확인

동작 원리

이 애플리케이션은 다국어를 지원하는 clip-ViT-B-32-multilingual-v1 모델을 사용하여 이미지와 텍스트 쿼리의 임베딩(embedding)을 생성합니다. 이 임베딩은 이미지와 텍스트의 의미적 내용을 고차원 벡터 공간에 표현한 것입니다.

생성된 이미지 임베딩은 효율적인 유사도 검색을 위해 FAISS(Facebook AI Similarity Search) 인덱스에 저장됩니다. 사용자가 텍스트 쿼리를 입력하면, 모델이 해당 텍스트의 임베딩을 계산하고 FAISS 인덱스 내에서 가장 유사한 이미지 임베딩을 찾아 결과를 반환합니다. 이 모델은 다국어를 지원하므로 별도의 번역 과정 없이 다양한 언어로 검색할 수 있습니다.

개발 환경 설정 및 실행

이 프로젝트는 uv를 사용하여 가상 환경 및 패키지를 관리합니다.

1. 사전 준비

Python 3.12 이상
uv 설치

2. 애플리케이션 실행

uv run을 사용하면 가상 환경을 활성화하지 않고도 바로 실행할 수 있습니다.

uv run python -m streamlit run main.py

실행 후 터미널에 표시되는 로컬 URL(보통 http://localhost:8501)에 접속하여 애플리케이션을 사용할 수 있습니다.

참고:

앱을 처음 실행할 때 모델을 다운로드하므로 시간이 다소 걸릴 수 있습니다.
현재 FAISS 인덱스는 메모리에서만 생성되므로 앱을 재시작하면 사라집니다.
프로젝트 변경 이력은 CHANGELOG.md를 참고하세요.

이 프로젝트의 README 작성 및 코드 일부는 Google Gemini의 도움을 받아 작성되었습니다.

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
docs		docs
.gitignore		.gitignore
.python-version		.python-version
CHANGELOG.md		CHANGELOG.md
README.md		README.md
main.py		main.py
pyproject.toml		pyproject.toml
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

자연어 이미지 검색

주요 기능

동작 원리

개발 환경 설정 및 실행

1. 사전 준비

2. 애플리케이션 실행

참고:

About

Uh oh!

Languages

maakcode/deep-image-search

Folders and files

Latest commit

History

Repository files navigation

자연어 이미지 검색

주요 기능

동작 원리

개발 환경 설정 및 실행

1. 사전 준비

2. 애플리케이션 실행

참고:

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Languages