Skip to content

maakcode/deep-image-search

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

25 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

자연어 이미지 검색

Streamlitsentence-transformers/clip-ViT-B-32-multilingual-v1 모델을 사용하여 텍스트로 유사 이미지를 검색하는 웹 애플리케이션입니다.

주요 기능

  • 여러 이미지 파일을 한 번에 업로드
  • FAISS를 사용하여 이미지 검색 인덱스 구축
  • clip-ViT-B-32-multilingual-v1 모델을 사용한 다국어 자연어 이미지 검색
  • 실시간 유사도 검색 결과 확인

동작 원리

이 애플리케이션은 다국어를 지원하는 clip-ViT-B-32-multilingual-v1 모델을 사용하여 이미지와 텍스트 쿼리의 임베딩(embedding)을 생성합니다. 이 임베딩은 이미지와 텍스트의 의미적 내용을 고차원 벡터 공간에 표현한 것입니다.

생성된 이미지 임베딩은 효율적인 유사도 검색을 위해 FAISS(Facebook AI Similarity Search) 인덱스에 저장됩니다. 사용자가 텍스트 쿼리를 입력하면, 모델이 해당 텍스트의 임베딩을 계산하고 FAISS 인덱스 내에서 가장 유사한 이미지 임베딩을 찾아 결과를 반환합니다. 이 모델은 다국어를 지원하므로 별도의 번역 과정 없이 다양한 언어로 검색할 수 있습니다.

개발 환경 설정 및 실행

이 프로젝트는 uv를 사용하여 가상 환경 및 패키지를 관리합니다.

1. 사전 준비

  • Python 3.12 이상
  • uv 설치

2. 애플리케이션 실행

uv run을 사용하면 가상 환경을 활성화하지 않고도 바로 실행할 수 있습니다.

uv run python -m streamlit run main.py

실행 후 터미널에 표시되는 로컬 URL(보통 http://localhost:8501)에 접속하여 애플리케이션을 사용할 수 있습니다.

참고:

  • 앱을 처음 실행할 때 모델을 다운로드하므로 시간이 다소 걸릴 수 있습니다.
  • 현재 FAISS 인덱스는 메모리에서만 생성되므로 앱을 재시작하면 사라집니다.
  • 프로젝트 변경 이력은 CHANGELOG.md를 참고하세요.

이 프로젝트의 README 작성 및 코드 일부는 Google Gemini의 도움을 받아 작성되었습니다.