Skip to content

Projetado para auxiliar com respostas a perguntas sobre qualquer documento, utilizando uma estratégia de Retrieval Augmented Generation - RAG.

Notifications You must be signed in to change notification settings

FelipeErmeson/General-RAG

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

General-RAG

O General-RAG é um aplicativo com a finalidade de ajudar a responder qualquer pergunta relacionada ao seu documento. É um aplicativo feito em Gradio e segue uma estratégia técnica de Retrieval Augmented Generation - RAG para melhorar a precisão das perguntas e amenizar as alucinações.

O app pode ser acessado aqui.

Visão Geral

Detalhes técnicos:

  • LangChain para orquestração de código para LLM e prompts para RAG.
  • FAISS banco de dados vetorial para pesquisa e recuperação otimizada de documentos.
  • Docling para reconhecimento de texto (OCR).
  • Qwen/Qwen2.5-7B-Instruct-GPTQ-Int8 (quantizado) LLM (Large Language Model) para geração da resposta.
  • sentence-transformers/all-MiniLM-L6-v2 modelo para geração de embeddings para recuperação de documentos no banco de similaridade.
  • Gradio para criação de componentes de interface e interação com o usuário.

Limitações:

  • Por questões de custo, o app General-RAG roda em uma máquina ZeroGPU do HuggingFace e portanto oferece limitações de vRAM, espaço em disco, rate limiting, throttling e outros.
  • O LLM Qwen/Qwen2.5-7B-Instruct-GPTQ-Int8 é um modelo quantizado, e portanto pode oferecer limitações de precisão nas respostas.
  • Banco de similaridade FAISS é indicado apenas para protótipo.
  • Documentos grandes podem apresentar problemas.
  • Este projeto foi feito com a finalidade para estudos e atualmente não possui nenhuma intenção de realizar mais avanços.

About

Projetado para auxiliar com respostas a perguntas sobre qualquer documento, utilizando uma estratégia de Retrieval Augmented Generation - RAG.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages