🧾 RIB Extractor

RIB Extractor est un outil complet permettant d’extraire automatiquement les informations d’un RIB français, que ce soit via :

🟦 OCR Tesseract (version autonome, locale, sans API)
🟨 IA Vision (VLM) Gemini 2.0 Flash (lecture visuelle solide directement sur PDF/images)

L’application est disponible en ligne : 👉 https://mastocodeur-rib-extractor-app-su5k18.streamlit.app/

🚀 Fonctionnalités

Quel que soit le mode choisi (OCR ou VLM), l’outil extrait :

Titulaire du compte
Code Banque
Code Guichet
Numéro de compte
Clé RIB
IBAN (format propre et espacés 4/4)
BIC / SWIFT (normalisation automatique)
Domiciliation multi-lignes
Export .csv utilisable dans Excel (zéros conservés)
Export .xlsx
Export .parquet

Version OCR locale : `app_with_ocr.py`

Le script lit chaque fichier PDF présent dans le dossier rib/.
Chaque page est convertie en image haute résolution (300 dpi).
L’image est analysée par Tesseract OCR pour produire un texte brut.
Des expressions régulières et heuristiques détectent les champs bancaires.
Les résultats sont formatés, validés et exportés dans rib_infos.csv.

⚙️ Installation

1. Cloner le projet

git clone https://github.com/Mastocodeur/rib-extractor.git
cd rib-extractor

2. Créer un environnement virtuel (via uv ou venv)

uv venv
source .venv/bin/activate

3. Installer les dépendances (depuis pyproject.toml)

uv pip install -e .

4. Installer Tesseract OCR et Poppler

sudo apt install tesseract-ocr tesseract-ocr-fra poppler-utils

Utilisation

Dépose tous tes fichiers PDF de RIB dans le dossier rib/.
Exécute le script principal :

uv run python rib_extractor.py

ou

uv run streamlit run app_with_ocr.py

Les résultats sont exportés dans : rib_infos.csv

On notera que cette version fait des erreurs.

Version IA Vision Gemini : `app.py`

Cette version utilise le modèle Gemini 2.0 Flash Vision via l’API REST Google.

Elle lit :

PDF natifs
PDF scannés
Photos de RIB
RIB partiellement illisibles par OCR

L’IA extrait directement le contenu visuel sans OCR local.

L'avantage est sa robustesse sur tous les formats (photo, scan, flou) et la diminution drastique du nombre d'erreurs vis à vis de la version avec OCR.

🔑 Obtenir une clé API Gemini

Aller sur Google AI Studio : https://ai.google.dev
Menu “API Keys” ==> Générer une clé API.
Pour la version Streamlit Cloud : il faudra ajouter cette clé API dans Settings puis Secrets.
Pour une utilisation locale : Créer un fichier .env
uv run streamlit run app.py

Licence

Ce projet est distribué sous licence MIT. Les contributions sont les bienvenues !

Auteur

Développé par : GASMI Rémy

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
rib		rib
.gitignore		.gitignore
README.md		README.md
app.py		app.py
app_with_ocr.py		app_with_ocr.py
packages.txt		packages.txt
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
rib_extractor.py		rib_extractor.py
utils.py		utils.py
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

🧾 RIB Extractor

🚀 Fonctionnalités

Version OCR locale : `app_with_ocr.py`

⚙️ Installation

1. Cloner le projet

2. Créer un environnement virtuel (via uv ou venv)

3. Installer les dépendances (depuis pyproject.toml)

4. Installer Tesseract OCR et Poppler

Utilisation

Version IA Vision Gemini : `app.py`

🔑 Obtenir une clé API Gemini

Licence

Auteur

About

Uh oh!

Releases

Packages

Languages

Mastocodeur/rib-extractor

Folders and files

Latest commit

History

Repository files navigation

🧾 RIB Extractor

🚀 Fonctionnalités

Version OCR locale : app_with_ocr.py

⚙️ Installation

1. Cloner le projet

2. Créer un environnement virtuel (via uv ou venv)

3. Installer les dépendances (depuis pyproject.toml)

4. Installer Tesseract OCR et Poppler

Utilisation

Version IA Vision Gemini : app.py

🔑 Obtenir une clé API Gemini

Licence

Auteur

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Version OCR locale : `app_with_ocr.py`

Version IA Vision Gemini : `app.py`

Packages