RIB Extractor est un outil complet permettant d’extraire automatiquement les informations d’un RIB français, que ce soit via :
-
🟦 OCR Tesseract (version autonome, locale, sans API)
-
🟨 IA Vision (VLM) Gemini 2.0 Flash (lecture visuelle solide directement sur PDF/images)
L’application est disponible en ligne : 👉 https://mastocodeur-rib-extractor-app-su5k18.streamlit.app/
Quel que soit le mode choisi (OCR ou VLM), l’outil extrait :
- Titulaire du compte
- Code Banque
- Code Guichet
- Numéro de compte
- Clé RIB
- IBAN (format propre et espacés 4/4)
- BIC / SWIFT (normalisation automatique)
- Domiciliation multi-lignes
- Export
.csvutilisable dans Excel (zéros conservés) - Export
.xlsx - Export
.parquet
- Le script lit chaque fichier PDF présent dans le dossier
rib/. - Chaque page est convertie en image haute résolution (300 dpi).
- L’image est analysée par Tesseract OCR pour produire un texte brut.
- Des expressions régulières et heuristiques détectent les champs bancaires.
- Les résultats sont formatés, validés et exportés dans
rib_infos.csv.
git clone https://github.com/Mastocodeur/rib-extractor.git
cd rib-extractoruv venv
source .venv/bin/activateuv pip install -e .sudo apt install tesseract-ocr tesseract-ocr-fra poppler-utils- Dépose tous tes fichiers PDF de RIB dans le dossier
rib/. - Exécute le script principal :
uv run python rib_extractor.py
ou
uv run streamlit run app_with_ocr.py- Les résultats sont exportés dans :
rib_infos.csv
On notera que cette version fait des erreurs.
Cette version utilise le modèle Gemini 2.0 Flash Vision via l’API REST Google.
Elle lit :
- PDF natifs
- PDF scannés
- Photos de RIB
- RIB partiellement illisibles par OCR
L’IA extrait directement le contenu visuel sans OCR local.
L'avantage est sa robustesse sur tous les formats (photo, scan, flou) et la diminution drastique du nombre d'erreurs vis à vis de la version avec OCR.
-
Aller sur Google AI Studio : https://ai.google.dev
-
Menu “API Keys” ==> Générer une clé API.
-
Pour la version Streamlit Cloud : il faudra ajouter cette clé API dans Settings puis Secrets.
-
Pour une utilisation locale : Créer un fichier
.env -
uv run streamlit run app.py
Ce projet est distribué sous licence MIT. Les contributions sont les bienvenues !
Développé par : GASMI Rémy