# 📑 OCR-Alternativen für Discounter-Angebote
Da Discounter-Prospekte überwiegend aus Bildern mit komplexen Layouts (Preise, Produktnamen, Spalten) bestehen, reicht reine PDF-Textextraktion nicht aus. Es wird eine Kombination aus **Bild-Extraktion, OCR (Texterkennung) und Layout-Analyse** benötigt.
---
## 🛠️ Die 3 Lösungsansätze im Überblick
### 1. Die Open-Source-Kombination (Lokal & Kostenlos)
> [!success] Ideal für: Entwickler, die eine komplett kostenlose, lokale und datenschutzkonforme Lösung suchen.
* **Funktionsweise:** `PyMuPDF` extrahiert die Bilder verlustfrei aus der PDF. Danach erkennt `EasyOCR` oder `Tesseract` den Text auf den Bildern.
* **Vorteil:** Keine Cloud-Kosten, läuft komplett offline. `EasyOCR` schneidet bei bunten, unruhigen Discounter-Hintergründen oft besser ab als Tesseract.
* **Nachteil:** Die Zuordnung (welcher Preis gehört zu welchem Text) muss nachträglich über die Koordinaten im Code selbst logisch verknüpft werden.
### 2. KI- & Layout-Spezialisten (Moderne lokale KI)
> [!info] Ideal für: Komplexe Raster-Layouts, bei denen Textzeilen präzise blockweise erkannt werden müssen.
* **Funktionsweise:** Tools wie `Surya` oder `LayoutParser` nutzen Deep-Learning-Modelle, um die Struktur der Seite zu verstehen.
* **Vorteil:** Sie erkennen automatisch, wo ein Produkt-Flyer-Ausschnitt anfängt und aufhört. Sehr hohe Genauigkeit bei mehrspaltigen Texten.
* **Nachteil:** Benötigt deutlich mehr Rechenleistung (am besten eine dedizierte Grafikkarte/GPU) und etwas Einarbeitungszeit bei der Einrichtung.
### 3. Enterprise Cloud-Dienste (Plug & Play)
> [!warning] Ideal für: Schnelle, produktive Ergebnisse ohne großen Programmieraufwand, sofern ein Budget vorhanden ist.
* **Funktionsweise:** Übergabe der Dokumente an `Google Cloud Document AI` oder `AWS Textract`.
* **Vorteil:** Extrem hohe Erkennungsrate. Diese Dienste bieten spezialisierte Modelle, die "Key-Value-Pairs" (z. B. Produktname ↔ Preis) automatisch zusammenhängend erkennen und als fertige Tabelle ausgeben.
* **Nachteil:** Kosten pro API-Aufruf (auch wenn es oft kostenlose monatliche Kontingente gibt). Daten werden an Cloud-Server übertragen.
---
## 📊 Direktvergleich für Prospekt-Extraktion
| Kriterium | 1. Open-Source (EasyOCR) | 2. KI-Layout (Surya) | 3. Cloud (AWS/Google) |
| :--- | :--- | :--- | :--- |
| **Kosten** | Kostenlos 🆓 | Kostenlos 🆓 | Kostenpflichtig 💰 |
| **Erkennungsrate** | Gut ⭐⭐⭐ | Sehr Gut ⭐⭐⭐⭐ | Exzellent ⭐⭐⭐⭐⭐ |
| **Layout-Verständnis** | Gering (nur Textzeilen) | Hoch (erkennt Blöcke) | Extrem Hoch (Tabellen/Paare) |
| **Hardware-Hunger** | Niedrig (CPU reicht) | Hoch (GPU empfohlen) | Keiner (Cloud-Berechnung) |
| **Datenschutz** | 100% Lokal 🔒 | 100% Lokal 🔒 | Datenverarbeitung in Cloud 🌐 |
---
## 🚀 Nächste Schritte & Notizen
- [ ] Erste Test-PDF eines Discounterns in einen Ordner legen.
- [ ] Python-Umgebung aufsetzen.
- [ ] Entscheidung treffen: Reicht die lokale Open-Source-Variante oder wird Cloud-Unterstützung für die Tabellenstruktur benötigt?
---
*Erstellt am: 13. Juni 2026*