# SpaFu02 – Bewertung OCR-Alternativen
tags: [sparfuchs, spafu02, ocr, bewertung]
erstellt: 2026-06-13
---
## Kontext
Bewertet werden drei OCR-Ansätze für die PDF-Verarbeitung von Discounter-Prospekten im Rahmen von SpaFu02. Referenzdokument: "OCR-Alternativen für Discounter-Angebote".
---
## Bewertung
### Ansatz 1: Open-Source (EasyOCR / Tesseract)
- Kostenlos und lokal – passt zu System "Gen"
- Kernproblem: Koordinaten-Zuordnung (Preis ↔ Produkt) muss selbst programmiert werden
- Das ist der schwierigste Teil bei Prospekten mit komplexem Layout
- Realistischer Aufwand: 2-3 Wochen nur für die Zuordnungslogik
- **Fazit: Zu aufwändig für den Nutzen**
### Ansatz 2: KI-Layout (Surya / LayoutParser)
- Besseres Layout-Verständnis als Ansatz 1
- GPU-Anforderung problematisch – kein dedizierter GPU im Homelab (RTX 3060 wäre Option, aber primär für Ollama evaluiert)
- Hohe Einarbeitungszeit
- **Fazit: Interessant, aber zu schwergewichtig für den Start**
### Ansatz 3: Enterprise Cloud (Google Document AI / AWS Textract)
- Teurer als Claude API ohne nennenswerten Vorteil
- Datenübertragung in fremde Cloud unnötig
- **Fazit: Nicht nötig, da Claude API bereits eingeplant ist**
---
## Gesamteinschätzung
Die verglichenen Ansätze sind Alternativen zu Claude API – aber **Claude API ist für SpaFu02 bereits die beste Option**:
- Versteht Prospekt-Layout ohne eigene Koordinaten-Programmierung
- Liefert direkt strukturiertes JSON
- Günstiger als Google/AWS (~30 Cent/Woche für alle Händler)
- Läuft auf System "Gen" ohne GPU
- Selbsteinschätzung (cc_guete) bereits im Schema vorgesehen
Die OCR-Alternativen-Note bleibt als Dokumentation nützlich, falls Claude API später problematisch wird (Kosten, Verfügbarkeit, Nutzungsbedingungen).
---
## Verwandte Dateien
- [SpaFu02-Vorgaben.md](SpaFu02-Vorgaben.md)
- [schema_v6.sql](schema_v6.sql)