# SpaFu02 – Bewertung OCR-Alternativen tags: [sparfuchs, spafu02, ocr, bewertung] erstellt: 2026-06-13 --- ## Kontext Bewertet werden drei OCR-Ansätze für die PDF-Verarbeitung von Discounter-Prospekten im Rahmen von SpaFu02. Referenzdokument: "OCR-Alternativen für Discounter-Angebote". --- ## Bewertung ### Ansatz 1: Open-Source (EasyOCR / Tesseract) - Kostenlos und lokal – passt zu System "Gen" - Kernproblem: Koordinaten-Zuordnung (Preis ↔ Produkt) muss selbst programmiert werden - Das ist der schwierigste Teil bei Prospekten mit komplexem Layout - Realistischer Aufwand: 2-3 Wochen nur für die Zuordnungslogik - **Fazit: Zu aufwändig für den Nutzen** ### Ansatz 2: KI-Layout (Surya / LayoutParser) - Besseres Layout-Verständnis als Ansatz 1 - GPU-Anforderung problematisch – kein dedizierter GPU im Homelab (RTX 3060 wäre Option, aber primär für Ollama evaluiert) - Hohe Einarbeitungszeit - **Fazit: Interessant, aber zu schwergewichtig für den Start** ### Ansatz 3: Enterprise Cloud (Google Document AI / AWS Textract) - Teurer als Claude API ohne nennenswerten Vorteil - Datenübertragung in fremde Cloud unnötig - **Fazit: Nicht nötig, da Claude API bereits eingeplant ist** --- ## Gesamteinschätzung Die verglichenen Ansätze sind Alternativen zu Claude API – aber **Claude API ist für SpaFu02 bereits die beste Option**: - Versteht Prospekt-Layout ohne eigene Koordinaten-Programmierung - Liefert direkt strukturiertes JSON - Günstiger als Google/AWS (~30 Cent/Woche für alle Händler) - Läuft auf System "Gen" ohne GPU - Selbsteinschätzung (cc_guete) bereits im Schema vorgesehen Die OCR-Alternativen-Note bleibt als Dokumentation nützlich, falls Claude API später problematisch wird (Kosten, Verfügbarkeit, Nutzungsbedingungen). --- ## Verwandte Dateien - [SpaFu02-Vorgaben.md](SpaFu02-Vorgaben.md) - [schema_v6.sql](schema_v6.sql)