Archivierte SCAN-PDFs mit optischer Zeichenerkennung verarbeiten

Beispiele

Referenz

ARCHIVE OCR( Archivnummer ; Flags )
Die Funktion führt eine optische Zeichenerkennung mit der im Dokumentenarchiv gespeichertenDatei durch. Bei der Datei muss es sich um eine PDF-Bild-Datei handeln. Solche Dateien werdenin der Regeln von Scannern erzeugt. Die Anweisung erzeugt eine neue PDF-Datei, die nebenden reinem Bild-Seiten zusätzlich den Text enthält. Es wird also eine durchsuchbare PDF-Dateierstellt. Das Format der neu erzeugten PDF-Datei ist PDF/A, also ein Archivformat. Die neuerstellte Datei erhält den gleichen Namen wie die alte Datei und wird als neue Version der bestehendenDatei im Archiv abgelegt.

Mit dem Flags-Parameter können zusätzliche Steueranweisungen angegeben werden. Der Parameter ter ist bitkodiert, entsprechend können die einzelnen Ziffern der Steueranweisungen einfach addiertwerden:
1: Es wird keine Fortschrittsmeldung ausgegeben
2: Es wird keine neue Version erstellt, sondern die neue Datei ersetzt die bestehende alte Datei.

Die Rückgabewerte der Funktion haben folgende Bedeutung:
Ergebnis Bedeutung
>0 Die Datei wurde erfolgreich verarbeitet (neue Datensatznummer)
-1 Es gibt keinen Archiveintrag mit der angegebenen Nummer
-2 Bei dem angegebenen Archiveintrag handelt es sich nicht um eine PDF-Datei
-3 Die angegebene PDF-Datei enthält keine Bilddaten oder es ist bereits eine OCR-Datei
-4 Es konnten keine Textinformationen aus den Bilddaten extrahiert werden
-5 Die neu erzeugte Datei konnte nicht ins Archiv hochgeladen werden
-10 Die Datei konnte aus unbekanntem Grund nicht verarbeitet werden

Siehe auch



Schatten