Archivierte SCAN-PDFs mit optischer Zeichenerkennung verarbeiten
Beispiele
Referenz
ARCHIVE OCR( Archivnummer ; Flags )
Die Funktion führt eine optische Zeichenerkennung mit der im Dokumentenarchiv gespeichertenDatei durch. Bei der Datei muss es sich um eine PDF-Bild-Datei handeln. Solche Dateien werdenin der Regeln von Scannern erzeugt. Die Anweisung erzeugt eine neue PDF-Datei, die nebenden reinem Bild-Seiten zusätzlich den Text enthält. Es wird also eine durchsuchbare PDF-Dateierstellt. Das Format der neu erzeugten PDF-Datei ist PDF/A, also ein Archivformat. Die neuerstellte Datei erhält den gleichen Namen wie die alte Datei und wird als neue Version der bestehendenDatei im Archiv abgelegt.
Mit dem Flags-Parameter können zusätzliche Steueranweisungen angegeben werden. Der Parameter ter ist bitkodiert, entsprechend können die einzelnen Ziffern der Steueranweisungen einfach addiertwerden:
1: Es wird keine Fortschrittsmeldung ausgegeben
2: Es wird keine neue Version erstellt, sondern die neue Datei ersetzt die bestehende alte Datei.
Die Rückgabewerte der Funktion haben folgende Bedeutung:
Die Funktion führt eine optische Zeichenerkennung mit der im Dokumentenarchiv gespeichertenDatei durch. Bei der Datei muss es sich um eine PDF-Bild-Datei handeln. Solche Dateien werdenin der Regeln von Scannern erzeugt. Die Anweisung erzeugt eine neue PDF-Datei, die nebenden reinem Bild-Seiten zusätzlich den Text enthält. Es wird also eine durchsuchbare PDF-Dateierstellt. Das Format der neu erzeugten PDF-Datei ist PDF/A, also ein Archivformat. Die neuerstellte Datei erhält den gleichen Namen wie die alte Datei und wird als neue Version der bestehendenDatei im Archiv abgelegt.
Mit dem Flags-Parameter können zusätzliche Steueranweisungen angegeben werden. Der Parameter ter ist bitkodiert, entsprechend können die einzelnen Ziffern der Steueranweisungen einfach addiertwerden:
1: Es wird keine Fortschrittsmeldung ausgegeben
2: Es wird keine neue Version erstellt, sondern die neue Datei ersetzt die bestehende alte Datei.
Die Rückgabewerte der Funktion haben folgende Bedeutung:
| Ergebnis | Bedeutung |
|---|---|
| >0 | Die Datei wurde erfolgreich verarbeitet (neue Datensatznummer) |
| -1 | Es gibt keinen Archiveintrag mit der angegebenen Nummer |
| -2 | Bei dem angegebenen Archiveintrag handelt es sich nicht um eine PDF-Datei |
| -3 | Die angegebene PDF-Datei enthält keine Bilddaten oder es ist bereits eine OCR-Datei |
| -4 | Es konnten keine Textinformationen aus den Bilddaten extrahiert werden |
| -5 | Die neu erzeugte Datei konnte nicht ins Archiv hochgeladen werden |
| -10 | Die Datei konnte aus unbekanntem Grund nicht verarbeitet werden |


