UiPath Marketplace
Neuestes
False
Bannerhintergrundbild
UiPath Marketplace-Benutzerhandbuch
Letzte Aktualisierung 16. Apr. 2024

Analyze Multipage Document

Die Aktivität Analyze Multipage Document verwendet die Amazon Textract-APIs StartDocumentAnalysis und GetDocumentAnalysis , um ein mehrseitiges Dokument zu analysieren, das in einem S3-Bucket gespeichert ist (Bucket,DocumentName und Version). Wenn Ihr Dokument eine Tabelle enthält, haben Sie die Möglichkeit, anzugeben, ob die erste Zeile Spaltenüberschriften enthält (DiscoverColumnHeaders) und/oder leere Zeilen ignorieren (IgnoreEmptyRows).

Nach der Analyse des Dokuments gibt die Aktivität die Dokumenteigenschaften in einem PageDetailCollection -Objekt (Pages) zurück, das Sie als Eingabevariablen in anderen Aktivitäten außerhalb des Amazon Textract-Aktivitätspakets verwenden können.

Die Aktivität Analyze Multipage Document ist im Wesentlichen eine Kombination aus den Aktivitäten Start Document Analysis, Get Document Analysis Statusund Get Document Analysis in einer einzigen Aktivität.

Wichtig: In früheren Versionen dieser Aktivität gab der Ausgabeparameter (Seiten) ein PageDetail[] -Objekt zurück. In 2.0 wurde dies in ein PageDetailCollection geändert, damit wir die RawJson-Eigenschaft für den Methodenaufruf zurückgeben können, was mit einem Array nicht möglich war.

Wie es funktioniert

Die folgenden Schritte und das folgende Nachrichtensequenzdiagramm sind ein Beispiel dafür, wie die Aktivität von der Entwurfszeit (d. h. den Aktivitätsabhängigkeiten und Eingabe-/Ausgabeeigenschaften) bis zur Laufzeit funktioniert.

  1. Schließen Sie die Einrichtungsschritte ab.
  2. Fügen Sie die Aktivität Amazon Scope zu Ihrem Projekt hinzu.
  3. Fügen Sie die Aktivität Analyze Single Page Document innerhalb der Amazon Scope- Aktivität hinzu.
  4. Geben Sie Werte für die Eingabeeigenschaften des S3-Speichers ein.
  5. Erstellen und geben Sie eine PageDetailCollection -Variable für Ihre Ausgabeeigenschaft ein.
  6. Führen Sie die Aktivität aus.

    • Ihre Eingabeeigenschaften werden an die AnalyzeDocument- API gesendet.
    • Die API gibt den Wert PageDetail an Ihre Ausgabeeigenschaftsvariable zurück.


Eigenschaften

Die Werte für die folgenden Eigenschaften werden beim Hinzufügen dieser Aktivität zu Ihrem Projekt in UiPath Studio angegeben.



Allgemein

DisplayName

Der Anzeigename der Aktivität.

Attribute

Details

Typ

String

Erforderlich

Ja

Standardwert

Analyze Multipage Document

Zulässige Werte

Geben Sie eine String oder String -Variable ein.

Hinweise

Keine Angabe

Eingabe

Im Gegensatz zu Get Document Analysis Status, das einen externen Verzögerungsmechanismus erfordert, um den Dienst auf Statusänderungen abzufragen, enthält Analyze Multipage Document die folgenden, optionalen Eingabeeigenschaften, um eine anfängliche Statusprüfungsverzögerung (InitialDelay) und ein Statusprüfintervall (StatusCheckInterval) festzulegen.

InitialDelay

Die zu wartende Zeit, bevor die Aktivität die Amazon Textract GetDocumentAnalysis-API aufruft, um den JobStatus-Wert abzurufen.

Attribute

Details

Typ

Int32 (Millisekunden)

Erforderlich

Nein

Standardwert

15.000 (nicht angezeigt)

Zulässige Werte

Geben Sie eine Int32 oder Int32 -Variable ein.

Hinweise

Geben Sie Ihren Wert in Millisekunden ein (z. B. 30000 für 30 Sekunden); Ihr Wert muss größer oder gleich 15000sein.

Bei der Analyse eines großen Dokuments wird empfohlen, die geschätzte Zeit einzugeben, die der Amazon Textract-Dienst benötigt, um seine Analyse abzuschließen. Wenn die Analyse Ihres Dokuments beispielsweise bis zu 2 Minuten dauert, sollten Sie 120000 als Wert eingeben und die StatusCheckInterval- Eigenschaft verwenden, um anzugeben, wie oft Sie nach einem aktualisierten Status suchen möchten, wenn der Auftrag nicht innerhalb von 2 Minuten abgeschlossen wird Schätzung.

StatusCheckInterval

Die Zeitspanne, die zwischen Aufrufen der Amazon Textract GetDocumentAnalysis-API zum Abrufen des JobStatus-Werts gewartet werden soll.

Attribute

Details

Typ

Int32 (Millisekunden)

Erforderlich

Nein

Standardwert

10.000 (nicht angezeigt)

Zulässige Werte

Geben Sie eine Int32 oder Int32 -Variable ein.

Hinweise

Geben Sie Ihren Wert in Millisekunden ein (z. B. 15000 für 30 Sekunden); Ihr Wert muss größer oder gleich 10000sein.

Das Ziel dieser Eigenschaft ist es, die Anzahl der Aufrufe zu verwalten, die Ihre Aktivität an die Amazon Textract-API sendet.

Optionen

Analysetyp

Gibt die auszuführenden Analysetypen an. Verwenden Sie Tabellen, um Informationen über die Tabellen zurückzugeben, die im Eingabedokument erkannt werden, und Formulare, um erkannte Formulardaten zurückzugeben.

Attribute

Details

Typ

ENUM

Erforderlich

Nein.

Standardwert

Alle

Zulässige Werte

Alle, Tabellen, Formulare

Hinweise

Keine Angabe

DiscoverColumnHeaders

Gibt an, ob die Tabellen im Dokument Spaltenüberschriften enthalten.

Attribute

Details

Typ

Kontrollkästchen

Erforderlich

Nein

Standardwert

nicht ausgewählt

Zulässige Werte

Ausgewählt oder nicht ausgewählt

Hinweise

Keine Angabe

LeereZeilenIgnorieren

Gibt an, ob leere Zeilen in den Dokumenttabellen bei der Analyse des Dokuments ignoriert werden sollen.

Attribute

Details

Typ

Kontrollkästchen

Erforderlich

Nein

Standardwert

nicht ausgewählt

Zulässige Werte

Ausgewählt oder nicht ausgewählt

Hinweise

Keine Angabe

S3-Speicher

Bucket

Der Name des S3-Buckets, in dem das Dokument gespeichert ist.

Attribute

Details

Typ

String

Erforderlich

Ja

Standardwert

Leer

Zulässige Werte

Geben Sie eine String oder String -Variable ein.

Hinweise

Die AWS-Region für den S3-Bucket, der das Dokument enthält, muss mit der Region übereinstimmen, die Sie in der Amazon Scope- Aktivität ausgewählt haben.

Damit Amazon Textract eine Datei in einem S3-Bucket verarbeiten kann, muss der Benutzer über die Berechtigung für den Zugriff auf den S3-Bucket verfügen; Weitere Informationen finden Sie unter Schritt 6 im Abschnitt IAM-Benutzer erstellen der Setup- Anleitung.

Dokumentname

Der Name der Datei im angegebenen Bucket , die Sie analysieren möchten, unter Beachtung von Groß-/Kleinschreibung.

Attribute

Details

Typ

String

Erforderlich

Ja

Standardwert

Leer

Zulässige Werte

Geben Sie eine String oder String -Variable ein.

Hinweise

Unterstützte Dokumentformate: PNG, JPEG und PDF.

Version

Wenn für das Bucket die Versionierung aktiviert ist, können Sie die Objektversion angeben.

Attribute

Details

Typ

String

Erforderlich

Nein

Standardwert

Leer

Zulässige Werte

Geben Sie eine String oder String -Variable ein.

Hinweise

Keine Angabe

Sonstiges

Private

Falls ausgewählt werden die Werte von Variablen und Argumenten nicht mehr auf ausführlicher Ebene protokolliert.

Attribute

Details

Typ

Kontrollkästchen

Erforderlich

Nein

Standardwert

nicht ausgewählt

Zulässige Werte

Ausgewählt oder nicht ausgewählt

Hinweise

Keine Angabe

Ausgabe

Seiten

Die aus dem angegebenen Dokument extrahierten Eigenschaften, die als Array zurückgegeben werden.

Attribute

Details

Typ

PageDetailCollection

Erforderlich

Nein (empfohlen, wenn Sie die Ausgabedaten in nachfolgenden Aktivitäten verwenden möchten)

Standardwert

Leer

Zulässige Werte

Geben Sie eine PageDetailCollection -Variable ein

Hinweise

Jedes Objekt aus dem Array stellt die Ergebnisse für eine einzelne Seite dar. Dies ist eine Änderung gegenüber früheren Versionen, bei denen ein PageDetail[] -Objekt zurückgegeben wurde.

Die Beschreibung des Objekts PageDetail und seiner Eigenschaften finden Sie unter Seitendetails .

Beispiel

Die folgende Abbildung zeigt ein Beispiel für die Aktivitätsabhängigkeitsbeziehung und Eingabe-/Ausgabe-Eigenschaftswerte.

Schritt-für-Schritt-Anweisungen und Beispiele finden Sie in den Schnellstartanleitungen .





  • Wie es funktioniert
  • Eigenschaften
  • Allgemein
  • Eingabe
  • Optionen
  • S3-Speicher
  • Sonstiges
  • Ausgabe
  • Beispiel

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
UiPath Logo weiß
Vertrauen und Sicherheit
© 2005-2024 UiPath. All rights reserved.