activities
latest
false
UiPath logo, featuring letters U and I in white

Document Understanding-Aktivitäten

Letzte Aktualisierung 5. Dez. 2024

Dokument klassifizieren (Classify Document)

UiPath.IntelligentOCR.StudioWeb.Activities.ClassifyDocument

Beschreibung

Sie können diese Aktivität verwenden, um Dokumente zu klassifizieren, indem Sie einen gewünschten Klassifizierer und ein Dokument auswählen, das Sie klassifizieren möchten.

Hinweis: Die Aktivität „Classify Document“ verwendet öffentliche Endpunkte.

Die unterstützten Sprachen für die generativen Modelle sind die gleichen wie die verwendete OCR-Engine. Weitere Informationen finden Sie auf der Seite Von der OCR unterstützte Sprachen .

Wenn diese Aktivität nicht die erste Document Understanding-Aktivität ist, die Teil eines Studio-Workflows ist, sollte die Eingabe Dokumentdaten sein. Datei sollte nur als Eingabe verwendet werden, wenn die Aktivität der erste Document Understanding-Teil eines Studio Workflows ist.

Projektkompatibilität

Windows | Plattformübergreifend

Konfiguration

Designer-Panel
  • Eingabe – Geben Sie die Eingabedatei oder das Dokumentdatenobjekt an.
    Wichtig: Die maximale Anzahl von Seiten, die eine Datei haben kann, beträgt 500. Dateien, die diesen Grenzwert überschreiten, können nicht klassifiziert werden.
    Tipp: Wenn Ihre Dateien nicht als Variable vom Typ IResource gespeichert werden, besteht die Möglichkeit, eine Konvertierung durchzuführen. Verwenden Sie dafür LocalResource.FromPath(<reference_to_the_file>) im Eigenschaftsfeld Eingabe.
    Stellen Sie sich ein Szenario vor, in dem Sie eine Liste von Dateien mithilfe einer For Each-Aktivität durchlaufen. Angenommen, currentItem ist Ihre Iterationsvariable. Um currentItem in IResource zu konvertieren, fügen Sie LocalResource.FromPath(currentItem) in das Eingabefeld ein.
  • Document Understanding-Projekt – Erfordert, dass Sie Ihr Document Understanding-Projekt aus dem Dropdownmenü auswählen. Die verfügbaren Optionen sind:
    • Vordefiniert – Projekt, das vortrainierte spezielle Modelle verwendet, die für Standardszenarien empfohlen werden.
    • Vorhandenes Projekt aus dem Mandanten und Ordner, mit dem Sie verbunden sind
    • Sie können ein neues Projekt erstellen, indem Sie das Symbol + auswählen.
    Hinweis: Wenn Sie mehr als 500 Projekte auf Ihrem Mandanten erstellt haben und die Aktivität Classify Document verwenden, zeigt UiPath Studio oder Studio Web keine Projekte über die ursprünglichen 500 hinaus an. Daher können diese Projekte nicht verwendet werden.
  • Klassifizierer – Wenn Sie das vordefinierte Projekt verwenden, können Sie den gewünschten Document Understanding-Klassifizierer aus dem Dropdownmenü auswählen.
    Hinweis: Die an den Generative Classifier gesendeten Daten werden an eine LLM-Modellinstanz gesendet, die nicht öffentlich verfügbar ist, werden nicht außerhalb von ihr verwendet und nach der Verarbeitung nicht gespeichert oder für Training verwendet.
    • Für das vordefinierte Projekt haben Sie zwei Optionen:
      • ML-Klassifizierung – ML-basierter Klassifizierer.
      • Generativer Klassifizierer – Der generative Klassifizierertyp.
        Wichtig:

        Diese Funktion ist derzeit Teil eines Prüfungsprozesses und gilt erst nach Abschluss der Überprüfung als Teil der FedRAMP-Autorisierung. Hier finden Sie die vollständige Liste der Funktionen, die derzeit überprüft werden.

        • Eingabeaufforderung – Anweisungen zur Identifizierung von Dokumenttypen, bereitgestellt als Schlüssel-Wert-Paare, wobei der Schlüssel den Namen des Dokumenttyps und der Wert eine Beschreibung dafür darstellt, was dem Klassifizierer hilft, solche Dokumente zu identifizieren.
          • Dokumenttyp – Geben Sie den Namen des Dokumenttyps an, der als Klassifizierungsergebnis verwendet werden soll (höchstens 30 Zeichen).
          • Generative Aufforderung – Erfordert, dass Sie Anweisungen für den Generativen Klassifizierer angeben, wie der Dokumenttyp identifiziert werden kann. Die maximale Anzahl der zulässigen Zeichen ist 1000.
  • Version (Vorschau) – Verwenden Sie diese Eigenschaft, wenn Sie ein vorhandenes modernes Document Understanding-Projekt verwenden. Wählen Sie das Tag aus, das der Projektversion entspricht, aus der Sie Daten verarbeiten möchten. Wenn Sie beispielsweise das Produktions -Tag auswählen, das Version 3 zugewiesen ist, verarbeitet die Aktivität Daten aus Version 3 Ihres Projekts in der Produktionsumgebung.

    Der Standardwert für Version ist Staging. Wenn das Tag Staging im ausgewählten Projekt nicht vorhanden ist, ist der Standardwert Production.

    Nachdem Sie ein Tag ausgewählt haben, zeigt die Aktivität eine Liste der unterstützten Dokumenttypen für diese Version an.

Eigenschaften-Panel

Erweiterte Optionen

  • Mindestkonfidenz – Geben Sie den Mindestkonfidenzschwellenwert an, auf dessen Grundlage ein Dokumenttyp während der Klassifizierung zugewiesen wird. Wenn die Konfidenzpunktzahl eines Dokuments unter diesen Schwellenwert fällt, wird sein Dokumenttyp als „unbekannt“ gemeldet.
    Tipp: Die meisten Dokumenttypen generieren eine Vorhersage mit einem Konfidenzniveau. Das Festlegen dieser Eigenschaft verhindert falsch positive Ergebnisse, indem nur die Vorhersagen mit einem Konfidenzniveau über dem Schwellenwert berücksichtigt werden. Sie können ein optimales Konfidenzniveau ermitteln, indem Sie verschiedene Dokumente in Ihrem Workflow testen, die Ergebnisse z. B. in einer Excel-Tabelle aufzeichnen und dann analysieren, welcher Schwellenwert am genauesten ist.

Eingabe

  • Timeout (Sekunden) – Maximale Ausführungszeit (in Sekunden) für den Aufruf des generativen Modells. Wenn der Vorgang dieses Timeout überschreitet, wird er automatisch beendet, um Verzögerungen oder Hängen zu vermeiden. Diese Eigenschaft wird nur angezeigt, wenn der Generative Classifier als Klassifizierer ausgewählt ist.

Ausgabe

  • Dokumentdaten – Alle validierten extrahierten Felddaten aus der Datei.

Verwenden des generativen Klassifizierers

Um schnell die generativen Funktionen der Aktivität Classify Document zu nutzen, führen Sie die folgenden Schritte aus:

  1. Fügen Sie eine Aktivität Classify Document hinzu
  2. Wählen Sie in der Dropdownliste Projekt die Option Vordefiniert aus.
  3. Wählen Sie für Klassifizierer die Option Generativer Klassifizierer aus.

    Die Eigenschaft Eingabeaufforderung wird im Textkörper der Aktivität angezeigt.

  4. Geben Sie Ihre Anweisungen im Feld Eingabeaufforderung als Schlüssel-Wert-Paare des Wörterbuchs an, wobei:
    • Schlüssel stellt den Dokumenttyp dar (Beispiel: CV).
    • Wert stellt die generative Eingabeaufforderung dar: Die Beschreibung, die vom generativen Klassifizierer zur Identifizierung der Dokumenttypen verwendet wird.

      Ein Beispiel für Schlüssel-Wert-Paare finden Sie beispielsweise in der folgenden Tabelle:

      Tabelle 1. Schlüssel-Wert-Paare, die als Eingabeaufforderung für den generativen Klassifizierer verwendet werden
      Document typeGenerative Aufforderung
      CV„Suchen Sie nach gängigen CV-Schlüsselwörtern wie „Bildung“, „Fähigkeiten“ und „Erfahrung“.“
      Rechnung„Suchen Sie nach gängigen Feldnamen wie „Rechnungsnummer“, „Rechnungsnummer“ oder „Gesamtbetrag“.“
    Abbildung 1. Schlüssel-Wert-Paare, die als Eingabeaufforderung für den generativen Klassifizierer verwendet werden

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
Uipath Logo White
Vertrauen und Sicherheit
© 2005–2024 UiPath. Alle Rechte vorbehalten