activities
latest
false
Wichtig :
Bitte beachten Sie, dass dieser Inhalt teilweise mithilfe von maschineller Übersetzung lokalisiert wurde.
UiPath logo, featuring letters U and I in white
Document Understanding-Aktivitäten
Last updated 14. Nov. 2024

Dokument klassifizieren (Classify Document)

UiPath.IntelligentOCR.StudioWeb.Activities.ClassifyDocument

Beschreibung

Sie können diese Aktivität verwenden, um Dokumente zu klassifizieren, indem Sie einen gewünschten Klassifizierer und ein Dokument auswählen, das Sie klassifizieren möchten.

Hinweis: Die Aktivität „Classify Document“ verwendet öffentliche Endpunkte.

Die unterstützten Sprachen für die generativen Modelle sind die gleichen wie die verwendete OCR-Engine. Weitere Informationen finden Sie auf der Seite Von der OCR unterstützte Sprachen .

Wenn diese Aktivität nicht die erste Document Understanding-Aktivität ist, die Teil eines Studio-Workflows ist, sollte die Eingabe Dokumentdaten sein. Datei sollte nur als Eingabe verwendet werden, wenn die Aktivität der erste Document Understanding-Teil eines Studio Workflows ist.

Projektkompatibilität

Windows | Plattformübergreifend

Konfiguration

Designer-Panel
  • Projekt – Erfordert, dass Sie Ihr Document Understanding-Projekt aus dem Dropdownmenü auswählen. Die verfügbaren Optionen sind:
    • Vordefiniert – Der Standardprojekttyp
    • Sie können ein neues Projekt erstellen, indem Sie auf das Symbol + klicken.
    Hinweis: Wenn Sie mehr als 500 Projekte auf Ihrem Mandanten erstellt haben und die Aktivität Classify Document verwenden, zeigt UiPath Studio oder Studio Web keine Projekte über die ursprünglichen 500 hinaus an. Daher können diese Projekte nicht verwendet werden.
  • Klassifizierer – Erfordert, dass Sie Ihren Document Understanding-Klassifizierer aus dem Dropdownmenü auswählen.
    Hinweis: Die an den Generative Classifier gesendeten Daten werden an eine LLM-Modellinstanz gesendet, die nicht öffentlich verfügbar ist, werden nicht außerhalb von ihr verwendet und nach der Verarbeitung nicht gespeichert oder für Training verwendet.
    • Vordefiniert – Der Standardprojekttyp
    • Generativer Klassifizierer – Der generative Klassifizierertyp
      Wichtig:

      Diese Funktion ist derzeit Teil eines Prüfungsprozesses und gilt erst nach Abschluss der Überprüfung als Teil der FedRAMP-Autorisierung. Hier finden Sie die vollständige Liste der Funktionen, die derzeit überprüft werden.

      • Eingabeaufforderung – Eingabeaufforderung zur Identifizierung von Dokumenttypen, die als Schlüssel-Wert-Paare bereitgestellt werden, wobei der Schlüssel den Namen des Dokumenttyps und der Wert eine Beschreibung dafür darstellt, was den Klassifizierer bei der Identifizierung dieser Dokumente unterstützt.
        • Dokumenttyp – Geben Sie den Namen des Dokumenttyps an, der als Klassifizierungsergebnis verwendet werden soll (höchstens 30 Zeichen).
        • Generative Eingabeaufforderung – Erfordert, dass Sie die Eingabeaufforderung als Eingabe für den Generative Classifier bereitstellen. Die maximale Anzahl der zulässigen Zeichen ist 1000.
  • Eingabe – Geben Sie die Eingabedatei oder das Dokumentdatenobjekt an.
    Wichtig: Die maximale Anzahl von Seiten, die eine Datei haben kann, beträgt 500. Dateien, die diesen Grenzwert überschreiten, können nicht klassifiziert werden.
    Tipp: Wenn Ihre Dateien nicht als Variable vom Typ IResource gespeichert werden, besteht die Möglichkeit, eine Konvertierung durchzuführen. Verwenden Sie dafür LocalResource.FromPath(<reference_to_the_file>) im Eigenschaftsfeld Eingabe.
    Stellen Sie sich ein Szenario vor, in dem Sie eine Liste von Dateien mithilfe einer For Each-Aktivität durchlaufen. Angenommen, currentItem ist Ihre Iterationsvariable. Um currentItem in IResource zu konvertieren, fügen Sie LocalResource.FromPath(currentItem) in das Eingabefeld ein.
Eigenschaften-Panel

Erweiterte Optionen

  • Mindestkonfidenz – Geben Sie den Mindestkonfidenzschwellenwert an, auf dessen Grundlage ein Dokumenttyp während der Klassifizierung zugewiesen wird. Wenn die Konfidenzpunktzahl eines Dokuments unter diesen Schwellenwert fällt, wird sein Dokumenttyp als „unbekannt“ gemeldet.
    Tipp: Die meisten Dokumenttypen generieren eine Vorhersage mit einem Konfidenzniveau. Das Festlegen dieser Eigenschaft verhindert falsch positive Ergebnisse, indem nur die Vorhersagen mit einem Konfidenzniveau über dem Schwellenwert berücksichtigt werden. Sie können ein optimales Konfidenzniveau ermitteln, indem Sie verschiedene Dokumente in Ihrem Workflow testen, die Ergebnisse z. B. in einer Excel-Tabelle aufzeichnen und dann analysieren, welcher Schwellenwert am genauesten ist.

Eingabe

  • Timeout (Sekunden) – Maximale Ausführungszeit (in Sekunden) für den Aufruf des generativen Modells. Wenn der Vorgang dieses Timeout überschreitet, wird er automatisch beendet, um Verzögerungen oder Hängen zu vermeiden. Diese Eigenschaft wird nur angezeigt, wenn der Generative Classifier als Klassifizierer ausgewählt ist.

Ausgabe

  • Dokumentdaten – Alle validierten extrahierten Felddaten aus der Datei.

Verwenden des generativen Klassifizierers

Um schnell die generativen Funktionen der Aktivität Classify Document zu nutzen, führen Sie die folgenden Schritte aus:

  1. Fügen Sie eine Aktivität Classify Document hinzu
  2. Wählen Sie in der Dropdownliste Projekt die Option Vordefiniert aus.
  3. Wählen Sie für Klassifizierer die Option Generativer Klassifizierer aus.

    Die Eigenschaft Eingabeaufforderung wird im Textkörper der Aktivität angezeigt.

  4. Geben Sie Ihre Anweisungen im Feld Eingabeaufforderung als Schlüssel-Wert-Paare des Wörterbuchs an, wobei:
    • Schlüssel stellt den Dokumenttyp dar (Beispiel: CV).
    • Wert stellt die generative Eingabeaufforderung dar: Die Beschreibung, die vom generativen Klassifizierer zur Identifizierung der Dokumenttypen verwendet wird.

      Ein Beispiel für Schlüssel-Wert-Paare finden Sie beispielsweise in der folgenden Tabelle:

      Tabelle 1. Schlüssel-Wert-Paare, die als Eingabeaufforderung für den generativen Klassifizierer verwendet werden
      Document typeGenerative Aufforderung
      CV„Suchen Sie nach gängigen CV-Schlüsselwörtern wie „Bildung“, „Fähigkeiten“ und „Erfahrung“.“
      Rechnung„Suchen Sie nach gängigen Feldnamen wie „Rechnungsnummer“, „Rechnungsnummer“ oder „Gesamtbetrag“.“
    Abbildung 1. Schlüssel-Wert-Paare, die als Eingabeaufforderung für den generativen Klassifizierer verwendet werden

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
Uipath Logo White
Vertrauen und Sicherheit
© 2005–2024 UiPath. Alle Rechte vorbehalten