- Überblick
- Modellerstellung
- Modellvalidierung
- Modellbereitstellung
- Häufig gestellte Fragen

Benutzerhandbuch für unstrukturierte und komplexe Dokumente
In diesem Abschnitt wird beschrieben, wie Sie Feldgruppen, Felder und Feldtypen erstellen und konfigurieren sowie Prompt-Anweisungen hinzufügen.
- Allgemeine Extraktionsanweisungen – stellen dem Modell einen Kontext bereit, der in der gesamten Taxonomie relevant ist, einschließlich Details zur gesamten Extraktionsaufgabe und den Dokumenten im Projekt.
- Anweisungen – stellen dem Modell einen Kontext bereit, damit Daten aus dem Dokument erfolgreich extrahiert werden können. Durch Iterationen bei Anweisungen können Vorhersagen verbessert werden.
- Gehen Sie zur Registerkarte Erstellen und wählen Sie Taxonomie verwalten.
- Fügen Sie Ihre allgemeinen Extraktionsanweisungen hinzu.
Hinweis: Anweisungen auf Projektebene können eine Beschreibung des Branchen- oder Dokumententyps oder dokumentenspezifische Überlegungen enthalten, wie z. B. mehrfache Vorkommen des Dokuments in einer Datei.
- Wählen Sie auf der Registerkarte Felder die Option Neue Feldgruppe und füllen Sie die erforderlichen Felder aus:Hinweis: Sie können einzelne Felder innerhalb ihrer jeweiligen Feldgruppen erst hinzufügen, nachdem Sie Feldgruppen erstellt haben.
- Feldgruppenname: Geben Sie Ihrer Feldgruppe einen Namen in natürlicher Sprache ein.
Sie können mithilfe des Größer-als-Zeichens
>
die Feldgruppenhierarchie definieren, sofern dies für Ihren Anwendungsfall zutrifft. Dieses Zeichen stellt eine Beziehung zwischen der übergeordneten Feldgruppe und der untergeordneten Feldgruppe her. Wenn für die übergeordnete Feldgruppe keine Vorhersagen gefunden werden, werden keine für die untergeordnete Feldgruppe zurückgegeben. Sie können sich die übergeordnete Feldgruppe als die erste Klassifizierung vorstellen.Hinweis: Die Anweisungen für eine übergeordnete Feldgruppe beeinflussen keine untergeordnete Feldgruppe. - Anweisung: Gib für deine Feldgruppe eine Beschreibung in natürlicher Sprache ein.
- Feldgruppenname: Geben Sie Ihrer Feldgruppe einen Namen in natürlicher Sprache ein.
- Wählen Sie Hinzufügen aus.
Sie können während des Hinzufügens von Anmerkungen jederzeit zusätzliche Felder und Feldtypen direkt über die Seite Vorhersagen validieren konfigurieren.
>
zu trennen.
Sehen Sie sich folgendes Beispiel für Feldgruppen und ihre Hierarchien an:
- Rechnung
- Rechnungsnummer
- Rechnung > Posten
- Einheitspreis
- Menge
- Betrag per Zeile
- Erweitern Sie die relevante Feldgruppe, indem Sie das Auswahlsymbol auswählen.
- Wählen Sie Neues Feld, um individuelle Felder zu erstellen.
- Füllen Sie die erforderlichen Details wie folgt aus:
- Feldname: Geben Sie Ihrem Feld einen Namen, der die von ihm repräsentierten Daten genau beschreibt.
- Anweisungen: Geben Sie Ihrem Feld eine relevante und detaillierte Beschreibung, um den erforderlichen Kontext für die Extraktion bereitzustellen.
- Jedem Feld muss ein Feldtyp zugewiesen sein, der einer der vorkonfigurierten oder benutzerdefinierten Feldtypen sein kann. Verwenden Sie das Auswahlmenü Feldtyp und wählen Sie eine der vorkonfigurierten Optionen aus: Datum, Exakter Text, Inferenztext, Geldbetrag, Zahl oder Boolesch.
Hinweis:
- Sie können Feldtypen in verschiedenen Feldern wiederverwenden, sodass Sie die Anweisungen freigeben können.
- Sie können die Feldtypen ändern, sobald das Feld erstellt wurde. Wenn Sie jedoch den Feldtyp ändern, gehen alle vorhandenen Anmerkungen verloren.
- Der Feldtyp „Text“ kann Eingabewerte haben, die im Dokument vorhanden sind und unverändert extrahiert werden (Exakter Text), oder aus dem Dokument abgeleitet werden können, wenn es nicht explizit im Text angegeben wird (Abgeleiteter Text).
- Wenn Sie einen benutzerdefinierten Feldtyp erstellen möchten, wählen Sie in der Auswahlliste die Option Neuer Feldtyp. Weitere Einzelheiten dazu finden Sie unter Erstellen und Konfigurieren von Feldtypen.
- Wenn Sie ein zusätzliches Feld erstellen möchten, wählen Sie Weiteres Feld erstellen und geben Sie die erforderlichen Details wie zuvor erläutert an.
- Wählen Sie Speichern.
Um neue Feldtypen zu erstellen, führen Sie diese Schritte aus:
- Wählen Sie auf der Seite Taxonomie verwalten auf der Registerkarte Feldtypen die Option Neuer Feldtyp.
- Füllen Sie die erforderlichen Felder aus:
- Name – der Name des Feldtyps.
- Anweisung – sollte allgemeine Anweisungen dazu enthalten, wie die Daten formatiert werden und für alle Felder extrahiert werden sollten, die den gleichen Feldtyp haben.
Hinweis:- Sie können Feldtypen in verschiedenen Feldern wiederverwenden, sodass Sie die Anweisungen freigeben können.
- Die Feldtypanweisung wird als Formatierungsanweisung verwendet, um die Ausgaben in ein bestimmtes Format zu normalisieren. Zum Beispiel, um alle Daten als Datum
YYYY-MM-DD
zu extrahieren.
- Wählen Sie über die Auswahlliste Datentyp einen der folgenden Werte:
- Zeichenfolge: Kann beliebige Zeichen wie Buchstaben, Zahlen usw. enthalten. Es kann auch Eingabewerte haben, die explizit im Dokument vorhanden sind oder aus dem Dokument abgeleitet werden. Zum Beispiel: Organisation, Vorname, Adresszeile oder Telefonnummer.
- Wählen Sie eine der folgenden Optionen für den Eingabewert:
- Muss im Dokument vorhanden sein: Der Wert muss genau so extrahiert werden, wie er im Dokument angezeigt wird.
- Aus dem Dokument abgeleitet: Der extrahierte Wert kann aus dem Kontext abgeleitet werden und muss nicht genau dem Text im Dokument entsprechen.
- Wählen Sie eine der folgenden Optionen für den Eingabewert:
- Datum: Kommt in unstrukturierten, sich ändernden Formaten vor und verwendet das vortrainierte UiPath-Datumsfeld. Zum Beispiel: Startdaten, Ablaufdaten.
- Zahl: Ist in unterschiedlichen unstrukturierten Formaten erhältlich und verwendet den vorkonfigurierten UiPath-Typ, um die Werte in einem standardisierten Format zu strukturieren. Zum Beispiel: die Anzahl der Elemente, prozentuale Änderung, Dezimalwerte.
- Geldbetrag: Ist in unstrukturierten Formaten erhältlich, die unterschiedlich sind und das vortrainierte UiPath-Modell für Geldbeträge verwenden. Zum Beispiel, Gesamtprämienwert, fällige Gebühren.
- Boolesch: Wahr- oder Falsch-Werte, die aus Dokumenten abgeleitet werden. Zum Beispiel kann Wahr für einen vorhandenen Kunden und Falsch für einen nicht vorhandenen Kunden stehen.
- Auswahl: Die abgeleiteten oder exakten Werte, die einem Satz vordefinierter Werte zugeordnet sind. Zum Beispiel:
- Sprachen: Englisch, Deutsch, Französisch.
- Dokumententypen: Wasserrechnung, Gasrechnung, Stromrechnung.
- Produktkategorien: Anlagekonto, Sparkonto, Girokonto.
- Kundentypen: Stufe 1, Stufe 2, Stufe 3.
Sobald Sie Auswahl als Ihren Datentyp ausgewählt haben, werden folgende Optionen angezeigt:- Anzeigewert
- Alternative Werte
- Auswahl hinzufügen
Sie können Werte eingeben und optional Anmerkungen hinzufügen. Der Wert wird, wo möglich, einem Satz von vorgegebenen Werten zugeordnet.
Wichtig: Sobald der Datentyp konfiguriert wurde, können Sie ihn nicht mehr ändern. Achten Sie darauf, den richtigen Datentyp auszuwählen, andernfalls müssen Sie den Feldtyp löschen und mit dem korrekten Datentyp neu erstellen. Dies liegt daran, dass Sie Anmerkungen für inkompatible Feldtypen mit unterschiedlichen Datentypen nicht neu zuweisen können. - Zeichenfolge: Kann beliebige Zeichen wie Buchstaben, Zahlen usw. enthalten. Es kann auch Eingabewerte haben, die explizit im Dokument vorhanden sind oder aus dem Dokument abgeleitet werden. Zum Beispiel: Organisation, Vorname, Adresszeile oder Telefonnummer.
- Wählen Sie Speichern.
Beispiel für abgeleitete und exakte Felder
Abgeleitete Felder
Ich arbeite für das Underwriting-Operations-Team bei einer Versicherungsgesellschaft und wir haben Hunderte von festgelegten Policekategorien, zum Beispiel die Kategorien Auto, Haus, Gesundheit, Luxusgüter, die wir unseren Kunden anbieten, wobei jede einer Typkategorie entspricht, zum Beispiel Typ A, B, C.
Basierend auf dem Inhalt des Dokuments möchte ich in der Lage sein, die Typkategorie der zu verarbeitenden Police zu extrahieren und zu identifizieren.
In diesem Beispiel finden Sie an keiner Stelle in der Nachricht eine Angabe dazu, dass diese E-Mail zu Typ E gehört. In den Anweisungen wird für jeden Versicherungstypen Kontext bereitgestellt, um die Vorhersagen des Modells zu beeinflussen. Zum Beispiel gehören Ansprüche im Zusammenhang mit Luxusgütern alle der Kategorie Typ E.
- Werte, die an keiner Stelle in einem Dokument angegeben sind, aber im Kontext impliziert enthalten sind
- Werte, die über verschiedene Bereiche eines Dokuments hinweg verkettet werden müssen.
- Werte, die sich über mehrere Absätze, Zeilen oder Spalten erstrecken.
Exakte Felder
Um diese Anfrage zu erleichtern, benötige ich möglicherweise die vorhandene Policenummer, den Namen und den Wert des Anspruchs. Dies sind Werte, von denen ich weiß, dass sie explizit im Dokument selbst angegeben und in einen nachgelagerten Prozess extrahiert werden müssen.