UiPath Documentation
document-understanding
latest
false

Document Understanding-Benutzerhandbuch

Letzte Aktualisierung 30. Apr. 2026

Dokumenttypen (Document Manager)

Mit Dokumenttypen können Sie Datasets vorbereiten, überprüfen und korrigieren, die für das Training und die Auswertung von Document UnderstandingTM Machine Learning-Modellen erforderlich sind. Damit können mehrere Benutzer verschiedene Vorgänge durchführen:

  • Felder definieren und konfigurieren, die von einem ML-Modell extrahiert werden sollen.
  • Importieren Sie Dokumente zum Hinzufügen von Beschriftungen.
  • Vorbeschriften von Dokumenten mit einem bereits vorhandenen ML-Modell wie Rechnungsextraktion oder Belegextraktion, die von UiPath vorgefertigt bereitgestellt werden, oder mit einem Modell, das mit AI Center trainiert wurde.
  • Beschriften Sie die Dokumente.
  • Dokumente in dem Format exportieren, das von den AI Center-Trainingspipelines erwartet wird.

Dokumenttyp erstellen

Sobald ein Projekt erstellt und geöffnet wurde, können Sie über die Taste Neu und die Option Halbstrukturierte AI einen neuen Dokumententyp erstellen. Ein neues Fenster wird geöffnet, über das zusätzliche Informationen angefordert werden.

Hier finden Sie die verfügbaren Optionen für die Erstellung einer neuen Dokumenttypensitzung. Durch Eingabe dieser Werte erhalten Sie einen Schätzwert der empfohlenen Größe des Datasets, das als Ausgangspunkt verwendet werden soll.

Durch die Auswahl des vorgefertigten Dokumenttyps wird Ihr Schema automatisch ausgefüllt und konfiguriert – so können Sie von den im AI Center verfügbaren vortrainierten Modellen profitieren. Dadurch entfällt das manuelle Importieren vordefinierter Schemas, beschleunigt Ihre Arbeit und reduziert kostspielige Fehler.

Darüber hinaus wird der Endpunkt der Vorbeschriftung automatisch mit dem entsprechenden Endpunkt aufgefüllt, sodass Sie die Vorbeschriftung direkt nach dem Öffnen des neuen Dokumenttyps verwenden können.

Screenshot der Oberfläche „Neuen Dokumenttyp erstellen“.

OptionBeschreibung
Name (obligatorisch)Geben Sie einen Namen für den neuen Dokumenttyp an.
Out-of-the-box document type (Mandatory)Wählen Sie einen der vortrainierten, vorgefertigten Dokumenttypen aus, die in der Dropdownliste verfügbar sind.
Out-of-the-box regular fields (Optional)Wählen Sie aus, welches der vordefinierten regulären Felder Sie für Ihr Schema erstellen möchten.
Out-of-the-box column fields (Optional)Wählen Sie aus, welche der vordefinierten Spaltenfelder Sie aus Ihren Dokumenten extrahieren möchten.
Out-of-the-box classification fields (Optional)Wählen Sie aus, welche der vordefinierten Klassifizierungsfelder Sie aus Ihren Dokumenten extrahieren möchten.
Custom regular fields (Optional)Enter the number of additional regular fields you would like to extract from your documents.
Custom column fields (Optional)Geben Sie die Anzahl der zusätzlichen Spaltenfelder ein, die Sie aus Ihren Dokumenten extrahieren möchten.
Number of languages (Optional)Geben Sie die Anzahl der Sprachen für die Dokumente ein, die Sie extrahieren müssen.
Number of layouts (Optional)Geben Sie die Anzahl der Layouts für die Dokumente ein, die Sie extrahieren müssen.
Hinweis:

Selecting a document type generates a recommended number of pages that need to be used for the dataset.

Die Benutzeroberfläche

Die Document Manager-Schnittstelle enthält die folgenden Panels:

  • Verwaltungsleiste
  • Spaltenfelder
  • Reguläre Felder
  • Klassifizierungsfelder
  • Dokumentansicht

Management bar

Wird oben auf der Seite im Document Manager angezeigt.

Ermöglicht Ihnen die Durchführung mehrerer Vorgänge: Navigieren zwischen Dokumenten, Löschen/Wiederherstellen eines Dokuments, Filtern/Durchsuchen von Dokumenten, Ausführen von KI-Modellvorhersagen, Importieren und Exportieren von Dokumenten.

Die folgenden Optionen finden sich in der Verwaltungsleiste:

ElementSymbolBeschreibung
NavigationNavigationssymbolNavigieren Sie zwischen Dokumenten, die mit dem aktiven Filter übereinstimmen. Zwischen den beiden Pfeilen wird ein Zähler angezeigt. Er zeigt die Nummer des aktuellen Dokuments aus der Gesamtzahl der Dokumente, die dem aktiven Filter bzw. der aktiven Suche entsprechen.
SucheSuchsymbolEs gibt zwei Suchfunktionen:
  • Integrierte Filter: Filtert die Dokumente basierend auf den für Batches/Kategorien verfügbaren Optionen im Dropdownmenü.
  • Verwenden von Schlüsselwörtern: Filtert die Dokumente basierend auf einer Texteingabe.
Löschen / WiederherstellenSymbol „Löschen“.
Wiederherstellungssymbol
Zum Löschen oder Wiederherstellen eines Dokuments. Gelöschte Dokumente finden Sie unter dem Filter gelöscht.
ImportierenImportsymbolÖffnen Sie das Dialogfeld Daten importieren.
ExportierenExportsymbolÖffnen Sie das Dialogfeld Dateien exportieren.
Dokumentname und -typn. a.Der Name des aktuell aktiven Dokuments und sein Typ. Es gibt drei Arten von Dokumenten:
  • Trainingsdokument
  • Validierungsdokument
  • Auswertungsdokument
Trainings- und Validierungsdokumente sind Teil von Trainingsdatensätzen, die von Trainingspipelines verwendet werden. Auswertungsdokumente werden von Trainingspipelines ignoriert und sollen nur von Auswertungspipelines im AI Center verwendet werden. Diese Dokumente sind diejenigen, die als Auswertung markiert wurden (durch Aktivieren des Kontrollkästchens Zu einem Auswertungssatz machen im Dialogfeld Daten importieren).
Herunterladen (Download)DownloadsymbolDie Option erscheint in der Dropdownliste neben dem Dokumentnamen. Wählen Sie das Symbol, um eine Zip-Datei mit dem Originaldokument herunterzuladen. Neben dem Originaldokument werden auch alle Seiten heruntergeladen, die intern von Document Manager in .jpeg Bilder konvertiert wurden.
Endgültig löschenSymbol zum dauerhaften LöschenDie Option erscheint in der Dropdownliste neben dem Dokumentnamen. Endgültiges Löschen einzelner Dateien. Das .pdf und alle seine Bilder im Format .jpeg werden aus dem AI Center-Dataset gelöscht. Alle Metadaten werden aus der Datenbank gelöscht. Wenn Sie die Taste wählen, werden Sie in einer Popup-Nachricht gefragt, ob Sie das Dokument dauerhaft löschen möchten. Wählen Sie OK, um fortzufahren, oder Zurück, um zum vorherigen Bildschirm zurückzukehren.
Batchnamen. a.Der Name des aktuellen Batches.
Sitzungsnamen. a.Der Name der aktuellen Sitzung.
Predict

Hinweis: Die Vorhersage-Funktion basiert auf dem UiPath Helix Extractor, aber nur für Mandanten mit Sitz in der Region Europa. Wenn sich Ihr Mandant in einer Region außerhalb Europas befindet, verwendet diese Funktion die Modellarchitektur der vorherigen Generation.
VorhersagesymbolFühren Sie KI-Modellvorhersagen aus und zeigen Sie die Ergebnisse an. Nach dem Konfigurieren der Vorbeschriftung ist die entsprechende Schaltfläche in der Verwaltungsleiste aktiviert. Wählen Sie sie aus, um das aktuelle Dokument vorzubeschriften. Die Schaltfläche verfügt über drei Optionen:
  • Vorhersage: führt die Ergebnisse des Endpunktes für die Vorbeschriftung (konfiguriert in den Vorbeschriftungseinstellungen) und die generative Vorhersage zusammen. Wenn kein Vorbeschriftungsendpunkt konfiguriert ist, werden alle Felder nur mit der generativen Vorhersage vorhergesagt.
  • Generative Vorhersage: Sagt alle Felder mithilfe der Generativen Vorhersage vorher.
  • Modellvorhersage: Sagt Felder mithilfe des Endpunktmodells für die Vorbeschriftung vorher, das in den Vorbeschriftungseinstellungen konfiguriert wurde.
Die Funktion zur Generativen Anmerkung (Vorbeschriftung) verwirft alle manuell bearbeiteten Feldwerte für alle Feldtypen und löscht alle Tags aus dem Dokument. Mit der Option Vorhersage können Sie mit öffentlichen Endpunkten für Automation Cloud und Test Cloud nur die ersten 10 Seiten eines Dokuments vorbeschriften. Das ist ein bekanntes Problem , für das wir bereits an einer Lösung arbeiten. Die Verwendung der Option Vorhersage mit ML-Fähigkeiten im AI Center erzwingt jedoch keine solche Einschränkung. Generative Vorbeschriftung verbraucht keine AI Units, wenn öffentliche Endpunkte oder Fähigkeiten verwendet werden, die in der Automation Cloud™ über Document Manager-Sitzungen bereitgestellt werden, die in der Automation Cloud gehostet werden. Generative Vorbeschriftung verbraucht AI Units, wenn ein öffentlicher Endpunkt über eine Sitzung aufgerufen wird, die in der Automation Suite gehostet wird, oder wenn eine Fähigkeit, die in der Automation Suite bereitgestellt wurde, über eine Document Manager-Sitzung aufgerufen wird, die in der Automation Cloud gehostet wird.
EinstellungenSymbol für EinstellungenConfigure OCR and Prelabelling settings or access the How to... panel.
Optionen „Löschen“ und „Endgültiges Löschen“

Let's go a little bit deeper in understanding the difference between Delete and Permanently Delete options.

  • The Delete option deletes the files, but not removing them entirely from your project. The deleted files can still be found under the deleted filter from the Search bar and restored by using the Restore option.
  • The Permanently Delete option deletes the selected files without any possibility of restoring them.
Suchoption

Insgesamt stehen drei Suchoptionen zur Verfügung, zwei sind in der Verwaltungsleiste oben auf der Seite zu finden und für die dritte verwenden Sie das Symbol Suchsymbol unten links auf der Seite.

Hinweis:

Hinweis: Bitte beachten Sie, dass für Forms AI nur die folgenden integrierten Filter verfügbar sind: „Gelöscht“ (deleted), „Beschriftet“ (labelled), „Unbeschriftet“ (unlabelled).

Die exponierte Suchfunktion besteht aus zwei Teilen:

  • Mit den integrierten Filtern suchen: Filtert die Dokumente basierend auf den für Batches/Kategorien verfügbaren Optionen im Dropdownmenü.

    Hinweis:

    Durch die Auswahl weiterer Optionen lässt sich die Suche präzisieren. Wenn Sie beispielsweise Batch-Import1 und Gelöscht auswählen, werden nur die Dokumente angezeigt, die im Batch-Import1 importiert und gelöscht wurden. Beachten Sie Kombinationen, die immer eine leere Liste zurückgeben: Wenn Sie Batch-Import1 und Batch-Import2 auswählen, wird nie ein Dokument zurückgegeben, da die Auswahl restriktiv ist und kein Dokument gleichzeitig in zwei Batches sein kann.

  • Suche in Dokumenten mit Schlüsselwörtern: Diese Suchleiste filtert die Informationen basierend auf einer Texteingabe. Sie müssen das/die Schlüsselwort(e) als freien Text in die Suchleiste eingeben. Die Suche erfolgt nach dem/den Schlüsselwort(en) im Inhalt eines Dokuments oder im Dokumentnamen. Die Suche nach mehreren Wörtern gibt Ergebnisse zurück, bei denen die Wörter nebeneinander liegen, ohne dass dazwischen liegende Satzzeichen vorhanden sind.

    Hinweis:

    Neben den beiden Suchoptionen in der Leiste gibt es auch eine Suche innerhalb des Dokuments, die dadurch identifizierbar ist DokumentationsbildZeichen.

  • Im Dokument suchen: Sie können ausschließlich nach Textinstanzen in Ihrem aktuellen Dokument suchen. Die Suchleiste docs image befindet sich unten links auf dem Bildschirm.

Einstellungsmenü

Die Schaltfläche „Settings“ verfügt über zwei Optionen:

  • Settings, wo Sie die OCR oder Vorbeschriftung konfigurieren können.
  • Anleitungen zu … mit dem Zweck eines Hilfemenüs
OCR

Um Dokumente in den Document Manager zu importieren, müssen Sie einen OCR-Dienst konfigurieren.

Screenshot der Oberfläche „OCR-Konfiguration“

OCR-Methode

Diese Einstellung ist nur für Dokumenttypen (Data Manager-Sitzungen) verfügbar, die im AI Center erstellt wurden. Wenn diese Einstellung in Document UnderstandingTM erstellt wird, wird sie von den Projekteinstellungen geerbt. Wenn Sie diese Einstellungen in Document UnderstandingTM ändern möchten, kehren Sie zur Projektansicht zurück und öffnen Sie die Projekteinstellungen unten links.

Die cloudbasierten Optionen sind:

  • UiPath® Document OCRhttps://du.uipath.com/ocr;
  • OCR für Chinesisch, Japanisch und Koreanisch
  • Google Cloud Vision OCR hat die beste Sprachabdeckung
  • Google Cloud Vision OCR for Japanese ist optimal zum Lesen japanischer Dokumente
  • Microsoft Read OCR.
OCR-URL

Zum Konfigurieren der OCR muss der OCR Dienst über eine URL verfügen. Hier sind die möglichen URLs, die Sie verwenden können:

  • öffentliche URLs wie etwa https://du.uipath.com/ocr oder Drittanbieter-URLs von Google Vision OCR oder Microsoft Read OCR
OCR-Schlüssel

Der entsprechende API-Schlüssel für das ausgewählte OCR-Modul. Bei UiPath Document OCR müssen Sie beispielsweise den API-Schlüssel für Document Understanding verwenden. Obligatorisch für Document Manager-Cloud und Document Manager lokal (online). Nicht erforderlich für Document Manager lokal (air-gapped).

Weitere Informationen finden Sie auf der Seite Cloud- und lokale Nutzung.

OCR auf PDF-Dateien anwenden

Establishes if the OCR process should be applied or not to PDF documents. If set to True, the OCR is applied to all PDF pages of the document. If set to False, only digitally typed text is extracted. When set to Auto evaluates if the document requires to apply the OCR algorithm depending on the input document. The default value is Auto.

Vorhersage/Vorbeschriftung

Hinweis:

Die Vorhersagefunktion basiert auf dem UiPath Helix Extractor, aber nur für Mandanten in der Region Europa. Wenn sich Ihr Mandant in einer Region außerhalb Europas befindet, verwendet diese Funktion die Modellarchitektur der vorherigen Generation.

Wenn Sie bereits über ein Modell verfügen, das einige der Felder extrahieren kann, die beschriftet werden müssen, und es nur einige zusätzliche Felder gibt, die eine manuelle Beschriftung erfordern, können Sie Zeit sparen, indem Sie die Vorbeschriftungsfunktion des Document Manager verwenden.

Die Vorbeschriftung kombiniert die Ergebnisse des Vorbeschriftungsendpunkts, den Sie in den Vorbeschriftungseinstellungen konfigurieren, und die generative Vorhersage.

Wenn kein Vorbeschriftungsendpunkt konfiguriert ist, werden alle Felder nur mit der Generativen Vorhersage vorhergesagt.

Screenshot der Oberfläche „Vorbeschriftung“.

Die folgenden Optionen sind verfügbar:

Vorbeschriftung der URL

Für die Vorbeschriftung ist es erforderlich, dass das ML-Modell über eine URL verfügt. Sehen Sie sich die folgenden möglichen URLs an, die Sie verwenden können:

  • Öffentliche URLs wie https://du.uipath.com/ie/invoices or https://du.uipath.com/ie/purchase_orders. Die vollständige Liste der Endpunkte finden Sie unter Öffentliche Endpunkte für die Automation Cloud und Test Cloud .
  • URLs von ML-Fähigkeiten, die im lokalen AI Center oder im cloudbasierten AI Center öffentlich gemacht wurden.
Vorbeschriftung des Schlüssels

Der API-Schlüssel für Document Understanding/AI Units. Der API-Schlüssel der Vorbeschriftung ist der Document Understanding-API-Schlüssel der Organisation, in der sich die Fähigkeit befindet.

Der Schlüssel ist für den cloudbasierten Document Manager und den lokalen Online Document Manager obligatorisch. Der Schlüssel ist für den lokalen Air-Gapped Document Manager optional.

Anleitungen zu …

Mit der Option Anleitungen zu… wird das Document Manager-Hilfemenü geöffnet.

Im Hilfemenü finden Sie die folgenden Informationen:

  • Die Document Manager-Version.
  • Den Link Dokumentation, der zu dieser Dokumentationsseite führt.
  • Im Abschnitt Beschriftungssteuerelemente werden die Steuerelemente angezeigt, die beim Umgang mit Daten verwendet werden sollen.
  • Im Abschnitt Dokumentverknüpfungen werden die Verknüpfungen angezeigt, die zum Ausführen verschiedener Vorgänge wie Navigation und UI-Skalierung verwendet werden.
  • Im Abschnitt Konfiguration werden Details zur Instanz-Konfiguration angezeigt, die während der Installation durchgeführt wurde.
Beschriftungssteuerelemente
BefehlBeschreibung
LinksklickFelder auswählen. Wird sie zusammen mit dem Hotkey des Feldes verwendet, weist sie dem Feld die ausgewählten Informationen zu.
Rücktaste/LöschenEntfernt den mit Tags versehenen Wert eines Felds.
RechtsklickenZeigt den OCR-Text und die aktuelle Beschriftung an.
Eingabe oder umgekehrter SchrägstrichGruppiert oder hebt die Gruppierung von Tabellenzeilen auf, die sich über mehrere Textzeilen erstrecken.
Dokumentverknüpfungen
VerknüpfungBeschreibung
Alt + Pfeil links / Pfeil rechtsNavigiert zwischen Dokumenten.
Alt + EntfLöschen oder Wiederherstellen eines Dokuments.
Strg + BildlaufÄndert die Skalierung des Dokuments durch Vergrößern oder Verkleinern.

Spaltenfelder

Spaltenfelder haben die folgenden Optionen:

  • Neues Spaltenfeld erstellen Plus-Symbol
  • Feld bearbeiten Symbol „Bearbeiten“
  • Spaltenfeldwerte erweitern/reduzieren Symbol zum Erweitern oder Reduzieren

Weitere Informationen zu Spaltenfeldern finden Sie in diesem Abschnitt.

Reguläre Felder

Reguläre Felder haben die folgenden Optionen:

  • Ein neues reguläres Feld erstellen Plus-Symbol
  • Feld bearbeiten Symbol „Bearbeiten“

Weitere Informationen zu regulären Feldern finden Sie in diesem Abschnitt.

Klassifizierungsfelder

Klassifizierungsfelder haben die folgenden Optionen:

  • Erstellen Sie ein neues Klassifizierungsfeld. Plus-Symbol
  • Feld bearbeiten Symbol „Bearbeiten“

Weitere Informationen zu Klassifizierungsfeldern finden Sie in diesem Abschnitt.

Dokumentansicht

Bei mehrseitigen Dokumenten können Sie natürlich wie bei jedem PDF-Anzeigeprogramm durch die Seiten scrollen. Zum Vergrößern oder Verkleinern halten Sie STRG gedrückt und scrollen mit der Maus.

Sie können Dokumente beschriften, indem Sie die Wortfelder auswählen und sie einem Feld durch Tastendruck zuweisen. Sie können auch mit der rechten Maustaste auf das Wortfeld klicken und die extrahierten Informationen überprüfen.

Weitere Informationen zum Beschriften von Dokumenten finden Sie auf dieser Seite.

Wenn Sie eine neue Document Manager-Sitzung öffnen oder einen leeren Filter haben, werden bestimmte Richtlinien in der Dokumentansicht angezeigt:

Screenshot der Oberfläche „Document Manager“.

Außerdem werden Fehler beim Laden auch in der Dokumentansicht angezeigt:

Screenshot eines Beispiels für eine Ladefehler.

War diese Seite hilfreich?

Verbinden

Benötigen Sie Hilfe? Support

Möchten Sie lernen? UiPath Academy

Haben Sie Fragen? UiPath-Forum

Auf dem neuesten Stand bleiben