- Überblick
- Modellerstellung
- Modellvalidierung
- Modellbereitstellung
- API
- Häufig gestellte Fragen
- Häufig gestellte Fragen

Benutzerhandbuch für Unstrukturierte und komplexe Dokumente
Wo die Funktion allgemein verfügbar ist
- Europa
- Vereinigte Staaten
- United States (verzögerte Region)
- Japan
- Kanada
- Australien
- Vereinigtes Königreich
Die Liste der Regionen finden Sie auch unter Global Cloud Services.
Ist die Funktion für Community-Benutzer verfügbar?
Ja, die Funktion ist für Community-Benutzer verfügbar, die nur Zugriff auf eine eingeschränkte Funktion haben. Alle Mandanten oder Projekte unterliegen vordefinierten Design-Time- und Runtime-Limits.Weitere Details aktivieren Sie in den Abschnitten Design-Time und Runtime.
Was sind die IXP-Bereitstellungsoptionen? Ist die Funktionalität vor Ort verfügbar?
Derzeit sind die Funktionen IXP Communication Mining sowie Unstrukturierte und komplexe Dokumente nur in der UiPath® Automation Cloud™ verfügbar.
Document Understanding ist in den Bereitstellungen von Automation Cloud, Automation Suite und Standalone-Bereitstellungen verfügbar. Weitere Informationen zu den Bereitstellungsoptionen von Document Understanding finden Sie unter Wahl des Bereitstellungstyps.
Welche Sprachen werden in der Funktionalität unterstützt?
Benutzer können Dokumente hochladen und Modelle in jeder Sprache erstellen, die vom ausgewählten Modell in IXP unterstützt wird.
Welche Dateiformate werden in der Funktionalität unterstützt?
Derzeit unterstützt die Funktionalität die Dateiformate PNG, JPG oder JPEG, PDF und TIF- oder TIFF.
Greift IXP auf eine spezialisierte oder generative KI zurück?
Communications Mining verwendet spezialisierte KI- und generative KI-Funktionen, wobei alle generativen KI-Funktionen bei Bedarf deaktiviert werden können.
Document Understanding greift auf spezialisierte KI- und generative KI-Funktionen zurück, wobei alle generativen KI-Funktionen bei Bedarf deaktiviert werden können.
Generative Extraktion für Unstrukturierte und komplexe Dokumente greift auf generative KI über LLMs von Drittanbietern. Diese Funktionalität ist ohne generative KI nicht möglich.
Ist UiPath Helix in IXP verfügbar?
Der UiPath Helix Extractor 1.0 (IXP-Comms) ist in Communications Mining bei Verwendung der Funktion Generative Extraktion verfügbar.
Der UiPath Helix Extractor 1.0 (IXP-Docs) und UiPath Helix Extractor 2.0 (IXP-Docs) sind in Document Understanding nur in der modernen Umgebung verfügbar. Er ist in Document Understanding Classic nicht verfügbar.
Beides ist in der generativen Extraktion für Unstrukturierte und komplexe Dokumente nicht verfügbar.
Durchläuft IXP den AI Trust Layer (AITL)?
Ja, alle Funktionen von IXP, die auf LLMs von Drittanbietern zurückgreifen, gehen über das UiPath AITL. UiPath Helix ist das proprietäre Familienmodell von UiPath. Aufrufe von Helix laufen nicht über das AITL, da sie intern in der UiPath-Umgebung erfolgen.
Welche LLMs verwendet die Funktion?
Die Modelle GPT-4o Vision und Gemini sind in der Funktion „Unstrukturierte und komplexe Dokumente“ verfügbar. Das Gemini-Modell ist als intelligente Vorverarbeitungsfunktion für tabellarische Daten und für die modellbasierte Zuordnung verfügbar.
Aktiviert die Funktionalität ein BYO-Abonnement (Bring Your Own)?
Derzeit nicht, aber das BYO-Abonnement wird in zukünftigen Versionen unterstützt.
Kann ich meinen Anwendungsfall von Document Understanding Classic zur Funktionalität „Unstrukturierte und komplexe Dokumente“ in IXP migrieren?
Noch nicht, aber die Import- und Exportfunktion wird in zukünftigen Versionen verfügbar sein.
Kann ich meinen Anwendungsfall von Document Understanding Modern zur Funktionalität „Unstrukturierte und komplexe Dokumente“ in IXP migrieren?
Noch nicht, aber die Import- und Exportfunktion wird in zukünftigen Versionen verfügbar sein.
Kann ich meinen Anwendungsfall von der Aktivität „Document Understanding Generative Extractor“ zur Funktionalität „Unstrukturierte und komplexe Dokumente“ in IXP migrieren?
Noch nicht, aber die Import- und Exportfunktion wird in zukünftigen Versionen verfügbar sein.
Gibt es in der Entwurfsphase Einschränkungen hinsichtlich der Funktionalität?
Folgende Beschränkungen gelten in der Entwurfsphase:
- Anzahl der Felder pro Feldgruppe: bis zu 32 Felder.
- Anzahl der Zeichen pro Feldname: bis zu 128 Zeichen.
- Anzahl der Zeichen pro Prompt-Anweisung: bis zu 4096 Zeichen. Dies gilt für alle Prompts, einschließlich allgemeiner Anweisungen, Feldgruppenanweisungen, Feldanweisungen und Feldtypanweisungen.
Kann ich generische Felder in der Dokumentenfunktionalität erstellen?
Nein, es gibt kein Konzept für generische Felder in IXP. Alle Felder müssen zu einer Feldgruppe gehören. Jede Feldgruppe repräsentiert eine separate Tabelle, wobei Felder für Tabellenspalten der Tabelle stehen. Es ist jedoch möglich, eine Feldgruppe auf übergeordneter Ebene zu definieren, die einen Dokumententyp repräsentiert, und allgemeinere Felder als Tabelle unter dieser Feldgruppe hinzufügen.
Verbessern Unstrukturierte und komplexe Dokumentenmodelle von IXP die Leistung mit Beschriftungen oder Anmerkungen?
Nein, das Modell lernt noch nicht direkt aus Benutzeranmerkungen. Derzeit können Sie die Leistung Ihres Modells verbessern, indem Sie Ihre Prompt-Anweisungen oder die Modellkonfiguration anpassen. Ein feinabstimmbares Modell, das aus Anmerkungen lernt, wird in einer zukünftigen Version verfügbar sein.
Warum muss ich Dokumenten Anmerkungen hinzufügen, wenn die Leistung des Modells dadurch nicht verbessert wird?
Es ist immer noch wichtig, Dokumente zu validieren und mit Anmerkungen zu versehen, um Referenzdaten für die Leistungsevaluierung des Modells zu ermitteln, die in den integrierten Leistungsmetriken auf der Seite Messen erfasst wird.
Wie viele Dokumente muss ich hochladen, um meine Prompt-Anweisungen zu testen?
Sie sollten ein repräsentatives Beispiel Ihrer Dokumente hochladen, um alle möglichen Varianten abzudecken. Dies sollte mindestens 20 bis 30 verschiedene Dokumente sein. Es wird empfohlen, dass Sie die anfänglichen Vorhersagen für 2 bis 3 Dokumente überprüfen und entscheiden, ob Sie Ihre Prompt-Anweisungen ändern müssen, bevor Sie die Stichprobe nach und nach auf 10, 20, 30, x Dokumente erweitern, was schrittweise erfolgen sollte.
Wie vielen Dokumenten muss ich Anmerkungen hinzufügen, um zuverlässige Leistungsmetriken zu erhalten?
Es wird empfohlen, mindestens 10 Dokumente oder 10 Beispiele oder beides für jedes Feld zu validieren, damit das Modell Ihnen aussagekräftige Validierungsstatistiken liefern kann. Dies ist die Mindestanzahl von Anmerkungen und hängt von den spezifischen Anforderungen des Anwendungsfalls ab.
Werden Unstrukturierte und komplexe Dokumentenmodelle über Roboter oder eigenständige Document Understanding-APIs genutzt?
Unstrukturierte und komplexe Dokumentenmodelle können sowohl über Roboter als auch über eine eigenständige Document Understanding Automation Cloud-API genutzt werden.
Wie kann ich Ausgaben von unstrukturierten und komplexen Dokumenten nutzen?
Modellausgaben können über APIs, Document Understanding-Aktivitäten oder IntelligentOCR-Aktivitäten genutzt werden. Stellen Sie sicher, dass:
- Das IOCR-Paket v6.23.2-Vorschau oder höher installiert ist und die Aktivität „Document Understanding Project Extractor“ gewählt wird
- Das Document Understanding-Paket v2.13.2-Vorschau oder höher installieren ist und die Aktivität „Extract Document Data“ extrahieren gewählt wird.
Liefert die Funktion „Unstrukturierte und komplexe Dokumenten“ in IXP Vertrauensbewertungen? Wie werden sie berechnet?
Ja, wir stellen Konfidenzbewertungen in der Modellantwort und im Action Center (Runtime) bereit, jedoch nicht in der Intelligente Datenextraktion und Verarbeitung (IXP)-Benutzeroberfläche (Design-Time).Wir verwenden die vom LLM zurückgegebenen Token-Wahrscheinlichkeiten, um die Vertrauenswerte der Feld- und Extraktionsebene zu schätzen.
Können die Modellausgaben aus unstrukturierten und komplexen Dokumenten aus Hybridbereitstellungen – d. h. dem On-Prem-Orchestrator oder der Automation Suite und dem Cloud-Modell für IXP – genutzt werden?
Ja, dies wird über externe Apps unterstützt. Weitere Einzelheiten dazu finden Sie unter OAuth-Apps.
Können Modellausgaben von unstrukturierten und komplexen Dokumenten von IXP aus verschiedenen Organisationen oder Mandanten, d. h. Produktion, Entwicklung oder UAT, genutzt werden?
Ja, dies wird über externe Apps unterstützt. Weitere Einzelheiten dazu finden Sie unter OAuth-Apps.
Funktioniert die Validierungsstation mit der Funktion „Unstrukturierte und komplexe Dokumente“?
Ja, es funktioniert genauso wie in modernen oder klassischen Document Understanding-Projekten. Alle Extraktionen müssen jedoch als Tabellen validiert werden.
Lernt das Modell für Unstrukturierte und komplexe Dokumente basierend auf der HITL-Validierung im Action Center?
Nein, derzeit gibt es keine Feedbackschleife zwischen dem Action Center und unstrukturierten und komplexen Dokumentenmodellen. Dies soll in zukünftigen Versionen neben fein einstellbaren Modellen unterstützt werden.
In der Praxis kann Intelligente Datenextraktion und Verarbeitung (IXP) zuverlässig bis zu etwa 1.200 Feldwerte pro Dokument extrahieren.
Dies bedeutet, dass das Modell sein Tokenlimit erreichen kann, wenn ein Dokument mehr als 1.200 Feldwerte erfordert. Dies kann auch passieren, wenn das Dokument innerhalb der in diesem Abschnitt aufgeführten Seitenlimits liegt. Forschungs- und Development-Arbeiten werden fortgesetzt, um höhere Feldwertlimits in zukünftigen Versionen zu unterstützen.
Wenn Tokenlimits überschritten werden, können die Vorhersagen unabhängig von der Anzahl der Seiten unvollständig oder leer sein. Beispielsweise kann ein 80-seitiges Dokument mit 1.400 extrahierten Feldwerten eine Token-Limit-Warning in der Benutzeroberfläche triggern.Wenn das Tokenlimit zur Runtime überschritten wird, zeigt die API-Antwort dies an, indem sie Werte für das Auftreten und die Extraktionskonfidenz von 0 zurückgibt.
Wenn Seitenlimits überschritten werden, werden nur die Seiten innerhalb der unten angegebenen Limits verarbeitet. Beide Verhaltensweisen gelten sowohl für Gemini als auch für GPT-4o.
Runtime / runtime-Limits umfassen:
- Anzahl der Seiten pro Dokument:
- Für Gemini bis zu 500 Seiten.
- Für GPT-4o 50 Seiten und bis zu 150 Seiten mit der iterativen Funktion „Private Preview“.
- Tokenlimits – Datenintensive Dokumente mit mehr als 200 Extraktionen, wie z. B. umfangreiche Tabellen, erreichen wahrscheinlich das Tokenlimit, wenn sie eine typische Anzahl von Feldern pro Extraktion aufweisen. Wenn GPT-4o sein Limit erreicht, können Sie die Funktion „Iterativer Aufruf" in der Private Preview verwenden, um die Feldausgabe zu erhöhen. Gemini hat jedoch standardmäßig ein höheres Ausgabetoken-Limit, sodass beide Modelle ähnliche Mengen an Feldwerten zurückgeben können – Gemini in einem einzigen Aufruf und GPT über mehrere Aufrufe.
Bietet die Funktionalität Überwachungstools? Unterscheiden sich diese von modernen Document Understanding-Projekten? Gibt es Abhängigkeiten von Insights?
Derzeit bietet die Funktion Unstrukturierte und komplexe Dokumente keine Überwachungsfunktionen, wie die Seite Überwachen in modernen Projekten. Zusätzliche Einzelheiten zu den Überwachungsfunktionen werden in zukünftigen Versionen veröffentlicht.
Kann der Verbrauch von AI Units für Unstrukturierte und komplexe Dokumentenprojekte überwacht werden?
Ja, Sie können dies über die Insights IXP AI Unit-Dashboards und die AI Unit Tenant-Dashboards tun. Weitere Informationen finden Sie in den Dashboards für AI Units-Verbrauch durch IXP.
Können wir einen Leistungsabfall automatisch erkennen, z. B. Datendrift, niedrigere F1-Scores usw.?
Im Moment stellen wir keine Benachrichtigungen oder Warnungen zur Modellleistung bereit.
Wie oft müssen Benutzer ihre Modelle oder Prompt-Anweisungen aktualisieren?
Dies hängt vom jeweiligen Anwendungsfall ab, aber Sie sollten Ihre Prompt-Anweisungen verfeinern, wenn Ihre Extraktionen leistungsschwächer sind.