- Überblick
- Modellerstellung
- Modellvalidierung
- Modellbereitstellung
- Häufig gestellte Fragen
- Häufig gestellte Fragen

Benutzerhandbuch für unstrukturierte und komplexe Dokumente
Wie erhalten Kunden und Partner Zugriff auf die Funktionalität für unstrukturierte und komplexe Dokumente von IXP?
Kunden und Partner können ihr Interesse im Insider-Portal registrieren, da die Funktion „Unstrukturierte und komplexe Dokumente“ derzeit im Vorschauprogramm verfügbar ist. Wir überprüfen regelmäßig die Registrierungen und die ausgewählten Kunden und Partner werden aufgefordert, am Vorschauprogramm teilzunehmen. Stellen Sie sicher, dass Sie so viele Details wie möglich zum Anwendungsfall bereitstellen.
Wann wird die Funktionalität offiziell allgemein verfügbar sein?
Das Zieldatum für die offizielle Veröffentlichung der Funktion „Unstrukturierte und komplexe Dokumente“ ist Ende Juli 2025. Ausgewählte Kunden können während des verbleibenden Vorschauzeitraums an einer kontrollierten allgemeinen Verfügbarkeit teilnehmen. Alle kontrollierten allgemein verfügbaren Anwendungsfälle müssen vom Produktteam genehmigt und von den jeweiligen Kontoteams unterstützt werden.
Ist die Funktion für Community-Benutzer verfügbar?
Ja, die Funktion ist für Community-Benutzer verfügbar, die nur Zugriff auf eine eingeschränkte Funktionalität haben, und alle Mandanten oder Projekte unterliegen vordefinierten Entwurfszeit- und Laufzeitbeschränkungen. Weitere Informationen finden Sie in den Abschnitten Entwurfszeit und Laufzeit .
Was sind die IXP-Bereitstellungsoptionen? Ist die Funktionalität vor Ort verfügbar?
Derzeit sind die Funktionen IXP Communication Mining sowie Unstrukturierte und komplexe Dokumente nur in der UiPath® Automation Cloud™ verfügbar.
Document Understanding ist in den Bereitstellungen von Automation Cloud, Automation Suite und Standalone-Bereitstellungen verfügbar. Weitere Informationen zu den Bereitstellungsoptionen von Document Understanding finden Sie unter Wahl des Bereitstellungstyps.
Ist die Funktionalität in allen Regionen verfügbar?
Derzeit ist die Funktion für unstrukturierte und komplexe Dokumente in Mandanten für die USA und Europa allgemein verfügbar. In den Regionen Kanada, Japan und Australien ist sie in der privaten Vorschau verfügbar.
Welche Sprachen werden in der Funktionalität unterstützt?
Benutzer können Dokumente hochladen und Modelle in jeder Sprache erstellen, die vom ausgewählten Modell innerhalb IXP unterstützt wird.
Welche Dateiformate werden in der Funktionalität unterstützt?
Derzeit unterstützt die Funktionalität die Dateiformate PNG, JPG oder JPEG, PDF und TIF- oder TIFF.
Greift IXP auf eine spezialisierte oder generative KI zurück?
Communications Mining verwendet spezialisierte KI- und generative KI-Funktionen, wobei alle generativen KI-Funktionen bei Bedarf deaktiviert werden können.
Document Understanding greift auf spezialisierte KI- und generative KI-Funktionen zurück, wobei alle generativen KI-Funktionen bei Bedarf deaktiviert werden können.
Generative Extraktion für unstrukturierte und komplexe Dokumente greift auf generative KI über LLMs von Drittanbietern. Diese Funktionalität ist ohne generative KI nicht möglich.
Sind CommPath und DocPath in IXP verfügbar?
CommPath ist in Communications Mining verfügbar, wenn die Funktion „Generative Extraktion“ verwendet wird.
DocPath ist in Document Understanding nur in der modernen Umgebung verfügbar. Sie ist in der klassischen Document Understanding-Umgebung nicht verfügbar.
Beides ist in der generativen Extraktion für unstrukturierte und komplexe Dokumente nicht verfügbar.
Durchläuft IXP den AI Trust Layer (AITL)?
Ja, alle Funktionen von IXP, die auf LLMs von Drittanbietern zurückgreifen, gehen über das UiPath AITL. CommPath und DocPath sind die proprietären Modelle von UiPath und durchlaufen nicht das AITL.
Welche LLMs nutzt die Funktion?
Die Modelle GPT4o Vision und Gemini sind in der Funktion Unstrukturierte und komplexe Dokumente verfügbar. Das Gemini-Modell ist als intelligente Vorverarbeitungsfunktion für Tabellendaten verfügbar.
Aktiviert die Funktionalität ein BYO-Abonnement (Bring Your Own)?
Derzeit nicht, aber das BYO-Abonnement wird in zukünftigen Versionen unterstützt.
Kann ich meinen Anwendungsfall von Document Understanding Classic zur Funktionalität „Unstrukturierte und komplexe Dokumente“ in IXP migrieren?
Noch nicht, aber die Import- und Exportfunktion wird in zukünftigen Versionen verfügbar sein.
Kann ich meinen Anwendungsfall von Document Understanding Modern zur Funktionalität „Unstrukturierte und komplexe Dokumente“ in IXP migrieren?
Noch nicht, aber die Import- und Exportfunktion wird in zukünftigen Versionen verfügbar sein.
Kann ich meinen Anwendungsfall von der Aktivität „Document Understanding Generative Extractor“ zur Funktionalität „Unstrukturierte und komplexe Dokumente“ in IXP migrieren?
Noch nicht, aber die Import- und Exportfunktion wird in zukünftigen Versionen verfügbar sein.
Gibt es in der Entwurfsphase Einschränkungen hinsichtlich der Funktionalität?
Folgende Beschränkungen gelten in der Entwurfsphase:
- Anzahl der Felder pro Feldgruppe: bis zu 32 Felder.
- Anzahl der Zeichen pro Feldname: bis zu 32 Zeichen (wird in zukünftigen Versionen erhöht).
- Anzahl der Zeichen pro Prompt-Anweisung: bis zu 2048 Zeichen. Dies gilt für alle Prompts, einschließlich allgemeiner Anweisungen, Feldgruppenanweisungen, Feldanweisungen und Feldtypanweisungen.
Kann ich generische Felder in der Dokumentenfunktionalität erstellen?
Nein, es gibt kein Konzept für generische Felder in IXP. Alle Felder müssen zu einer Feldgruppe gehören. Jede Feldgruppe repräsentiert eine separate Tabelle, wobei Felder für Tabellenspalten der Tabelle stehen. Es ist jedoch möglich, eine Feldgruppe auf übergeordneter Ebene zu definieren, die einen Dokumententyp repräsentiert, und allgemeinere Felder als Tabelle unter dieser Feldgruppe hinzufügen.
Verbessern unstrukturierte und komplexe Dokumentenmodelle von IXP die Leistung mit Beschriftungen oder Anmerkungen?
Nein, das Modell lernt noch nicht direkt aus Benutzeranmerkungen. Die derzeit mögliche Verbesserung der Leistung Ihres Modells besteht darin, Ihre Prompt-Anweisungen oder die Modellkonfiguration zu ändern. Wir forschen an verschiedenen Lösungen, darunter kontextbezogenes Lernen, Verbesserungen des Anweisungsfeedback und fein abgestimmte Modelle.
Warum muss ich Dokumenten Anmerkungen hinzufügen, wenn die Leistung des Modells dadurch nicht verbessert wird?
Es ist immer noch wichtig, Dokumente zu validieren und mit Anmerkungen zu versehen, um Referenzdaten für die Leistungsevaluierung des Modells zu ermitteln, die in den integrierten Leistungsmetriken auf der Seite Messen erfasst wird.
Wie viele Dokumente muss ich hochladen, um meine Prompt-Anweisungen zu testen?
Sie sollten ein repräsentatives Beispiel Ihrer Dokumente hochladen, um alle möglichen Varianten abzudecken. Dies sollte mindestens 20 bis 30 verschiedene Dokumente sein. Es wird empfohlen, dass Sie die anfänglichen Vorhersagen für 2 bis 3 Dokumente überprüfen und entscheiden, ob Sie Ihre Prompt-Anweisungen ändern müssen, bevor Sie die Stichprobe nach und nach auf 10, 20, 30, x Dokumente erweitern, was schrittweise erfolgen sollte.
Wie vielen Dokumenten muss ich Anmerkungen hinzufügen, um zuverlässige Leistungsmetriken zu erhalten?
Es wird empfohlen, mindestens 10 Dokumente oder 10 Beispiele oder beides für jedes Feld zu validieren, damit das Modell Ihnen aussagekräftige Validierungsstatistiken liefern kann. Dies ist die Mindestanzahl von Anmerkungen und hängt von den spezifischen Anforderungen des Anwendungsfalls ab.
Gibt es Beschränkungen in der Runtime für die Funktion „Unstrukturierte und komplexe Dokumente“?
Während der Runtime gelten folgende Einschränkungen:
-
Anzahl der Seiten pro Dokument – Dokumente bis zu 150 Seiten. Dokumente mit mehr als 50 Seiten erfordern eine Schleifenfunktion, die sich derzeit in der privaten Vorschau befindet. Der Zugriff ist auf Anforderung verfügbar.
Tokenlimits – Datenintensive Dokumente mit mehr als 200 Extraktionen, z. B. lange Tabellen, werden wahrscheinlich das Tokenlimit erreichen. Für solche Dokumente ist eine Schleifenfunktion erforderlich, die sich derzeit in der privaten Vorschau befindet. Der Zugriff ist auf Anforderung möglich.
In einer Vorabversion der allgemeinen Verfügbarkeit sollten diese Limits beide erheblich erhöht werden. Das erhöhte Limit für ein Dokument ist ein Produkt aus der Anzahl der Seiten und der Anzahl der Feldwerte, die extrahiert werden müssen. Wenn die Kombination dieser beiden hoch genug ist, wird die maximale Grenze erreicht, aber die Erwartung besteht darin, Dokumente mit 100 bis 200 Seiten und einer hohen Anzahl von Feldwerten zu unterstützen, die zu extrahieren sind.
Es gibt keine festes Limit für zu extrahierende Feldwerte, da es vom Dokument abhängt. Wenn jedoch das Token-Limit erreicht wird, wird in der API-Antwort ein Indikator für alle Dokumentenvorhersagen zur Runtime bereitgestellt, in denen sowohl das Auftreten als auch die Extraktionssicherheit für eine Extraktion als Null zurückgegeben werden.
Wenn derzeit mehr als 50 Seiten ohne die Schleifenfunktion gesendet werden, verwendet die Funktion nur die ersten 50 Seiten. Wenn die Tokenlimits erreicht werden, werden leere Vorhersagen zurückgegeben.
Werden unstrukturierte und komplexe Dokumentenmodelle über Roboter oder eigenständige Document Understanding-APIs genutzt?
Unstrukturierte und komplexe Dokumentenmodelle können sowohl über Roboter als auch über eine eigenständige Document Understanding Automation Cloud-API genutzt werden.
Wie kann ich Ausgaben von unstrukturierten und komplexen Dokumenten nutzen?
Modellausgaben können über APIs, Document Understanding-Aktivitäten oder IntelligentOCR-Aktivitäten genutzt werden. Stellen Sie sicher, dass:
- Das IOCR-Paket v6.23.2-Vorschau oder höher installiert ist und die Aktivität „Document Understanding Project Extractor“ gewählt wird
- Das Document Understanding-Paket v2.13.2-Vorschau oder höher installieren ist und die Aktivität „Extract Document Data“ extrahieren gewählt wird.
Liefert die Funktion „Unstrukturierte und komplexe Dokumenten“ in IXP Vertrauensbewertungen? Wie werden sie berechnet?
Ja, wir stellen Konfidenzwerte in der Modellantwort und im Action Center (Runtime) bereit, jedoch nicht auf der Benutzeroberfläche von IXP (Entwurfsphase). Wir verwenden die vom LLM zurückgegebenen Token-Wahrscheinlichkeiten, um die Vertrauenswerte der Feld- und Extraktionsebene zu schätzen.
Können die Modellausgaben aus unstrukturierten und komplexen Dokumenten aus Hybridbereitstellungen – d. h. dem On-Prem-Orchestrator oder der Automation Suite und dem Cloud-Modell für IXP – genutzt werden?
Ja, dies wird über externe Apps unterstützt. Weitere Einzelheiten dazu finden Sie unter OAuth-Apps.
Können Modellausgaben von unstrukturierten und komplexen Dokumenten von IXP aus verschiedenen Organisationen oder Mandanten, d. h. Produktion, Entwicklung oder UAT, genutzt werden?
Ja, dies wird über externe Apps unterstützt. Weitere Einzelheiten dazu finden Sie unter OAuth-Apps.
Funktioniert die Validierungsstation mit der Funktion „Unstrukturierte und komplexe Dokumente“?
Ja, es funktioniert genauso wie in modernen oder klassischen Document Understanding-Projekten. Alle Extraktionen müssen jedoch als Tabellen validiert werden.
Lernt das Modell für unstrukturierte und komplexe Dokumente basierend auf der HITL-Validierung im Action Center?
Nein, derzeit gibt es keine Feedbackschleife zwischen dem Action Center und unstrukturierten und komplexen Dokumentenmodellen. Dies soll in zukünftigen Versionen neben fein einstellbaren Modellen unterstützt werden.
Bietet die Funktionalität Überwachungstools? Unterscheiden sich diese von modernen Document Understanding-Projekten? Gibt es Abhängigkeiten von Insights?
Derzeit bietet die Funktion Unstrukturierte und komplexe Dokumente keine Überwachungsfunktionen, wie die Seite Überwachen in modernen Projekten. Zusätzliche Einzelheiten zu den Überwachungsfunktionen werden in zukünftigen Versionen veröffentlicht.
Kann der Verbrauch AI Unit für Projekte mit unstrukturierten und komplexen Dokumenten überwacht werden?
Derzeit ist keine Nachverfolgung des Verbrauchs pro Projekt verfügbar. Nach der vollständigen Integration wird der Verbrauch wahrscheinlich im Dashboard für den Verbrauch von AI Units und in einem separaten Dashboard für unstrukturierte und komplexe Dokumente angezeigt
Können wir einen Leistungsabfall automatisch erkennen, z. B. Datendrift, niedrigere F1-Scores usw.?
Im Moment stellen wir keine Benachrichtigungen oder Warnungen zur Modellleistung bereit.
Wie oft müssen Benutzer ihre Modelle oder Prompt-Anweisungen aktualisieren?
Dies hängt vom jeweiligen Anwendungsfall ab, aber Sie sollten Ihre Prompt-Anweisungen verfeinern, wenn Ihre Extraktionen leistungsschwächer sind.