IXP – Häufig gestellte Fragen

Zugriff und Verfügbarkeit

Wie erhalten Kunden und Partner Zugriff auf die Funktionalität für Unstrukturierte und komplexe Dokumente von IXP?

Kunden und Partner können ihr Interesse im Insider-Portal registrieren, da die Funktion „Unstrukturierte und komplexe Dokumente“ derzeit im Vorschauprogramm verfügbar ist. Wir überprüfen regelmäßig die Registrierungen und die ausgewählten Kunden und Partner werden aufgefordert, am Vorschauprogramm teilzunehmen. Stellen Sie sicher, dass Sie so viele Details wie möglich zum Anwendungsfall bereitstellen.

Wann wird die Funktionalität offiziell allgemein verfügbar sein?

Das Zieldatum für die offizielle Veröffentlichung der Funktion „Unstrukturierte und komplexe Dokumente“ ist Ende Juli 2025. Ausgewählte Kunden können während des verbleibenden Vorschauzeitraums an einer kontrollierten allgemeinen Verfügbarkeit teilnehmen. Alle kontrollierten allgemein verfügbaren Anwendungsfälle müssen vom Produktteam genehmigt und von den jeweiligen Kontoteams unterstützt werden.

Ist die Funktion für Community-Benutzer verfügbar?

Ja, die Funktion ist für Community-Benutzer verfügbar, die nur Zugriff auf eine eingeschränkte Funktionalität haben, und alle Mandanten oder Projekte unterliegen vordefinierten Entwurfszeit- und Laufzeitbeschränkungen. Weitere Informationen finden Sie in den Abschnitten Entwurfszeit und Laufzeit .

Was sind die IXP-Bereitstellungsoptionen? Ist die Funktionalität vor Ort verfügbar?

Derzeit sind die Funktionen IXP Communication Mining sowie Unstrukturierte und komplexe Dokumente nur in der UiPath® Automation Cloud™ verfügbar.

Document Understanding ist in den Bereitstellungen von Automation Cloud, Automation Suite und Standalone-Bereitstellungen verfügbar. Weitere Informationen zu den Bereitstellungsoptionen von Document Understanding finden Sie unter Wahl des Bereitstellungstyps.

Ist die Funktionalität in allen Regionen verfügbar?

Derzeit ist die Funktion „Unstrukturierte und komplexe Dokumente“ für Mandanten in den USA und Europa allgemein verfügbar und in der privaten Vorschau für Mandanten in den Regionen Kanada, Japan und Australien verfügbar.

Welche Sprachen werden in der Funktionalität unterstützt?

Benutzer können Dokumente hochladen und Modelle in jeder Sprache erstellen, die vom ausgewählten Modell in IXP unterstützt wird.

Welche Dateiformate werden in der Funktionalität unterstützt?

Derzeit unterstützt die Funktionalität die Dateiformate PNG, JPG oder JPEG, PDF und TIF- oder TIFF.

Daten und Sicherheit

Greift IXP auf eine spezialisierte oder generative KI zurück?

Communications Mining verwendet spezialisierte KI- und generative KI-Funktionen, wobei alle generativen KI-Funktionen bei Bedarf deaktiviert werden können.

Document Understanding greift auf spezialisierte KI- und generative KI-Funktionen zurück, wobei alle generativen KI-Funktionen bei Bedarf deaktiviert werden können.

Generative Extraktion für Unstrukturierte und komplexe Dokumente greift auf generative KI über LLMs von Drittanbietern. Diese Funktionalität ist ohne generative KI nicht möglich.

Are CommPath and DocPath available in IXP?

CommPath ist in Communications Mining verfügbar, wenn die Funktion „Generative Extraktion“ verwendet wird.

DocPath is available in Document Understanding, only in the Modern experience. It is not available in the Document Understanding Classic experience.

Beides ist in der generativen Extraktion für Unstrukturierte und komplexe Dokumente nicht verfügbar.

Durchläuft IXP den AI Trust Layer (AITL)?

Yes, all IXP capabilities that use third-party LLMs go through the UiPath AITL. CommPath and DocPath are the proprietary models of UiPath and do not go through the AITL.

Welche LLMs verwendet die Funktion?

Die Modelle GPT-4o Vision und Gemini sind in der Funktion „Unstrukturierte und komplexe Dokumente“ verfügbar. Das Gemini-Modell ist als intelligente Vorverarbeitungsfunktion für Tabellendaten verfügbar.

Aktiviert die Funktionalität ein BYO-Abonnement (Bring Your Own)?

Derzeit nicht, aber das BYO-Abonnement wird in zukünftigen Versionen unterstützt.

Migration

Kann ich meinen Anwendungsfall von Document Understanding Classic zur Funktionalität „Unstrukturierte und komplexe Dokumente“ in IXP migrieren?

Noch nicht, aber die Import- und Exportfunktion wird in zukünftigen Versionen verfügbar sein.

Kann ich meinen Anwendungsfall von Document Understanding Modern zur Funktionalität „Unstrukturierte und komplexe Dokumente“ in IXP migrieren?

Noch nicht, aber die Import- und Exportfunktion wird in zukünftigen Versionen verfügbar sein.

Kann ich meinen Anwendungsfall von der Aktivität „Document Understanding Generative Extractor“ zur Funktionalität „Unstrukturierte und komplexe Dokumente“ in IXP migrieren?

Noch nicht, aber die Import- und Exportfunktion wird in zukünftigen Versionen verfügbar sein.

Entwurfsphase

Gibt es in der Entwurfsphase Einschränkungen hinsichtlich der Funktionalität?

Folgende Beschränkungen gelten in der Entwurfsphase:

Anzahl der Felder pro Feldgruppe: bis zu 32 Felder.
Anzahl der Zeichen pro Feldname: bis zu 128 Zeichen.
Anzahl der Zeichen pro Prompt-Anweisung: bis zu 2048 Zeichen. Dies gilt für alle Prompts, einschließlich allgemeiner Anweisungen, Feldgruppenanweisungen, Feldanweisungen und Feldtypanweisungen.

Kann ich generische Felder in der Dokumentenfunktionalität erstellen?

Nein, es gibt kein Konzept für generische Felder in IXP. Alle Felder müssen zu einer Feldgruppe gehören. Jede Feldgruppe repräsentiert eine separate Tabelle, wobei Felder für Tabellenspalten der Tabelle stehen. Es ist jedoch möglich, eine Feldgruppe auf übergeordneter Ebene zu definieren, die einen Dokumententyp repräsentiert, und allgemeinere Felder als Tabelle unter dieser Feldgruppe hinzufügen.

Verbessern Unstrukturierte und komplexe Dokumentenmodelle von IXP die Leistung mit Beschriftungen oder Anmerkungen?

Nein, das Modell lernt noch nicht direkt aus Benutzeranmerkungen. Die derzeit mögliche Verbesserung der Leistung Ihres Modells besteht darin, Ihre Prompt-Anweisungen oder die Modellkonfiguration zu ändern. Wir forschen an verschiedenen Lösungen, darunter kontextbezogenes Lernen, Verbesserungen des Anweisungsfeedback und fein abgestimmte Modelle.

Warum muss ich Dokumenten Anmerkungen hinzufügen, wenn die Leistung des Modells dadurch nicht verbessert wird?

Es ist immer noch wichtig, Dokumente zu validieren und mit Anmerkungen zu versehen, um Referenzdaten für die Leistungsevaluierung des Modells zu ermitteln, die in den integrierten Leistungsmetriken auf der Seite Messen erfasst wird.

Wie viele Dokumente muss ich hochladen, um meine Prompt-Anweisungen zu testen?

Sie sollten ein repräsentatives Beispiel Ihrer Dokumente hochladen, um alle möglichen Varianten abzudecken. Dies sollte mindestens 20 bis 30 verschiedene Dokumente sein. Es wird empfohlen, dass Sie die anfänglichen Vorhersagen für 2 bis 3 Dokumente überprüfen und entscheiden, ob Sie Ihre Prompt-Anweisungen ändern müssen, bevor Sie die Stichprobe nach und nach auf 10, 20, 30, x Dokumente erweitern, was schrittweise erfolgen sollte.

Wie vielen Dokumenten muss ich Anmerkungen hinzufügen, um zuverlässige Leistungsmetriken zu erhalten?

Es wird empfohlen, mindestens 10 Dokumente oder 10 Beispiele oder beides für jedes Feld zu validieren, damit das Modell Ihnen aussagekräftige Validierungsstatistiken liefern kann. Dies ist die Mindestanzahl von Anmerkungen und hängt von den spezifischen Anforderungen des Anwendungsfalls ab.

Laufzeit

Werden Unstrukturierte und komplexe Dokumentenmodelle über Roboter oder eigenständige Document Understanding-APIs genutzt?

Unstrukturierte und komplexe Dokumentenmodelle können sowohl über Roboter als auch über eine eigenständige Document Understanding Automation Cloud-API genutzt werden.

Wie kann ich Ausgaben von unstrukturierten und komplexen Dokumenten nutzen?

Modellausgaben können über APIs, Document Understanding-Aktivitäten oder IntelligentOCR-Aktivitäten genutzt werden. Stellen Sie sicher, dass:

Das IOCR-Paket v6.23.2-Vorschau oder höher installiert ist und die Aktivität „Document Understanding Project Extractor“ gewählt wird
Das Document Understanding-Paket v2.13.2-Vorschau oder höher installieren ist und die Aktivität „Extract Document Data“ extrahieren gewählt wird.

Liefert die Funktion „Unstrukturierte und komplexe Dokumenten“ in IXP Vertrauensbewertungen? Wie werden sie berechnet?

Ja, wir geben Konfidenzbewertungen in der Modellantwort und im Action Center (Laufzeit) an, jedoch nicht in der IXP-Benutzeroberfläche (Entwurfszeit). Wir verwenden die vom LLM zurückgegebenen Token-Warnungen, um die Konfidenzen auf Feld- und Extraktionsebene zu schätzen.

Können die Modellausgaben aus unstrukturierten und komplexen Dokumenten aus Hybridbereitstellungen – d. h. dem On-Prem-Orchestrator oder der Automation Suite und dem Cloud-Modell für IXP – genutzt werden?

Ja, dies wird über externe Apps unterstützt. Weitere Einzelheiten dazu finden Sie unter OAuth-Apps.

Können Modellausgaben von unstrukturierten und komplexen Dokumenten von IXP aus verschiedenen Organisationen oder Mandanten, d. h. Produktion, Entwicklung oder UAT, genutzt werden?

Ja, dies wird über externe Apps unterstützt. Weitere Einzelheiten dazu finden Sie unter OAuth-Apps.

Funktioniert die Validierungsstation mit der Funktion „Unstrukturierte und komplexe Dokumente“?

Ja, es funktioniert genauso wie in modernen oder klassischen Document Understanding-Projekten. Alle Extraktionen müssen jedoch als Tabellen validiert werden.

Lernt das Modell für Unstrukturierte und komplexe Dokumente basierend auf der HITL-Validierung im Action Center?

Nein, derzeit gibt es keine Feedbackschleife zwischen dem Action Center und unstrukturierten und komplexen Dokumentenmodellen. Dies soll in zukünftigen Versionen neben fein einstellbaren Modellen unterstützt werden.

Einschränkungen bei der Dokumentverarbeitung

In der Praxis kann IXP bis zu etwa 1.200 Feldwerte pro Dokument zuverlässig extrahieren.

Das bedeutet, dass das Modell sein Tokenlimit erreichen kann, wenn für ein Dokument mehr als 1.200 Feldwerte extrahiert werden müssen. Dies kann passieren, auch wenn sich das Dokument innerhalb der in diesem Abschnitt aufgeführten Seitenlimits befindet. Laufende Forschungs- und Entwicklungsarbeiten zur Unterstützung höherer Feldwertgrenzen in zukünftigen Versionen.

Wenn die Tokenlimits überschritten werden, können Vorhersagen unabhängig von der Anzahl der Seiten unvollständig oder leer sein. Beispielsweise kann ein 80-seitiges Dokument mit 1.400 extrahierten Feldwerten eine Tokenlimit-Warnung auf der Benutzeroberfläche auslösen. Wenn das Tokenlimit zur Runtime überschritten wird, zeigt die API-Antwort dies an, indem sie Vorkommens- und Extraktionskonfidenzwerte von 0 zurückgibt.

Wenn Seitenlimits überschritten werden, werden nur die Seiten innerhalb der unten angegebenen Grenzen verarbeitet. Beide Verhaltensweisen gelten sowohl für Gemini als auch für GPT-4o.

Laufzeitlimits umfassen:

Anzahl der Seiten pro Dokument:
- Für Gemini bis zu 500 Seiten.
- Für GPT-4o 50 Seiten und bis zu 150 Seiten mit der Funktion zum iterativen Aufrufen der privaten Vorschau.
Tokenlimits – Datenintensive Dokumente mit mehr als 200 Extraktionen, z. B. lange Tabellen, werden wahrscheinlich das Tokenlimit erreichen. Wenn GPT4-o sein Limit erreicht, können Sie die Funktion zum iterativen Aufrufen der privaten Vorschau verwenden, um die Feldausgabe zu erhöhen. Gemini hat jedoch standardmäßig ein höheres Ausgabetokenlimit, sodass beide Modelle ähnliche Mengen an Feldwerten zurückgeben können – Gemini in einem einzigen Aufruf und GPT bei mehreren Aufrufen.

Hinweis: Um Zugriff auf die iterative Funktion „Private Aufrufe“ anzufordern, wenden Sie sich an Ihren Kontomanager.

Wartung und Überwachung

Bietet die Funktionalität Überwachungstools? Unterscheiden sich diese von modernen Document Understanding-Projekten? Gibt es Abhängigkeiten von Insights?

Derzeit bietet die Funktion Unstrukturierte und komplexe Dokumente keine Überwachungsfunktionen, wie die Seite Überwachen in modernen Projekten. Zusätzliche Einzelheiten zu den Überwachungsfunktionen werden in zukünftigen Versionen veröffentlicht.

Kann der Verbrauch von AI Units für Unstrukturierte und komplexe Dokumentenprojekte überwacht werden?

Derzeit kann der Verbrauch pro Projekt nicht nachverfolgt werden. Nach der vollständigen Integration wird der Verbrauch wahrscheinlich im Dashboard für den Verbrauch von AI Units sowie in einem separaten Dashboard für Unstrukturierte und komplexe Dokumente angezeigt.

Können wir einen Leistungsabfall automatisch erkennen, z. B. Datendrift, niedrigere F1-Scores usw.?

Im Moment stellen wir keine Benachrichtigungen oder Warnungen zur Modellleistung bereit.

Wie oft müssen Benutzer ihre Modelle oder Prompt-Anweisungen aktualisieren?

Dies hängt vom jeweiligen Anwendungsfall ab, aber Sie sollten Ihre Prompt-Anweisungen verfeinern, wenn Ihre Extraktionen leistungsschwächer sind.

Benutzerhandbuch für Unstrukturierte und komplexe Dokumente

Häufig gestellte Fragen

Zugriff und Verfügbarkeit

Daten und Sicherheit

Migration

Entwurfsphase

Laufzeit

Einschränkungen bei der Dokumentverarbeitung

Wartung und Überwachung

War diese Seite hilfreich?