- 概要
- Document Processing Contracts
- リリース ノート
- Document Processing Contracts について
- Box クラス
- IPersistedActivity インターフェイス
- PrettyBoxConverter クラス
- IClassifierActivity インターフェイス
- IClassifierCapabilitiesProvider インターフェイス
- ClassifierDocumentType クラス
- ClassifierResult クラス
- ClassifierCodeActivity クラス
- ClassifierNativeActivity クラス
- ClassifierAsyncCodeActivity クラス
- ClassifierDocumentTypeCapability クラス
- ExtractorAsyncCodeActivity クラス
- ExtractorCodeActivity クラス
- ExtractorDocumentType クラス
- ExtractorDocumentTypeCapabilities クラス
- ExtractorFieldCapability クラス
- ExtractorNativeActivity クラス
- ExtractorResult クラス
- ICapabilitiesProvider インターフェイス
- IExtractorActivity インターフェイス
- ExtractorPayload クラス
- DocumentActionPriority 列挙型
- DocumentActionData クラス
- DocumentActionStatus 列挙型
- DocumentActionType 列挙型
- DocumentClassificationActionData クラス
- DocumentValidationActionData クラス
- UserData クラス
- Document クラス
- DocumentSplittingResult クラス
- DomExtensions クラス
- Page クラス
- PageSection クラス
- Polygon クラス
- PolygonConverter クラス
- Metadata クラス
- WordGroup クラス
- Word クラス
- ProcessingSource 列挙型
- ResultsTableCell クラス
- ResultsTableValue クラス
- ResultsTableColumnInfo クラス
- ResultsTable クラス
- Rotation 列挙型
- SectionType 列挙型
- WordGroupType 列挙型
- IDocumentTextProjection インターフェイス
- ClassificationResult クラス
- ExtractionResult クラス
- ResultsDocument クラス
- ResultsDocumentBounds クラス
- ResultsDataPoint クラス
- ResultsValue クラス
- ResultsContentReference クラス
- ResultsValueTokens クラス
- ResultsDerivedField クラス
- ResultsDataSource 列挙型
- ResultConstants クラス
- SimpleFieldValue クラス
- TableFieldValue クラス
- DocumentGroup クラス
- DocumentTaxonomy クラス
- DocumentType クラス
- Field クラス
- FieldType 列挙型
- LanguageInfo クラス
- MetadataEntry クラス
- TextType 列挙型
- TypeField クラス
- ITrackingActivity インターフェイス
- ITrainableActivity インターフェイス
- ITrainableClassifierActivity インターフェイス
- ITrainableExtractorActivity インターフェイス
- TrainableClassifierAsyncCodeActivity クラス
- TrainableClassifierCodeActivity クラス
- TrainableClassifierNativeActivity クラス
- TrainableExtractorAsyncCodeActivity クラス
- TrainableExtractorCodeActivity クラス
- TrainableExtractorNativeActivity クラス
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR ローカル サーバー
- Document Understanding
- IntelligentOCR
- リリース ノート
- IntelligentOCR アクティビティ パッケージについて
- プロジェクトの対応 OS
- 認証を構成する
- タクソノミーを読み込み
- ドキュメントをデジタル化
- ドキュメント分類スコープ
- キーワード ベースの分類器
- Document Understanding プロジェクト分類器
- インテリジェント キーワード分類器
- ドキュメント分類アクションを作成
- ドキュメント分類アクション完了まで待機し再開
- 分類器トレーニング スコープ
- キーワード ベースの分類器トレーナー
- インテリジェント キーワード分類器トレーナー
- データ抽出スコープ
- Document Understanding プロジェクト抽出器
- 正規表現ベースの抽出器
- フォーム抽出器
- インテリジェント フォーム抽出器
- 検証ステーションを提示
- ドキュメント検証アクションを作成
- ドキュメント検証アクション完了まで待機し再開
- 抽出器トレーニング スコープ
- 抽出結果をエクスポート
- ML サービス
- OCR
- OCR Contracts
- リリース ノート
- OCR コントラクトについて
- プロジェクトの対応 OS
- IOCRActivity インターフェイス
- OCRAsyncCodeActivity クラス
- OCRCodeActivity クラス
- OCRNativeActivity クラス
- Character クラス
- OCRResult クラス
- Word クラス
- FontStyles 列挙型
- OCRRotation 列挙型
- OCRCapabilities クラス
- OCRScrapeBase クラス
- OCRScrapeFactory クラス
- ScrapeControlBase クラス
- ScrapeEngineUsages 列挙型
- ScrapeEngineBase
- ScrapeEngineFactory クラス
- ScrapeEngineProvider クラス
- OmniPage
- PDF
- [リストから削除済] ABBYY
- [リストから削除済] ABBYY Embedded
Document Understanding アクティビティ
リリース ノート
公開日: 2024 年 10 月 3 日
IDocumentData<ExtractorType>
から IDocumentData<DictionaryData>
に変わります。[データ型を生成] を [False] に設定すると、フィールド値の取得と変更が簡素化され、検証ステーションでドキュメントの種類を変更できるようになります。
「ドキュメント データを抽出」および「ドキュメント データ」ページで、[データ型を生成] プロパティの使用方法と、抽出結果の確認方法を確認してください。
[分類の検証タスクを作成] アクティビティと [分類の検証タスクを作成して待機] アクティビティの [追加オプション] から、使用する Orchestrator のストレージ バケットを設定できるようになりました。特定のストレージ バケットが作成されていない場合は、既定のストレージ バケットを使用できます。
- Mac のロボットで Studio Web のワークフローを実行すると、「ファイルまたはアセンブリ 'UiPath.DocumentUnderstanding.Common.SDK' を読み込むことができませんでした。」という例外が発生して失敗していました。
- ドキュメント内の特定の数値や日付を手動で修正すると、Action Center のタスクを作成するアクティビティがクラッシュしていました。
- ワークフローの再開時に Studio Web で発生していたエラーを修正しました。以前は、このエラーが、Microsoft OneDrive から取得したファイルの Action Center での検証を伴う、ドキュメント分類の 1 回目の検証後に発生していました。
公開日: 2024 年 5 月 27 日
- プロンプトのサイズを質問あたり 500 文字から 1000 文字に増やし、指示を明確に入力できるようにしました。また、質問あたり 1000 文字のプロンプトのサイズ制限に達すると、「制限を超えました」というエラーが表示されます。
- [ドキュメント データを抽出] アクティビティのエラー メッセージを改良して分かりやすくし、デバッグを容易に行えるようにしました。
公開日: 2024 年 4 月 29 日
このリリース ノートには、2023 年 11 月から 2024 年 3 月の間に行われたすべての更新内容が記載されています。
UiPath.DocumentUnderstanding.Activities package.
[ドキュメント データを抽出] の抽出結果の信頼度の向上
[ドキュメント データを抽出] アクティビティを改良し、スコアの精度を向上させ、検証時間を短縮しました。これにより、[自動検証] プロパティと [信頼度のしきい値] プロパティが強化され、特定のモデルからの抽出結果を生成モデルに対して相互検証できるようになりました。
抽出結果の信頼度レベルを向上させる方法について詳しくは、「ドキュメント データを抽出」をご覧ください。
分類の検証タスク
以下のアクティビティが利用可能になりました。
- 分類の検証タスクを作成: Action Center で検証タスクを作成できます。
- 分類の検証タスクを作成して待機: Action Center で検証タスクを作成し、タスクが完了するまでワークフローを一時停止できます。
- 分類の検証タスク完了まで待機し再開: 指定されたドキュメント検証アクションが完了するまで、現在のワークフローの実行を一時停止できます。
- [検証タスクを作成して待機] アクティビティと [検証タスクを作成] アクティビティの [追加オプション] から、使用する Orchestrator のストレージ バケットを設定できるようになりました。特定のストレージ バケットが作成されていない場合は、既定のストレージ バケットを使用できます。
- [ドキュメント データを抽出] アクティビティと [ドキュメントを分類] アクティビティで、オプションの [タイムアウト] プロパティが利用可能になりました。このパラメーターを使用して、アクティビティのタイムアウトを設定します。
- [ドキュメント データを抽出] アクティビティで選択した抽出器が、ドキュメントの種類を上書きするようになりました。生成 AI モデルには適用されません。
- 複数値フィールドの場合、すべての値が [ドキュメント データを抽出] アクティビティの Document Data で返されます。値は
DocumentData.Data.FieldName.MultiValues[]
で使用できます。 - 今回のリリースでは、Document Data オブジェクトに以下の更新を加えました。
- [ドキュメントの種類] 属性の [名前] プロパティが次のように置き換わります。
- カスタム モデルの場合は [表示名]
- すぐに使えるモデルの場合は ID
- Document Understanding フレームワークの結果から設定される 2 つの新しいプロパティが追加されました。
- ID
- 表示名
- [ドキュメントの種類] 属性の [名前] プロパティが次のように置き換わります。
現在プレビューの段階である Document Understanding の既存の Insights ダッシュボードに、クロスプラットフォームの DocumentUnderstanding.Activities パッケージのデータが表示されなくなりました。現在は IntelligentOCR.Activities ワークフローのデータのみがレポートされます。
クロスプラットフォームの DocumentUnderstanding.Activities のデータは、新しい別個の Insights ダッシュボードでレポートされるようになりました。
- [分類の検証タスクを作成] アクティビティの [分類結果] 出力プロパティの名称が [ドキュメント データ] に変更されました。
注意:現在のワークフロー内に
CreatedClassificationValidationTask.ClassificationResults
プロパティがある場合、アップグレード後はこのプロパティは利用できなくなります。 - [検証タスクを作成] アクティビティの出力プロパティ [抽出結果] の名称が [ドキュメント データ] に変更されました。
注意:ワークフローで
CreatedDocumentValidationTask.ExtractionResults
プロパティが使用されている場合、アップグレード後はこのプロパティは利用できなくなります。 - [検証タスク完了まで待機し再開] アクティビティで
3.1342,7
という形式の数値が認識されず、「入力データの形式が正しくありませんでした」というエラーが発生する問題を修正しました。すべての数値の形式が完全にサポートされるようになりました。
公開日: 2023 年 11 月 1 日
- [ドキュメントを分類] アクティビティ
- [ドキュメント データを抽出] アクティビティ
公開日: 2023 年 5 月 5 日
パッケージの最も新しい追加機能は [PDF のテキストを抽出] アクティビティです。指定した PDF ファイルからすべての文字を抽出して String 型変数に格納できます。[OCR を適用] オプションが有効化されている場合は、OCR を使用して情報が抽出され、無効化するとネイティブ コンテンツが抽出されます。
2 つのアクティビティの名前が更新され、1 つのアクティビティのフィールドが更新されました。
- [ドキュメント検証タスクを作成] は [検証タスクを作成] になりました。
- [ドキュメント検証タスク完了まで待機し再開] は [検証タスク完了まで待機し再開] になりました。
- [PDF のパスワードを設定] に、次のような、より詳細なフィールド名が表示されるようになりました。
- 新しい管理パスワード
- 新しい文書を開くパスワード
- 現在の管理パスワード
- 現在の文書を開くパスワード
- v2.12.1
- バグ修正
- v2.4.5
- バグ修正
- v2.9.6
- バグ修正
- v2.12.0
- 更新内容
- ドキュメント データの生成のオンデマンドでの無効化による高度な実装の柔軟性向上
- 改良点
- バグ修正
- v2.2.6
- v2.9.5
- バグ修正
- v2.9.4
- バグ修正
- v2.9.3
- バグ修正
- v2.4.3
- v2.9.2
- v2.9.1
- 改良点
- バグ修正
- v2.9.0
- 新着情報
- 改良点
- 既知の制限事項
- バグ修正
- v2.4.2
- バグ修正
- v2.4.1
- 生成 AI 機能の一般提供 (GA) 開始
- 新機能と改良点
- v2.4.0
- Document Understanding アクティビティの一般提供 (GA) 開始
- v2.2.4
- 新機能と改良点
- v2.2.3
- バグ修正
- v2.2.2
- バグ修正
- 既知の問題
- v2.2.1
- 新機能と改良点