- 概要
- Document Processing Contracts
- リリース ノート
- Document Processing Contracts について
- Box クラス
- IPersistedActivity インターフェイス
- PrettyBoxConverter クラス
- IClassifierActivity インターフェイス
- IClassifierCapabilitiesProvider インターフェイス
- ClassifierDocumentType クラス
- ClassifierResult クラス
- ClassifierCodeActivity クラス
- ClassifierNativeActivity クラス
- ClassifierAsyncCodeActivity クラス
- ClassifierDocumentTypeCapability クラス
- ExtractorAsyncCodeActivity クラス
- ExtractorCodeActivity クラス
- ExtractorDocumentType クラス
- ExtractorDocumentTypeCapabilities クラス
- ExtractorFieldCapability クラス
- ExtractorNativeActivity クラス
- ExtractorResult クラス
- ICapabilitiesProvider インターフェイス
- IExtractorActivity インターフェイス
- ExtractorPayload クラス
- DocumentActionPriority 列挙型
- DocumentActionData クラス
- DocumentActionStatus 列挙型
- DocumentActionType 列挙型
- DocumentClassificationActionData クラス
- DocumentValidationActionData クラス
- UserData クラス
- Document クラス
- DocumentSplittingResult クラス
- DomExtensions クラス
- Page クラス
- PageSection クラス
- Polygon クラス
- PolygonConverter クラス
- Metadata クラス
- WordGroup クラス
- Word クラス
- ProcessingSource 列挙型
- ResultsTableCell クラス
- ResultsTableValue クラス
- ResultsTableColumnInfo クラス
- ResultsTable クラス
- Rotation 列挙型
- SectionType 列挙型
- WordGroupType 列挙型
- IDocumentTextProjection インターフェイス
- ClassificationResult クラス
- ExtractionResult クラス
- ResultsDocument クラス
- ResultsDocumentBounds クラス
- ResultsDataPoint クラス
- ResultsValue クラス
- ResultsContentReference クラス
- ResultsValueTokens クラス
- ResultsDerivedField クラス
- ResultsDataSource 列挙型
- ResultConstants クラス
- SimpleFieldValue クラス
- TableFieldValue クラス
- DocumentGroup クラス
- DocumentTaxonomy クラス
- DocumentType クラス
- Field クラス
- FieldType 列挙型
- LanguageInfo クラス
- MetadataEntry クラス
- TextType 列挙型
- TypeField クラス
- ITrackingActivity インターフェイス
- ITrainableActivity インターフェイス
- ITrainableClassifierActivity インターフェイス
- ITrainableExtractorActivity インターフェイス
- TrainableClassifierAsyncCodeActivity クラス
- TrainableClassifierCodeActivity クラス
- TrainableClassifierNativeActivity クラス
- TrainableExtractorAsyncCodeActivity クラス
- TrainableExtractorCodeActivity クラス
- TrainableExtractorNativeActivity クラス
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR ローカル サーバー
- Document Understanding
- IntelligentOCR
- リリース ノート
- IntelligentOCR アクティビティ パッケージについて
- プロジェクトの対応 OS
- 認証を構成する
- タクソノミーを読み込み
- ドキュメントをデジタル化
- ドキュメント分類スコープ
- キーワード ベースの分類器
- Document Understanding プロジェクト分類器
- インテリジェント キーワード分類器
- ドキュメント分類アクションを作成
- ドキュメント分類アクション完了まで待機し再開
- 分類器トレーニング スコープ
- キーワード ベースの分類器トレーナー
- インテリジェント キーワード分類器トレーナー
- データ抽出スコープ
- Document Understanding プロジェクト抽出器
- 正規表現ベースの抽出器
- フォーム抽出器
- インテリジェント フォーム抽出器
- 検証ステーションを提示
- ドキュメント検証アクションを作成
- ドキュメント検証アクション完了まで待機し再開
- 抽出器トレーニング スコープ
- 抽出結果をエクスポート
- ML サービス
- OCR
- OCR Contracts
- リリース ノート
- OCR コントラクトについて
- プロジェクトの対応 OS
- IOCRActivity インターフェイス
- OCRAsyncCodeActivity クラス
- OCRCodeActivity クラス
- OCRNativeActivity クラス
- Character クラス
- OCRResult クラス
- Word クラス
- FontStyles 列挙型
- OCRRotation 列挙型
- OCRCapabilities クラス
- OCRScrapeBase クラス
- OCRScrapeFactory クラス
- ScrapeControlBase クラス
- ScrapeEngineUsages 列挙型
- ScrapeEngineBase
- ScrapeEngineFactory クラス
- ScrapeEngineProvider クラス
- OmniPage
- PDF
- [リストから削除済] ABBYY
- [リストから削除済] ABBYY Embedded
リリース ノート
Release date: October 3, 2024
You can now use the following activities within the Classify Document Scope and Data Extraction Scope, even if the robot is connected to a local Orchestrator:
For the Data Extraction Scope activity, specifically, we have made it possible to use auto-validation features from a different organization or tenant.
We've added the RuntimeTenantURL and RuntimeCredentialsAsset properties to the previous activities. With these properties, you can now directly use credentials from external applications, stored in Orchestrator, to access Document Understanding resources at runtime. To achieve this, ensure that your selected tenant has Document Understanding enabled and AI Units allocated.
Also, in the Get Capabilities wizard of Document Understanding Project Classifier and Document Understanding Project Extractor activities, we've included properties like App Id, App Secret, and TenantUrl. These properties facilitate accessing resources from different organizations and tenants during the design phase.
モダン プロジェクトでの使用を対象とした一連のアクティビティが新たに導入され、IntelligentOCR.Activities を Document Understanding のモダン プロジェクトで使用できるようになりました。Document Understanding のモダン プロジェクトとバージョンを使用して、以下のアクティビティを使用できるようになりました。
- Document Understanding Project Classifier, used within a Classify Document Scope activity.
- Document Understanding Project Extractor within a Data Extraction Scope activity.
Enhance the capability of your projects to process documents by using the UiPath Extended Languages OCR which is now generally available (GA).
- Resolved an issue where the "Text length is zero" error was encountered when both Keyboard - Based Classifier and Intelligent Keyboard Classifier were enabled for the same document type.
- マシン ラーニング抽出器が空の値を返すために、null 値のプロパティによって検証タスクが失敗していました。
- Manually added field values in the Validation Station within Action Center weren't formatted according to the taxonomy, causing exported results to show incorrect data.
- Resolved the issue which prevented you from marking tables within image files in the Validation Station.
The UiPath Chinese, Japanese, Korean OCR will be deprecated starting with January 2025. We recommend using the UiPath Extended Languages OCR instead. Check the deprecation timeline for more information about upcoming deprecations and removals.
公開日: 2024 年 6 月 20 日
UiPath では、UiPath Document Understanding のユーザー エクスペリエンスを向上させるために継続的な改善を行っています。今回のリリースでは大幅な変更はありませんが、マイナーな改良とアクセシビリティの修正を行いました。
公開日: 2024 年 4 月 29 日
このリリース ノートには、2023 年 11 月から 2024 年 3 月の間に行われたすべての更新内容が記載されています。
検証者のコメント
タクソノミー マネージャーで、各フィールドの検証者のコメントを有効化できます。有効化すると、これらのフィールドにメモを設定して人間の検証者に表示できます。メモが編集可能として設定されている場合、検証者はメモを編集し、ExtractionResult オブジェクトのプロパティを通じて、情報をオートメーションに伝えることができます。
[データ抽出スコープ] の生成 AI による検証
[データ抽出スコープ] アクティビティの生成 AI による検証機能を使用すると、生成 AI による抽出のクロスチェックを使用して、信頼度を調整できます。[データ抽出スコープ] アクティビティの [自動検証を適用] プロパティおよび [自動検証の信頼度のしきい値] プロパティをご覧ください。
- UiPath.IntelligentOCR.Activities パッケージをインストールすると、UiPath.DocumentUnderstanding.ML.Activities パッケージも自動的にインストールされるようになり、個別にインストールする必要がなくなりました。
- JPG への変換時に日本語フォントが認識されない問題を修正しました。
- 検証ステーションでヘブライ語の数字の順序が逆になる問題を修正しました。
- 双方向 (左から右および右から左) のテキスト値の抽出で、句読点の順序が間違っている問題を修正しました。
Windows プロジェクトにおいて Studio v2023.4.4 内で Document Understanding Process テンプレート バージョン 2022.10.2 を使用する場合、既知の問題が存在します。タクソノミー マネージャーを開くと、.NET Framework が見つからないためインストールする必要があることを示すエラーが表示されます。.NET をインストールするかどうかにかかわらず、続いて「UiPath Studio とタクソノミー マネージャー間の通信が予期せず終了しました」という別のエラー メッセージが表示されます。
回避策: .NET 6.0 ランタイムを手動でインストールします。
公開日: 2023 年 10 月 24 日
- 検証ステーションを提示
- ドキュメント検証アクションを作成
- フォーム抽出器
- インテリジェント キーワード分類器
[ドキュメントをデジタル化] アクティビティでネイティブの PDF のラジオ ボタンを検出できるようになりました。
[ドキュメントをデジタル化] アクティビティの、コンテンツの種類の検出機能を改良しました。
タクソノミー マネージャーで、ビジネス ルール内に複数の数式を定義できるようになりました。
公開日: 2023 年 9 月 19 日
Action Center でドキュメントの検証が完了した後にジョブを再開すると、「権限がありません。」というエラーが発生する問題を修正しました。
公開日: 2023 年 6 月 7 日
[フォーム抽出器] アクティビティを使用する際の新しいオプションとして [アルゴリズムの改善のためにドキュメントを送信] を追加し、ワークフローを実行する前にこのオプションを有効化または無効化できるようにしました。このオプションは、既定では有効化されています。
UiPath.IntelligentOCR.Activities パッケージ全体で、軽微なバグ修正とアクセシビリティに関する修正を行いました。
公開日: 2023 年 9 月 19 日
Action Center でドキュメントの検証が完了した後にジョブを再開すると、「権限がありません。」というエラーが発生する問題を修正しました。
公開日: 2023 年 6 月 7 日
UiPath では、UiPath Document Understanding のユーザー エクスペリエンスを向上させるために継続的な改善を行っています。今回のリリースでは大幅な変更はありませんが、マイナーな改良とアクセシビリティの修正を行いました。
公開日: 2023 年 4 月 26 日
- [インテリジェント キーワード分類器]、[インテリジェント キーワード分類器トレーナー]、[フォーム抽出器] アクティビティで、UiPath Document OCR が新しく既定の OCR エンジンになりました。
- [ドキュメント検証アクションを待機] アクティビティと [ドキュメント分類アクション完了まで待機し再開] アクティビティにリトライ機能を追加しました。新しい [リトライ] オプションを使用して [有効]/[無効] に設定できます。既定値は [有効] です。有効化した場合、エラー発生時に HTTP 呼び出しがリトライされます。
- UiPath.IntelligentOCR.Activities パッケージが右から左方向の言語で使用できるようになりました。
- ページの一致情報を抽出アルゴリズムに組み込むことにより、[フォーム抽出器] アクティビティの抽出精度が向上しました。
- タクソノミー マネージャーで設定できるフィールド ルールのデザインを更新しました。
- [タクソノミーを読み込み] アクティビティのタクソノミー マネージャー ウィザードを使用して、フィールド ルールに数式を適用できるようになりました。
- 検証ステーション ウィザードが更新され、フィールドに適用されているルールを確認できるようになりました。また、フィールドを手動で更新すると、フィールド ルールも自動的に更新されます。
- [ドキュメントをデジタル化] アクティビティを改良し、システム メモリの消費量を削減しました。
- スタンプ ウィジェットがネイティブ PDF でデジタル化されるようになりました。
- [ドキュメントをデジタル化] アクティビティで PDF ファイルがサポートされるようになりました。
追記 (2023 年 9 月): [インテリジェント キーワード分類器] アクティビティでは、高度な機能として分割を使用できます。
- パッケージの依存関係を更新し、[コードを呼び出し] アクティビティがワークフローに追加されたときにスローされる「メソッドが見つかりません。」というエラーを修正しました。
- 使用する Orchestrator インスタンスの認証トークンの有効期限が切れると、API キーが自動で設定されなくなる問題を修正しました。このエラーは、[UiPath Document OCR] アクティビティと [OCR - 中国語、日本語、韓国語] アクティビティの [API キー] フィールドで発生していました。
非推奨化および削除される機能に関する最新情報については、非推奨化のタイムラインを定期的に確認することをお勧めします。
公開日: 2022 年 12 月 15 日
- [UiPath Document OCR] アクティビティ、[OCR - Japanese, Chinese, Korean] アクティビティ、[マシン ラーニング抽出器] アクティビティ、[マシン ラーニング分類器] アクティビティ、および [フォーム抽出器] アクティビティのテンプレート マネージャーの Document Understanding の API キーがあらかじめ設定されるようになりました。
- Studio のユーザー インターフェイスが繁体字中国語で利用できるようになりました。
- UiPath.IntelligentOCR.Activities パッケージに含まれている [インテリジェント キーワード分類器] アクティビティと [フォーム抽出器] アクティビティの [API キー] フィールドがあらかじめ設定されるようになりました。
- [キーボード ショートカット] メニューにアクセシビリティ セクションを設け、新しいホットキーを追加しました。これらのホットキーは、[検証ステーションを提示] アクティビティと [分類ステーションを提示] アクティビティで使用できます。
公開日: 2022 年 10 月 24 日
- [ドキュメント分類アクション完了まで待機し再開] アクティビティと [ドキュメント検証アクション完了まで待機し再開] アクティビティに新しいアクション オブジェクトを追加しました。
- [ドキュメントをデジタル化] アクティビティを改良し、既定の OCR エンジンとして UiPath Document OCR エンジンがあらかじめ選択されているようにしました。この変更の結果、UiPath.OCR.Activities パッケージが UiPath.IntelligentOCR.Activities パッケージの依存関係になりました。
- [ドキュメントをデジタル化] アクティビティに新しいパラメーター
Detect Checkboxes
を追加しました。このパラメーターを使用すると、ドキュメントをデジタル化するときにチェックボックスを検出できます。 - 検証ステーションで選択したフィールドの OCR の信頼度レベルを個別に更新できるようになりました。
- 信頼度フィルターのデザインを更新しました。また、OCR と抽出の両方の信頼度スコアが表の各エントリ レベルでも表示されるようにしました。さらに、手動で検証したフィールドの変更前の信頼度レベルを確認できるようになりました。表示されている信頼度レベルをクリックすれば、変更前後の両方の値を確認できます。
- 検証ステーション ウィザードを更新し、信頼度レベルのしきい値を設定したり、設定した制限値に応じて信頼度スコアを並べ替えられるようにしました。
- タクソノミー マネージャー ウィザードのインターフェイスを更新し、さらに使いやすくしました。新機能として、すべてのグループ、フィールド、カテゴリの削除オプションやキーボード ショートカットを有効化するオプションなどを追加しました。
- ネイティブ チェックボックス記号またはコントロールが埋め込まれていないネイティブ PDF のページでも、チェックボックスの検出が行われるようになりました。
- PDF 処理機能を大幅に改良しました。この改善には、ベクターベースのテキスト処理機能、非表示のテキスト オブジェクトを無視する機能、単語検出機能とロゴ処理の改良、文字の重複問題の修正などが含まれています。
- PDF ファイルからのテキスト抽出機能がアップグレードされ、抽出プロセスが最適化されました。PDF ファイル内の認識された画像にのみ OCR が適用され、ネイティブ テキストとスキャンされたテキストの両方が同時に取得されます。この改良は、[PDF に OCR を適用] オプションが [自動] に設定されている場合にのみ利用可能です。
- Studio のテンプレート「Document Understanding Process」を新しいバージョンにアップグレードしました。UiPath.IntelligentOCR.Activities パッケージは、このテンプレートの依存関係です。
- ドキュメントをデジタル化する際に抽出エラーが発生していました。PDF ライブラリをアップグレードしてハイブリッド OCR 機能を追加することにより、この問題を修正しました。
- [ドキュメントをデジタル化] アクティビティで [チェックボックスを検出] オプションが False に設定されていても、一部の PDF ファイルでチェックボックスが抽出される問題を修正しました。
- [ドキュメント分類スコープ] アクティビティで分類器を 2 つ使用して特定のドキュメントを処理すると、[ドキュメント テキスト] パラメーターが空であることを示すエラーが発生する問題を修正しました。
- 検証ステーションのフィールドを手動で検証すると、信頼度レベルが 100% に更新されない問題を修正しました。現在は、ユーザーが手動でフィールドを検証すると信頼度レベルの値が自動的に更新されるようになりました。
- 分類ステーション ウィザードおよびタクソノミー マネージャーでマウス カーソルをドキュメント ビュー セクションに移動すると、カーソルが表示されませんでした。現在は、期待どおりに動作するようになりました。
- 特殊文字を含むドキュメントを検証ステーションのテキスト ビューに表示すると、エラーが発生していました。この問題を修正し、特殊文字を含むドキュメントもテキスト ビューに表示できるようになりました。
公開日: 2022 年 5 月 9 日
- 検証ステーション、分類ステーション、タクソノミー マネージャー ウィザードのインターフェイスに大幅な改良を加え、各種の新機能が表示される、ユーザー フレンドリーなインターフェイスに更新しました。
- 検証ステーションには抽出された各フィールドの信頼度スコアが表示される機能を追加しました。フィールドごとに表示される信頼度スコアは OCR または抽出器で切り替えることができます。このスコアは参考情報として扱われるべきであり、データを手動で検証すればいつでも改善できます。
- また、検証ステーション ウィザードの PDF ビューアーのヘッダーを改良し、ドキュメントの表示場所を画面の右側から左側に切り替えたり、抽出されたトークンを非表示にしてドキュメントを見やすくしたり、キーボード ショートカットを表示したりできるようにしました。
- 分類ステーション ウィザードの PDF ビューアーのヘッダーも検証ステーション同様に改良しました。ここでも、ドキュメントの表示場所を画面の右側から左側に切り替えたり、利用可能なキーボード ショートカットを確認したりできます。また、新しいヘッダーでは回転オプションが使用できるようになったため、ドキュメントの操作がさらに簡単に行えます。
- タクソノミー マネージャー ウィザードにはドキュメントの種類のヘッダーに削除オプションを追加し、一括削除もできるようにしました。
- UiPath.IntelligentOCR.Activities パッケージを .NET5 のポータブル フレームワークにアップグレードしました。これにより、Linux ロボットで実行できるようになりました。
- UiPath Studio の MSI インストーラーのサイズを最適化しました。これにより、UiPath.IntelligentOCR.Activities パッケージは UiPath Studio の MSI インストーラーのコア パッケージに含まれなくなり、任意のパッケージとなりました。なお、機能に関する変更はありません。これまでと違うのは、パッケージを UiPath Studio で手動でインストールする必要があるという点のみです。
- [ドキュメントをデジタル化] アクティビティと [インテリジェント キーワード分類器] アクティビティを更新し、[OCR を強制適用] オプションを [PDF に OCR を適用] オプションに変更しました。[PDF に OCR を適用] オプションのドロップダウン リストには [True]、[False]、[Auto] の 3 つのオプションが表示されます。このオプションを [True] に設定するとドキュメント内のすべての PDF ページに OCR が適用されます。[False] に設定すると、デジタル入力のテキストのみが抽出されます。既定値は [Auto] で、入力ドキュメントに応じてドキュメントに OCR アルゴリズムを適用する必要があるかを判断します。
- 分類ステーション ウィザードで [未分類] グループに含まれる値が [該当なし] に設定されるようになりました。
- [インテリジェント フォーム抽出器] アクティビティは 2022 年 10 月以降は非推奨になる予定ですので、[フォーム抽出器] アクティビティの使用をお勧めします。
- [フォーム抽出器] アクティビティで署名が検出されたドキュメントを処理できるようになりました。
- 検証ステーション ウィザードの PDF ビューアーで特定のアジア言語のフォントが正しく表示されない問題を修正しました。
- v19.10 および v20.10 の UiPath Studio で、[ドキュメントをデジタル化] アクティビティを使用して
.tiff
ファイルを処理しようとするとエラーが発生する問題を修正しました。現在は、期待どおりに動作するようになりました。 - 検証ステーションでフィールドの値を編集した後に Tab キーを押すと、変更が保存されるのではなく過去の値に戻る問題を修正しました。現在は期待どおりに動作するようになりました。
- [フォーム抽出器] アクティビティでテンプレートをインポートすると、誤ったエラー メッセージが表示される問題を修正しました。
公開日: 2021 年 10 月 19 日
- タクソノミー マネージャーを大幅に改良し、UI とユーザー エクスペリエンスを向上させました。これにより、グループまたはカテゴリを設定せずにドキュメントの種類の追加、フィールドの色やホットキーの設定などの操作を行える新しい機能を利用できるようになりました。詳しい内容については、ドキュメントをご確認ください。
- UiPath.IntelligentOCR.Activities パッケージを .NET5 にアップグレードしました。引き続き、新旧両方の .NET バージョンがサポートされますが、.NET5 のプロジェクトは 64 ビット アーキテクチャでしか動作しません。
- Document Understanding および Data Manager に関わるフレームワーク全体におけるデジタル化のプロセスを改善しました。
- スキャンされたドキュメントに対する OCR の結果を最適化する改良を行いました。傾斜角度を +/- 20 度に保つことで最適な結果が得られます。
- 画像処理の寸法を改良し、より良い結果が得られるようにしました。画像を正常にデジタル化/処理するには、幅と高さをそれぞれ 50 から 10000 ピクセルにする必要があります。この範囲を下回る、または上回る画像は、例外メッセージが表示されて却下されます。上述の寸法で検証された、合計サイズが 14 メガピクセルを超える画像は、縦横比 (幅/高さの比率) を維持しながら 14 メガピクセルに縮小されます。
- 検証ステーションのエラー メッセージ システムを改良し、ユーザーがドキュメントを却下すると
DocumentRejectedByUserException
という種類の例外がスローされて、プロセスが停止するようにしました。 - タクソノミーが大きいドキュメントの種類における検証ステーションの読み込み時間を改善しました。
- 検証ステーションで派生部分の値が小数点以下 2 桁を超える場合に、数字が切り上げられなくなりました。
- 画像処理アルゴリズムの改良により、特定のドキュメントのデジタル化に変更が発生する場合があります。
- テンプレート マネージャー ウィザードに新しいチェックボックスを追加し、追加した類義語の大文字と小文字を区別するかどうかを選択できるようにしました。
- [インテリジェント フォーム抽出器] アクティビティと [フォーム抽出器] アクティビティからアクセスできる [テンプレート マネージャー] ウィザードのデザインを更新しました。
- [フォーム抽出器] アクティビティと [インテリジェント フォーム抽出器] アクティビティに新しく[タイムアウト] パラメーターを追加しました。これにより、これらのアクティビティで処理時間が長いためにタイムアウトが発生している場合は、サービス呼び出しのタイムアウト値を増やすことができます。
- [インテリジェント フォーム抽出器] アクティビティの [テンプレート マネージャー] ウィザードで、1 つのフィールドを [署名] と[手書き] フィールドの両方のボックスに追加すると、1 つのフィールドは 1 つのボックスにしか追加できないことを示すポップアップ メッセージが表示されるようになりました。
- [インテリジェント キーワード分類器] アクティビティのウィザードを改良し、単語ベクトルがエクスポートされたことを通知するメッセージ ボックス内の [OK] ボタンをクリックすると、ウィザードを閉じるのではなくウィザードのメイン画面に戻るようにしました。
- [ドキュメント検証アクションを作成] アクティビティと [検証ステーションを提示] アクティビティに [関連するページ範囲のみ表示] プロパティを追加しました。このプロパティをオンにすると、抽出結果の分類セクションでキャプチャされたページ範囲内のページのみが表示されます。
- [ドキュメントをデジタル化] アクティビティのパフォーマンスとメモリが向上しました。
- CefSharp の参照をバージョン 92.0.260 に更新しました。
- 地域設定が異なる OS で OCR を実行すると発生していたバグを修正しました。現在は、OS の地域設定に関係なく OCR が期待どおりに実行され、すべての結果が正しく生成されるようになりました。
- [抽出結果をエクスポート] アクティビティでフィールドが手書きとマークされていると、抽出された表が削除される問題を修正しました。現在は、抽出結果がすべて期待どおりにエクスポートされます。
- 検証ステーションで派生部分の値を読み取る際に、数値が予期しない書式に設定される問題を修正しました。
- [ドキュメント検証アクション完了まで待機し再開] アクティビティで、[自動抽出結果] プロパティが空に設定されているとエラーが返される問題を修正しました。現在は、エラーが発生することなく期待どおりに動作するようになりました。
- [検証ステーションを提示] アクティビティに抽出結果が提供されないと、実行時エラーが発生する問題を修正しました。
- [ドキュメントをデジタル化] アクティビティの [OCR を強制適用] プロパティが [False] に設定されていると、アクティビティがクラッシュする問題を修正しました。
- [フォーム抽出器] アクティビティのテンプレートで抽出対象の表データを選択すると、[テンプレート マネージャー] ウィザードにすべてのデータが抽出されない問題を修正しました。
- 特定のドキュメントを処理する際に、日付フィールドの派生部分が抽出されない問題を修正しました。
- テンプレート マネージャー ウィザードで表をマークしても、アンカーが強調表示されない問題を修正しました。
- [データ抽出スコープ] アクティビティ内の抽出器を削除したにもかかわらず、その抽出器の設定フィールドがタクソノミーに見つからなかったことを示すエラーが表示される問題を修正しました。
- テンプレート マネージャー ウィザードで、ページの証拠として特定の単語を追加したテンプレートを保存しようとするとエラーが発生する問題を修正しました。
- [自動抽出結果] プロパティが null の場合に、データ エントリの処理を完全に手動で行うための空の 検証ステーションが表示されない問題を修正しました。
- [ドキュメント分類アクションを作成]、[ドキュメント分類アクション完了まで待機し再開]、[ドキュメント検証アクションを作成]、[ドキュメント検証アクション完了まで待機] アクティビティで、ファイルまたはバケット名に特殊文字が含まれていると発生する問題を修正しました。現在は、ファイル/バケット名の特殊文字はすべて、期待どおりにエンコードされるようになりました。
- 背景のコントラストが原因で、署名および手書きフィールドが抽出されない問題を修正しました。現在は、背景色に関係なく、すべてのフィールドが正しく抽出されるようになりました。
- 特定のエアギャップ環境のシステムで OCR エンジンがエラーを返す問題を修正しました。
- [ドキュメントをデジタル化] アクティビティで UiPath Document OCR エンジンを使用すると、抽出されたコンテンツが結合される問題を修正しました。現在は、各項目が個別に抽出されるようになりました。
- このパッケージの OCR アクティビティを v2019.10 の Studio で使用する場合は、UiPath.CoreIPC パッケージのバージョン 2.0.1 以降をインストールしてください。
- オペレーティング システムに Windows N/KN エディションを使用しているマシンに UiPath.IntelligentOCR.Activities パッケージ v5.0.0 をインストールする場合は、メディア機能パッケージもインストールする必要があります。メディア機能パッケージのインストール手順については、「Windows N エディションの Media Feature Pack の一覧」をご覧ください。
公開日: 2021 年 3 月 29 日
- フィールド レベルのアンカー ベース抽出ルールを追加し、[フォーム抽出器] アクティビティと [インテリジェント フォーム抽出器] アクティビティの機能を拡張しました。データの抽出を行うカスタム領域の境界を定義するための新しいオプションとして、フィールド レベルのアンカーを追加し、テンプレート エディターでフィールド レベルのアンカーに加えて定義できるようにしました。ページ全体の内容に対するデータの位置を定義するページ レベルの設定とは対照的に、アンカー ベースの設定では、フィールド レベルのアンカーを基にデータ抽出の対象を設定できるようにしました。これにより、より柔軟な設定が行えるようになりました。
- 検証ステーションのパフォーマンスを向上させました。
- ユーザー エクスペリエンスの向上のために、[検証ステーション] と [分類ステーション] のデザイン システムを更新しました。
- 検証ステーション、分類ステーション、テンプレート マネージャーのドキュメント ビュー側に、3 種のステート ボタンを追加しました。このボタンから、それぞれ異なるドキュメント操作モードを以下の選択しから選択できます。 [トークン] (単語の選択)、[カスタム領域] (領域の選択)、[選択モードで選択] (各選択操作ごとに [トークン] と [カスタム領域] のいずれかを選択可能)
- 検証ステーション、分類ステーション、テンプレート マネージャーのユーザー インターフェイスを改善し、テキスト ビューにも選択モードを追加しました。これにより、ドキュメントのテキスト バージョンでも、ドキュメントの元のバージョンと同じように選択を実行できるようにしました。また、元のドキュメントのビュー モードとテキスト ビュー モード間の切り替えを容易にするために、ホットキー D+Sを新しく追加しました。
- 検証ステーションで、データ フィールドに値を割り当てると、選択した報告テキスト値の下に元のドキュメントからトリミングされた画像が表示されるようにしました。この機能は、ドキュメント内の値の領域に対する特定のフィールド値の特定と検証に役立ちます。
- [インテリジェント キーワード分類器] アクティビティの算出される信頼度が単語ベクトルの長さに応じて変化するように変更しました。
- [抽出結果をエクスポート] アクティビティの [プロパティ] パネルに [OCR の信頼度を含む] チェックボックスを追加しました。オンにすると、エクスポートされた情報に、各値の OCR 信頼度も含まれます。
- 特定の状況下で、文字または単語が重複して出力されるのを回避するために、文字および単語の処理アルゴリズムを改良しました。
- [ドキュメント分類スコープ] アクティビティと [分類器トレーニング スコープ] アクティビティが分類器機能をサポートするようになりました。
- [ドキュメント分類スコープ] アクティビティを最適化し、スコープ内の分類器に対する順次呼び出しが、前の抽出器によって分類されなかったページ範囲に対してのみ実行されるようになりました。
- [フォーム抽出器] アクティビティと [インテリジェント フォーム抽出器] アクティビティが同じ [データ抽出スコープ] アクティビティ内にある場合に、特定のケースでランタイム エラーが発生していた問題を修正しました。
- 特定のケースにおいて、分類器が例外をスローせず、一切通知が送られることなく分類が失敗する問題を修正しました。
- 特定のドキュメントを処理する際に、数字フィールドの派生部分が抽出されない問題を修正しました。
- [ドキュメントをデジタル化] アクティビティで、例外が報告された後でもドキュメントのページが処理され続け、エラーが発生した際の全体的な実行時間が長くなっていた問題を修正しました。
- C# を使用したオートメーション プロジェクトや、その他の特定の状況下で [正規表現ベースの抽出器] アクティビティを使用すると、正規表現を正しく設定できない問題を修正しました。
- 1 種類のドキュメントに 200 を超えるフィールドが含まれる場合に 検証ステーションとテンプレート エディターで発生していた、パフォーマンスに関する問題を修正しました。
- 特定の状況下で、近接する複数の数値がマージされ単一の数字として報告されていた問題を修正しました。
- 特定の状況下で、[ドキュメント検証アクション完了まで待機し再開] アクティビティが、ストレージ バケットとの通信中に例外をスローする問題を修正しました。
公開日: 2020 年 11 月 12 日
- CefSharp の参照をバージョン 84.4.10 に更新しました。
- エンドポイントを以下のように更新しました。
- フォーム抽出器 -
https://formextractor.uipath.com
からhttps://du.uipath.com/svc/formextractor
に更新 - インテリジェント フォーム抽出器 -
https://intelligentforms.uipath.com
からhttps://du.uipath.com/svc/intelligentforms
に更新 - インテリジェント キーワード分類器 -
https://intelligentkeywords.uipath.com
からhttps://du.uipath.com/svc/intelligentkeywords
に更新
- フォーム抽出器 -
- 表をマークするモードの検証ステーションに改良を加えました。
公開日: 2020 年 10 月 5 日
新しいアクティビティ
以下のアクティビティがパッケージに含まれました。
- 分類ステーションを提示 - ドキュメントの種類に基づきファイルを分類して分けるために設計されたアクティビティです。
- ドキュメント分類アクションを作成 & ドキュメント分類アクション完了まで待機し再開 - Orchestrator との連携用に設計されたアクティビティです。
- インテリジェント キーワード分類器 & インテリジェント キーワード分類器トレーナー - ドキュメント パッケージを個別のドキュメントの種類に分類し分割するために設計されたアクティビティと、変数として追加されたラーニング データをトレーニングするために設計されたアクティビティです。
検証ステーション
検証ステーション内の情報を簡単に識別するために、フィールド カードならびにトークンとカスタム領域にカラー コードが追加されました。各フィールド カードには既定でカラー コードが付与されており、トークンまたはカスタム領域はそれぞれが割り当てられたフィールド カードと同じカラー コードを取得します。
検証ステーションに新しいショートカットが追加されたことにより、表中の選択行を上、下、左または右に移動できるようになりました。また、検証ステーションで選択を行った際には、フィールドレベルのショートカットを使用して選択範囲を特定のフィールドに割り当てることができます。各フィールド カードにはキーが関連付けられており、選択が行われていない場合には、フィールドレベルのショートカットを使用して 1 つのフィールド カードから別のカードへ移動できます。
検証ステーションの表フィールドに、行レベルのチェックボックスが追加されました。チェックボックスをオンにすることで行のすべてのフィールドを選択できるようになりました。あるいは、すべてのフィールドにアクセスすることでチェックボックスが自動的にオンになるようになりました。
検証ステーションのトークンが更新されました。これにより、強調表示されたトークンには赤い下線が引かれ、選択されたトークンは破線の枠線で囲まれます。
検証ステーションで、参照のないフィールド値がサポートされるようになり、ドキュメントを参照しない値をフィールドに割り当てられるようになりました。参照のない値を割り当てるには、タクソノミー マネージャーでフィールドを作成する際に、[参照が必要] オプションのチェックボックスをオフにしておく必要があります。
分類ステーション
分類ステーションに次の動作を可能にする新しいショートカットが作成されました。ドキュメントの種類間の移動、参照の追加・変更・削除または強調表示、すべてのページを上に移動または下に移動、選択したページの後で分割、変更の破棄、保存、例外として報告
ドキュメントの種類のメニューからだけでなく、ページ レベルでも参照を削除できるようになりました。ページ上でホバーし、右下隅の青いアイコンをクリックすることで削除できます。このアイコンを使用して、参照を強調表示することもできます。
分類ステーションと検証ステーションの PDF ビューアー
PDF ビューア―に回転アイコンが追加されました。このアイコンをクリックすると、現在のドキュメント ページが時計回りに回転します。
選択モードは PDF ビューアーで既定で有効化されています。
その他のアクティビティ
[インテリジェント フォーム抽出器] アクティビティと [フォーム抽出器] アクティビティにおいて、インポートしたテンプレートの名前が既存のテンプレートと同じだが内容が異なる場合に、そのテンプレートを組み込めるようになりました。各テンプレートは分析され、各ケースに対して警告メッセージが表示されます。
[ドキュメント検証アクションを作成] アクティビティの [アクション優先度] プロパティが、式や変数をサポートするようになりました。
[ドキュメント検証アクションを作成] アクティビティの [バケットのフォルダー パス] プロパティを [バケット ディレクトリ パス] に、[ドキュメント検証アクション完了まで待機し再開] アクティビティの [ダウンロード フォルダー パス] プロパティを [ダウンロード ディレクトリ パス] にそれぞれ変更しました。この変更は、Orchestrator の文脈のフォルダーと、このアクティビティ内の文脈のフォルダーを明確に区別するために行いました。
公開日: 2020 年 8 月 24 日
- [フォーム抽出器]、[インテリジェント フォーム抽出器] および [インテリジェント キーワード分類器] において、場合により、Kerberos または NTLM 認証要求に対して 「
407ProxyAuthenticationRequired
(プロキシ認証が必要です。)」というエラー メッセージが返されていた問題を修正しました。 - [インテリジェント フォーム抽出器] でタイムアウト エラーが正常に表示されない原因となっていた問題を修正しました。
- 未翻訳だった検証ステーションの特定の文字列が翻訳されました。
- 表フィールドの選択を解除したときに [データ抽出スコープ] が例外をスローする原因となっていた問題を修正しました。
公開日: 2020 年 5 月 4 日
- このリリースでは、[ドキュメント検証アクションを作成]、[ドキュメント検証アクション完了まで待機し再開] など、多くの刺激的なアクティビティが追加されました。これらのアクティビティは、UiPath アクション センターでオーケストレーション ワークフローを作成、中断、および再開するために使用できます。
- 新たな抽出器として [フォーム抽出器] および [インテリジェント フォーム抽出器] の 2 つのアクティビティが加わりました。これらのアクティビティは、あらかじめ定義されたテンプレートに基づいて固定フォームのドキュメントから情報を抽出します。[インテリジェント フォーム抽出器] はこれに加えて署名または手書きのフィールドを扱うことができます。情報はフィールドの種類に関わらず抽出でき、表も抽出可能です。テンプレート マネージャー ウィザードを使用すればユーザー設定の表の抽出ルールを作成することもできます。
- [インテリジェント フォーム抽出器] アクティビティの使用中は、手書きフィールドの数が許容値を超えた可能性がある場合、警告がワークフローに直接表示されます。そのためにユーザーがワークフローの実行を妨げられることはありません。
- [正規表現ベースの抽出器] アクティビティに、[視覚的配置を使用] オプションが追加されました。このオプションは、単語の視覚的配置に基づいて正規表現を書く方が簡単に情報を抽出できる、複雑なレイアウトに使用できます。このオプションを使用する場合、ドキュメント内で識別される文、段落、レイアウト グループは無視されます。
- 正規表現を定義することによって、表の領域、その表の行、その行の特定の列を識別できます。
- [検証ステーションを提示] アクティビティとそのウィザードに、多くの新機能が追加され、既存機能が改善されました。
- 検証ステーション ウィザードに [変更を破棄] ボタンが追加されました。このボタンを使って、検証ステーションで加えられた変更を確認したり破棄したりできます。この機能は、ドキュメントの種類ごとに使用できます。
- ウィザードには [候補を表示] ボタンも追加されました。使用した抽出器によって可能な値が複数報告された場合に、このボタンを使って値を 1 つ選択できます。
- 検証ステーションで使用できるショートカットのリストに新しく
f+a
が追加されました。このショートカットを使用して、複数値を許容するフィールドに新しい値を追加できます。 - [ドキュメントをデジタル化] アクティビティが改善され、ドキュメント内のチェック ボックスの識別精度が上がりました。
- [ドキュメントをデジタル化] アクティビティに [OCR を強制適用] オプションが新しく追加されました。ここのオプションを選択すると、ネイティブ PDF を含むドキュメントのすべてのページに、OCR エンジンが適用されます。
- 抽出器で抽出器機能 (内部タクソノミー) が宣言される場合、[データ抽出スコープ] アクティビティによって自動的に抽出器機能を読み取ることができるようになりました。これにより抽出器の既知のフィールドが公開されるため、設定手順が簡略化されます。[マシン ラーニング抽出器] アクティビティでこの機能がサポートされるため、簡単に設定し使用できるようになりました。
- [抽出結果をエクスポート] アクティビティに [信頼度を含む] オプションが追加されました。このオプションを選択すると、信頼度レベルが提供されます。
- 抽出ウィザードと設定ウィザードで、ドキュメントの種類とテーブル フィールドの一括フィールド選択がサポートされるようになりました。
公開日: 2020 年 1 月 14 日
- 検証ステーション ウィザードで [新しい表を抽出] オプションを使用すると、表の設定が正しく表示されない問題を修正しました。
- 前または後ろに [吹き出し] アクティビティをつなげた [検証ステーション] ウィザードを実行するとエラーが返される問題を修正しました。
- [データ抽出スコープ] アクティビティを、マシンの言語設定をカスタマイズした状態で [可能な場合は値を書式化] オプションを選択して実行するとエラーが発生する問題を修正しました。
- [検証ステーション] ウィザードの [テキスト ビュー] オプションで大量のテキストを選択すると、パフォーマンスが低下する問題を修正し、[テキスト ビュー] オプション使用時に正常にテキストが表示されるようになりました。
- プロジェクトのタクソノミ-に新しいフィールドを追加し、内部タクソノミーが設定されていない抽出器を使用して [データ抽出スコープ] アクティビティを実行するとエラーが発生する問題を修正しました。
- 特定のマシンにおいて、検証ステーションの使用時に回転されたドキュメントが正しく表示されない問題が発生していました。
公開日: 2019 年 12 月 6 日
- UiPath.IntelligentOCR.Activities パッケージに大規模なアップデートがありました。FineReader および FlexiCapture Abbyy 製品群と連携するすべてのアクティビティを、UiPath.Abbyy.Activities と命名された別のパッケージに移しました。このため UiPath.IntelligentOCR.Activities パッケージには重大な変更が発生し、v3.1.0 から v4.0.0 へバージョンをスキップしました。UiPath.IntelligentOCR.Activities パッケージから UiPath.Abbyy.Activities パッケージに移動されたアクティビティのリストは次のとおりです。
- UiPath.Abbyy.Activities パッケージは、v19.11 より低いバージョンの UiPath.UIAutomation.Activities パッケージおよび v4.0.0 より低いバージョンの UiPath.IntelligentOCR.Activities パッケージと共に使用できません。
- ワークフローで使用するアクティビティのパッケージを v4.0.0 の UiPath.IntelligentOCR.Activities パッケージと v1.0.0 の UiPath.Abbyy.Activities パッケージに更新した後、実行時に検証エラーが発生する場合には、
.xaml
ファイルにわずかな変更を加え、その後変更前の状態に戻してから保存してください。この問題は、FlexiCapture アクティビティを使用するワークフローで発生する可能性があります。 - v4.0.0 の UiPath.IntelligentOCR.Activities パッケージのアクティビティを含むワークフローを作成した場合、あるいはワークフローに含まれる UiPath.IntelligentOCR.Activities パッケージのアクティビティを v4.0.0 にアップグレードした場合は、UiPath.IntelligentOCR.Activities パッケージのバージョンをより低いバージョンのものにダウングレードすることはできません。
公開日: 2019 年 11 月 8 日
- [キーワード ベースの分類器トレーナー] は、トレーニング可能な分類器を整理・管理しやすくする新しいアクティビティです。このアクティビティは [分類器トレーニング スコープ] アクティビティ内でのみ使用することができます。
- 検証ステーション ウィザードに重要なアップグレードがありました。これでこの機能を最大限使いこなせるようになりました。このウィザードは、ワークフローで [検証ステーションを提示] アクティビティが使用されている場合にのみ使用できます。アップグレードされたバージョンを使用すると、新しい使いやすいインターフェイスからメリットを得ることができます。また、キーボードのショートカットを使用しながらドキュメントを確認したり、一つまたは複数の単語またはカスタム領域を選択したりすることもできます。フィールドに不足としてマークを付けたり、新しいデータを抽出したり、表を編集したり、新しい表を抽出したりすることができます。これらの素晴らしいことはすべて、ダーク テーマを使用しながらでも検証ステーション ウィザードで実行できます。
- このリリースに含まれる改善の一つは、[キーワード ベースの分類器] アクティビティに [ラーニング データ] という新しいパラメータが追加されたことです。ラーニング ファイル データの位置を指定する以外に、シリアライズされた分類器データを含む文字列も使用できます。このアクティビティは、「キーワードベースの分類器学習を管理」という名前のウィザードによってより便利に使用でき、特定のドキュメントの種類の識別に使用されるキーワードの設定と管理に使用できます。
- キーワード ベースの分類器およびキーワード ベースの分類器トレーナーの両方のアクティビティが、複数のキーワードを管理できるようになりました。キーワード セットが選択されると、抽出は選択した語句の完全一致に基づいて行われます。
- [ドキュメントをデジタル化] アクティビティのドキュメント オブジェクト モデルの出力が、単語の水平ボックスに加えポリゴン (座標情報) もサポートするようになりました。
- タクソノミー マネージャー ウィザードにスクロール バーを追加しました。このためすべての UI 要素を表示できるようになり、使用感が向上しました。
- [データ抽出スコープ]、[抽出器トレーニング スコープ]、[分類器トレーニング スコープ]、[ドキュメント分類スコープ] アクティビティ内で、抽出器や分類器が従来のような縦方向ではなく、横方向に並べられるようになりました。
- 正規表現ベースの抽出器アクティビティが改善され、複数の値を処理して返すことができるようになりました。出力は、アクティビティが検証ステーションと一緒に使用される場合にのみ表示されます。
- UiPath.IntelligentOCR.Activities パッケージは新たに、トルコ語 (TR)、ポルトガル語 (PT)、スペイン語 (ES)、スペイン語 (メキシコ) (ES-MX) の 4 つの言語で使用できるようになりました。
.xaml
ファイルをあらかじめ開いた場合にのみアクセスできます。タクソノミー マネージャーへのアクセス時にファイルが開かれていないとレコーディング ウィンドウが表示され、レコーディング ウィンドウを閉じるまでタクソノミー マネージャーは表示されません。
- [データ抽出スコープ] アクティビティと [トライ キャッチ] アクティビティを同時に使用すると例外がスローされました。この問題は修正され、アクティビティは期待どおり実行されるようになりました。
- 検証ステーションで Boolean フィールドが No に設定されている場合、出力ファイルは結果を No として表示されるべきでしたが、代わりに missing として表示されていました。この問題は修正され、出力ファイルは正しい結果を表示するようになりました。
- データ抽出スコープがドキュメントのカルチャとは異なる形式を使用してドキュメント内の数値を解析しようとしたときに、解析結果が不正確であった問題を修正しました。
- 検証ステーションを複数使用すると、検証結果内での派生パーツの並び順が考慮されていませんでした。この問題を修正し、現在は派生パーツが入力時と同じ順番で表示されるようになりました。
- 検証ステーションの結果が 2 番目の検証ステーションを介して実行されたときに、カスタム選択されたボックスに違いが発生していました。現在この問題は修正され、カスタム選択されたボックスに違いは発生しません。
- Microsoft Azure Computer Vision OCR エンジンと [ドキュメントをデジタル化] アクティビティが一緒に使用された場合、HandwritingRecognition パラメーターが True に設定されているとローテーションが機能しませんでした。問題は修正され、情報が正しく処理されるようになりました。
- [ドキュメントをデジタル化] アクティビティを使用して含まれるテキストの量が多い画像を処理しようとすると、エラーが発生していました。この問題は、スケーリング プロセスを改善することで修正されました。
- [キーワード ベースの分類器] アクティビティをトレーニング スコープ内でトレーニングしようとした際に、分類結果のない抽出データが実行されると、例外がスローされる問題を修正しました。現在はラーニングの情報が存在しないことがログにのみ記録され、例外はスローされません。
- [FlexiCapture 抽出器] アクティビティを使用する際に、表の列名とフィールド名が同一であると例外がスローされていました。問題が修正され、
.fcdot
ファイルは期待どおり処理されるようになりました。
- v6.22.0
- 更新内容
- Support for activities from an on-premises setup
- IntelligentOCR support for modern projects
- Extended Languages OCR
- バグ修正
- 今後の非推奨化の予定
- v6.19.6
- v6.19.5
- バグ修正
- v6.0.2
- v6.5.4
- v6.19.3
- v6.14.2
- v6.19.2
- バグ修正
- v6.19.1
- バグ修正
- v6.19.0
- 新着情報
- 改良点
- バグ修正
- 既知の問題
- v6.14.1
- 新機能と改良点
- v6.9.5
- v6.9.4
- v6.9.3
- v6.9.2
- v6.5.3
- v6.5.2
- v6.9.1
- バグ修正
- v6.9.0
- 新機能と改良点
- バグ修正
- 非推奨化のタイムライン
- v6.5.1
- 新機能と改良点
- v6.6.0
- 新機能と改良点
- バグ修正
- v6.5.0
- 新機能と改良点
- バグ修正
- 2022 年 12 月 8 日
- v6.0.1
- 新機能と改良点
- バグ修正
- 既知の問題
- v5.0.2
- 改良点
- バグ修正
- 既知の問題
- v4.13.2
- 改良点
- v4.13.1
- 改良点
- v4.13.0
- 新機能と 改良点
- バグ修正
- 既知の問題
- v4.10.5
- 改良点
- v4.10.4
- 改良点
- v4.10.3
- 改良点
- v4.10.2
- 新機能と 改良点
- バグ修正
- v4.10.1
- 改良点
- バグ修正
- v4.10.0
- 新機能と改良点
- v4.5.2
- バグ修正
- v4.5.1
- バグ修正
- v1.3.2
- 改良点
- v4.5.0
- 新機能と改良点
- v4.0.1
- バグ修正
- v4.0.0
- 重大な変更
- 既知の問題
- バグ修正
- v2.0.2
- 改良点
- v1.3.1
- 改良点
- v3.1.0
- 新機能と 改良点
- 既知の問題
- バグ修正