2022.4.0

オンプレミス版 Document Manager の公開日: 2022 年 5 月 23 日

前回の LTS リリース以降に発生した Document Manager に関する最新の変更点については、以下のリストをご覧ください。

改良点

フルテキスト検索オプションが無効化された SQL Server のインストールを使用するオンプレミスのデプロイでは、インストール時にフルテキスト検索サービスを有効化するための再起動が必要です。この操作を行うには、サーバーに対する適切な権限を持つデータベース管理者 (DBA) が EXEC sp_fulltext_service 'restart_all_fdhosts' コマンドを実行します。

予測機能を Document Manager と一緒に使用する際に、ユーザーが手動で編集しなかったタグ付けされたデータが、モデルから取得した値で置き換えられるようになりました。

ドキュメントの種類 (トレーニング、検証、評価) を分かりやすく説明するツールチップを追加しました。

列フィールドと標準フィールドの編集ダイアログボックスを改良し、[後処理]、[複数ページ]、[スコアリング]、[色] オプションを [詳細設定] タブに移動しました。他のオプションは [全般] タブで設定できます。

重複するドキュメントのインポート速度が向上しました。

分類フィールドが作成された順序で表示されるようになりました。

バグ修正

ファイル名に URL エンコードを必要とする文字 (&、 ,、 +、 #、 ') が含まれるドキュメントの検索またはダウンロードが、無効なクエリとして失敗していた既知の問題を修正しました。
テキストの密度が非常に高いドキュメントで [予測] 機能が失敗する問題を修正しました。
セッションあたりでインポートできるドキュメントの上限 2,000 個を廃止しました。今後は、1 つのセッションに 2,000 個を超えるドキュメントをインポートできます。なお、1 回のインポートあたりのページ数の上限は 2,000 ページです。
ctrl キーまたは shift キーを押しても 4 つ以上のボックスを選択できませんでしたが、この問題を修正しました。
ポッドを再起動した後にジョブが再開しないと、タイムアウトするまでインポートの処理がハングする問題を修正しました。
[予測] 関数の実行時に、データがドキュメント全体から抽出されない問題を修正しました。なお、この関数をパブリックエンドポイントで使用する場合のページ数の上限は変わらず 10 ページです。
Microsoft Read OCR でサブドメイン *.cognitiveservices.azure.com に一致するエンドポイントを使用しようとすると「OCR endpoint is not valid (OCR エンドポイントが無効です)」というエラーが発生する問題を修正しました。
Document Manager へのデータセットのインポートにおいて、10 ページを超えるドキュメントのページの順序が乱れる問題を修正しました。
[ラベル付けされたデータすべて] オプションを選択すると、空のデータセット、または完全なデータセットの一部である少量のサブセットのみがダウンロードまたはエクスポートされる問題を修正しました。

既知の問題

インポートの最大サイズが 2GB または 2000 ページ から 1GB または 2000 ページに縮小されます。
ファイル名に URL エンコードを必要とする文字 (&、 ,、 +、 #、 ') が含まれるドキュメントを検索またはダウンロードすると、「invalid query (クエリが無効です。)」というエラーが発生して失敗します。

Document Manager で発生したすべての変更について詳しくは、以前のリリースノートをご覧ください。

2022 年 6 月 3 日

既知の問題

Type3 フォントを含む一部の PDF ファイルではデジタル化サービスでのメモリ使用量が増加することがあります。この際、Document Manager からのインポート操作のパフォーマンスが低下します。この問題を軽減するには、メモリ使用量が多い (常に 70% を超える) Kubernetes の Pod を手動で削除します。