日本专利JP2011510365A 動的文書識別フレームワークを用いた文書確認

专利PDF首页>>日本专利

专利附录

专利说明

权利要求

类似技术

同族专利

引用文献

法律状态

优先权

专利摘要:
本願は、機密文書を動的文書識別フレームワークに従って識別及び検証する技術を開示する。例えば、機密文書認証装置は、文書の捕捉画像を受信する画像捕捉インターフェースと、複数の文書タイプオブジェクトを動的文書識別フレームワークに従ってデータ構造内に格納するメモリとを含む。機密文書認証装置はまた、複数の処理の１つ以上を選択的に起動することにより捕捉画像をデータ構造を複数の文書タイプオブジェクトの１つとして識別する走査する文書処理エンジンを含む。従来の識別技術に反し、動的文書識別フレームワークに従って格納されたデータ構造を走査することにより実行されるこの識別方法は、適応可能な処理のみが捕捉画像の識別に適応され得ることから、より正確な識別結果をより効率的な方法で提供し得る。文書タイプが識別されたら、１つ以上の確認器を適用して更に文書の真正性を確定する。
公开号:JP2011510365A
申请号:JP2010538020
申请日:2008-11-12
公开日:2011-03-31
发明作者:イー．マクレーン，ジェイムズ；レイ，イーウ
申请人:スリーエムイノベイティブプロパティズカンパニー；
IPC主号:G06T7-00

专利说明:

[0001] 本発明は、柔軟な文書検証フレームワークを用いた、パスポート、運転免許証、出生証明書、又は金融書類などの機密文書のコンピュータ利用識別及び検証に関する。]
背景技術

[0002] 機密文書からの情報を捕捉、識別、検証、及び抽出するため、コンピュータ利用技術を用いることがますます盛んになっている。例えば、電子パスポート読取り器などの機密文書読取り器を導入して機密文書を読取り、その真正性を確定することがより一般的になりつつある。機密文書の例としては、パスポート、クレジットカード、身分証明書、運転免許証、出生証明書、商業手形、及び金融書類が挙げられる。機密文書によっては、ＩＣＡＯ（国際民間航空機関）が機密文書をコンピュータ利用技術によって識別するための明確な手順を提供している。他の機密文書については、コンピュータ利用技術によってＩＣＡＯ非準拠の機密文書を識別する際に拠り所とし得るような標準は存在しない。]
[0003] 一般に、所与の機密文書の真正性を確定する前に、まず機密文書のタイプを識別する必要がある。例えば、最新の機密文書読取り器によっては、様々な国が発行したパスポートのように、多様な異なる機密文書タイプをサポートしている。例えば機密文書が真正のパスポートであると確定するためには、認証しようとしているパスポートが具体的にどの国のどの版のものであるかをまず決定する必要がある。イギリスのパスポートの認証には、例えばオーストラリアのパスポートと比較すると、異なったアルゴリズムの適用、及び／又は、パスポート上の異なる部分の解析をする必要があり得る。より具体的には、異なる機密文書の認証のためには、機密文書読取り器は、文書の寸法、静止画像パターン、及び／又は、文書の特定部分及び／又はバーコード、機械可読ゾーン、若しくはＲＦＩＤチップ等の記憶媒体の特定部分から収集した情報を解析するものを含む、多種多様なアルゴリズムを利用し得る。]
発明が解決しようとする課題

[0004] 最初に機密文書タイプを識別する処理は、ＩＣＡＯ非準拠文書にとっては極めて困難なものであり得る。１つのアプローチでは、文書の真正性を確定する処理に先立って、作業者が手動で機密文書タイプを選択する必要がある。このアプローチはしかしながら、過酷な作業であり、大量の機密文書を処理する環境においては誤りも生じやすい。]
[0005] 代案として、機密文書のタイプを自動的又は半自動的に識別するために、ある種のコンピュータ利用技術を適用することも可能である。しかしながら、これまでのところ、このような技術は典型的には事実上静的である（つまり柔軟性なく定義されている）。すなわち、文書認証システムは第１のタイプの機密文書を検査するために第１のアルゴリズムを適用するよう、静的にプログラムされ得る。第１の検査が失敗すれば、文書認証システムは第２のタイプの機密文書を検査するために第２のアルゴリズムを適用する。機密文書が認証されるか又は拒絶されるまで、この静的処理が順次続けられる。この静的アプローチは、その硬直した性質と長い所要処理時間ゆえに、多数の異なる文書タイプをサポートするよう設計される文書認証システムには適さず、このようなシステムの拡張性を制限する恐れがある。]
課題を解決するための手段

[0006] 一般的には、本発明は、拡張可能、効率的、かつ動的な文書識別フレームワークによる、機密文書、より広くは物品の識別及び検証のための技術に関する。すなわち、機密文書の異なるタイプを容易に定義し得る、拡張可能なソフトウェアフレームワークが記述され、このフレームワークは大量の異なるタイプの機密文書の効率的な識別及び検証に適応するよう容易に拡張され得る。更に、文書の各タイプの識別に必要なアルゴリズムを容易に追加し、共通の、再利用可能な文書識別ソフトウェアモジュールの集合から選択し得る。一実施形態では、文書識別ソフトウェアモジュールは論理的に、「分類器」、「確認器」、及び「検証器」に分けられる。文書識別フレームワークは、階層的な、木状構造として組織されたノードの集合を含み、これを走査することにより、文書が、再利用可能な文書識別ソフトウェアモジュールの適用に基づいて文書タイプ及びサブタイプに分けられる。]
[0007] ある文書タイプを識別する際、木の各親ノードにおける分類器による結果に基づいて、文書処理エンジンが階層的文書識別フレームワークを通して選択的にパスを走査する。すなわち、１つ以上の計算効率のよい分類器を階層的な文書識別フレームワーク内の各親ノードに適用して、そのノードのいずれかの子ノードの走査を行うかを決定し得る。分類器（単数又は複数）は未知の文書の一般的特徴を、サブ文書タイプを表す子ノードの特徴と比較する。所与のノードの分類器は、可能なリファレンス文書オブジェクトタイプを表す子ノードをゼロ以上含み得る部分集合を（例えばリストの形で）戻す。]
[0008] 階層的な文書識別フレームワークを走査中に、より集約的な計算による確認器を部分集合中の子ノードの各々に適用して一層の制約を加えることにより、機密文書が分類器によって識別された子ノードに適合した特徴を有することを高い精密度で更に確定するようにしてもよい。本開示で述べるように、子ノードの評価の順序は確実度又は類似度に基づいてよく、未知の文書に対して最高の類似度を有する子ノードが選択され得る。実施形態によっては、確実度又は類似度の閾値に達しないうちは、いずれの子ノードをも、未知の文書に一致可能なものと見なすことはできない。いったん選択されれば、子ノードは親ノードと見なされ、引き続き走査処理が再帰的に行われ、新しい親ノードについて分類器及び確認器が再び適用される。]
[0009] あるリーフノード（leaf node）に達したら、この最終の親が識別結果と見なされる。この時点で、機密文書の真正性を確定するために、結果として得られた識別ノードに対して１以上の検証器の集合が適用される。検証器は、典型的には画像比較アルゴリズムを用いて未知の文書のいずれかの機密特徴を１つ以上の既知のリファレンスと比較し、確実度又は類似度を戻す。類似度が認証閾値を超えていれば、未知の文書は真正確定と見なされる。]
[0010] この方法では、文書識別モジュールにより定義されたアルゴリズムが適用される順序（すなわちフレームワークが走査される方法）は、その機密文書の特定の属性に基づいて動的である。このアプローチにより、容易に拡張して、機密文書の何百、又は更に何千という文書タイプをサポートすることが可能な、効率的で拡張可能な文書認証システムが提供される。]
[0011] 例えば、機密文書の識別及び継続検証には、機密文書からのデータ、例えば機械可読ゾーン（ＭＲＺ）、バーコード、磁気ストリップ、テキストコンテンツ、画像認証、又は機密文書に埋め込まれた無線自動識別（ＲＦＩＤ）チップからのデータを利用し得る。本開示に記述した原理によれば、機密文書認証システムはフレームワークによって定義された分類器及び確認器が階層的フレームワークを走査し、機密文書からのデータを処理して、機密文書が特定の識別特徴を含むかを決定する。このフレームワークの階層的な性質は、文書タイプのカテゴリー及びサブカテゴリーの識別に再利用可能な文書分類器を用いていることとも相まって、多くの異なったタイプの文書をサポートする環境においても機密文書を迅速かつ効率的に識別することを可能にする。本開示に記述した技術は、必要な比較回数を絞り込むことによって機密文書を迅速に識別した後、機密文書の真正性を確定する方法で、現在世界中で使用されている機密文書数の増大にかかわらず、動的文書識別フレームワークを維持するのに特に有用であり得る。]
[0012] 例えば、本発明の技術は機密文書認証装置として具体化し得る。この装置は、物品の捕捉画像（単数又は複数）を受信する画像捕捉インターフェースと、複数の文書タイプオブジェクトを動的文書識別フレームワークに従ってデータ構造内に格納するメモリとを含み得る。機密文書認証装置はまた、複数の処理の１つ以上を選択的に起動することによりデータ構造を走査し、機密文書を複数の文書タイプオブジェクトの１つとして識別する、文書処理エンジンを含む。通常はデータ構造は、捕捉画像（単数又は複数）と文書タイプオブジェクトとの間の比較回数を大幅な低減を可能にするために木状データ構造を含む。更に、木データ構造のような動的データ構造を用いることによりデータ構造は、その数を増大させつつある機密文書を扱うよう容易に拡張することができ、実行時に追加的なデータ構造に迅速に対応するため、動的に適応し得る。]
[0013] 一実施形態では、方法は未知の文書の１つ以上の捕捉画像を受信する工程と、複数の文書タイプオブジェクトを動的文書識別フレームワークに従ってデータ構造内に格納する工程とを含み、複数の文書タイプオブジェクトは、捕捉画像から属性を抽出して未知の文書を文書タイプオブジェクトの１つに代表される文書タイプとして類別し確認するために複数の再帰的処理を参照する。方法は、データ構造の文書タイプオブジェクトを、複数の再帰的処理を捕捉画像に適用することにより抽出した属性に基づいて変更可能な順序で走査する工程と、データ構造の走査において未知の文書を複数の文書タイプオブジェクトの１つとして識別する工程とを更に含む。]
[0014] 別の実施形態では、機密文書認証装置は、未知の文書の１つ以上の画像を捕捉する画像捕捉インターフェースと、複数の文書タイプオブジェクトを動的文書識別フレームワークに従ってデータ構造内に格納するメモリとを含み、複数の文書タイプオブジェクトは、捕捉画像から属性を抽出するために複数の再帰的処理を参照する。装置は、データ構造の文書タイプオブジェクトを、複数の再帰的処理を捕捉画像に適用することにより抽出した属性に基づき変更可能な順序で走査する文書処理エンジンを更に含み、文書処理エンジンは、データ構造の走査において未知の文書を複数の文書タイプオブジェクトの１つとして識別する。]
[0015] 別の実施形態では、本発明は、命令を収容したコンピュータ可読媒体を目的とする。命令によりプログラマブルプロセッサが物品の捕捉画像を受信し、複数の文書タイプオブジェクトを動的文書識別フレームワークに従ってデータ構造内に格納する。ここで、複数の文書タイプオブジェクトは複数の処理を参照する。命令によりプロセッサは更に、複数の処理の１つ以上を選択的に起動することによってデータ構造を走査することで、捕捉画像を複数の文書タイプオブジェクトの１つとして識別する。]
[0016] 本発明の１つ以上の実施形態の詳細を、添付図及び以下の説明で明らかにする。本発明の他の特徴、目的、及び利点は、説明及び図面、並びに特許請求の範囲から明らかとなるであろう。]
図面の簡単な説明

[0017] 本発明の原理に従って機密文書１２を解析するための例示的な文書認証システム１０を示す略図。
本発明の原理による動的文書識別フレームワークに従って物品を確認する例示的なホストシステムを示すブロック図。
図１の文書認証システムの例示的な動作を示すフローチャート。
図２のホストシステム２０の例示的な動作を更に詳細に示すフローチャート。
図２の文書識別フレームワークをより詳細に示すブロック図。
文書識別フレームワークを走査中の、文書識別モジュールの例示的な動作を示すフローチャート。
文書識別フレームワークのためのユーザーインターフェースにより、ディスプレイを介してユーザーに提示されるウィンドウのスクリーンショット。
文書識別フレームワークのためのユーザーインターフェースにより、ディスプレイを介してユーザーに提示されるウィンドウのスクリーンショット。
文書識別フレームワークのためのユーザーインターフェースにより、ディスプレイを介してユーザーに提示されるウィンドウのスクリーンショット。
ホストシステムが識別及び継続検証をともに完了した後に、ユーザーインターフェースによってディスプレイを介してユーザーに提示されるウィンドウのスクリーンショット。
ホストシステムが識別及び継続検証をともに完了した後に、ユーザーインターフェースによってディスプレイを介してユーザーに提示されるウィンドウのスクリーンショット。
図２のホストシステムのメモリ構造の一部をより詳細に示すブロック図。
レイアウトマッチング識別処理を起動するために文書識別フレームワークを走査中の、文書識別モジュールの例示的な動作を示すフローチャート。
文書識別モジュールによるレイアウトマッチング識別処理の実行中における、捕捉画像の状態を示す例示的な画像。
文書識別モジュールによるレイアウトマッチング識別処理の実行中における、捕捉画像の状態を示す例示的な画像。
文書識別モジュールによるレイアウトマッチング識別処理の実行中における、捕捉画像の状態を示す例示的な画像。
固有画像（Eigenimage）文書マッチング処理を起動するために文書識別フレームワークを走査中の文書識別モジュールの例示的な動作を示すフローチャート。
文書識別モジュールが固有画像文書マッチング処理を実行中に捕捉された画像の状態を示す例示的な画像。
文書識別モジュールが固有画像文書マッチング処理を実行中に捕捉された画像の状態を示す例示的な画像。
文書識別モジュールが固有画像文書マッチング処理を実行中に捕捉された画像の状態を示す例示的な画像。
捕捉画像及び画像中の文字についての濃度変化プロファイルを示すことによる、文書検証モジュールとしての例示的画像。
捕捉画像及び画像中の文字についての濃度変化プロファイルを示すことによる、文書検証モジュールとしての例示的画像。
捕捉画像及び画像中の文字についての濃度変化プロファイルを示すことによる、文書検証モジュールとしての例示的画像。
印字見本技術及びその解析を示すことによる、文書検証モジュールとしての例示的画像。
印字見本技術及びその解析を示すことによる、文書検証モジュールとしての例示的画像。
印字見本技術及びその解析を示すことによる、文書検証モジュールとしての例示的画像。
印字見本技術及びその解析を示すことによる、文書検証モジュールとしての例示的画像。
印字見本技術及びその解析を示すことによる、文書検証モジュールとしての例示的画像。
印字見本技術及びその解析を示すことによる、文書検証モジュールとしての例示的画像。
印字見本技術及びその解析を示すことによる、文書検証モジュールとしての例示的画像。
２０６の異なる米国の運転免許証の集合から、ＩＣＡＯ準拠のＭＲＺを用いずにニューヨーク州の運転免許証の現行版を識別及び検証する際における、システムの効率性及び高い精度を実証するもの。
２０６の異なる米国の運転免許証の集合から、ＩＣＡＯ準拠のＭＲＺを用いずにニューヨーク州の運転免許証の現行版を識別及び検証する際における、システムの効率性及び高い精度を実証するもの。
２０６の異なる米国の運転免許証の集合から、ＩＣＡＯ準拠のＭＲＺを用いずにニューヨーク州の運転免許証の現行版を識別及び検証する際における、システムの効率性及び高い精度を実証するもの。] 図１図２
実施例

[0018] 図１は、本発明の原理に従って機密文書１２を解析するための例示的な文書認証システム１０を示す略図である。文書認証システム１０は、電子パスポート文書読取り器などの文書読取り器１１に結合したホストシステム２０を含む。文書読取り器１１は画像捕捉装置として機能し、機密文書１２が有効かつ真正な機密文書であると確定する。本開示に記述するように、文書読取り器１１は多種多様な機密文書のタイプをサポートする。認証作業の一環として、文書読取り器１１はまず、装置に挿入された機密文書の具体的なタイプを識別する。例えば、機密文書１２は、米国のパスポート、米国の特定の州の運転免許証、米国の特定の州の身分証明書、欧州連合（ＥＵ）の運転免許証、ＥＵの身分証明書、パスポート、又は世界中における特定の州若しくは国家政府機関が発行した身元確認書類、権利証券、身分証明書、その他の多様な文書タイプであり得る。機密文書のタイプを識別した後、文書認証システム１０は、次いで機密文書１２の検証及び機密文書１２からの情報抽出へと進む。] 図１
[0019] 例えば、文書認証システム１０のホストコンピュータシステム２０を使用して、はじめに機密文書１２の全体又は一部の１つ以上の画像のシーケンスを捕捉するよう、文書読取り器１１に命令し得る。次に、２段階処理を用いることにより、文書認証システム１０が、まず機密文書のタイプを識別し、次いで、捕捉画像データの解析に基づき（場合によっては機密文書から得られた他のデータも用いて）、機密文書１２が識別されたタイプの有効な文書であると確定する。例えば、機密文書１２から捕捉したスキャン画像データに加え、文書認証システム１０は、１つ以上の機械可読ゾーン（例えばバーコード）から受信したデータ、文書内に埋め込まれ、若しくは文書に取り付けられた無線自動識別（ＲＦＩＤ）チップ文書、又は文書が提供するその他の情報源から受信したデータを用いてもよい。]
[0020] 本開示に記述するように、ホストコンピュータ２０は、機密文書の多種多様なタイプをサポートするよう容易に拡張及び修正可能な、動的文書識別フレームワークを用いた文書処理エンジンに、動作環境を提供する。すなわち、文書識別フレームワークは、機密文書の異なったタイプにわたって容易に識別アルゴリズムを追加、定義、及び活用できる環境を提供する。文書処理エンジンは必要に応じてフレームワークと相互作用して様々なアルゴリズムを起動し、機密文書１２を類別し、かつ最終的には、その後の認証に必要とされる特定の文書タイプ、例えば特定の機関が発行した特定の特徴及びレイアウト特徴を有する機密文書として識別する。]
[0021] 文書認証システム１０は、機密文書をスキャンし、機密文書１２の全体又は一部から１つ以上の画像のシーケンスを捕捉することにより、機密文書１２の識別処理を開始する。次に、文書認証システム１０は、動的文書識別フレームワークに従って、複数の文書タイプオブジェクトを定義するデータを格納したデータ構造を走査する。複数の文書タイプオブジェクトは、ノード形式で階層的に配置され、それぞれ機密文書タイプのカテゴリー又はサブカテゴリーを代表す。各オブジェクトは、複数の実行可能な文書識別ソフトウェアモジュール（すなわち、カテゴリー及びサブカテゴリーに類別しかつ最終的には特定の文書タイプを識別、認証するために必要なアルゴリズムを提供する「分類器」、「確認器」、及び「検証器」）のいずれをも参照し得る（すなわち、それらへのポインタを含み得る）。例えば、これらの文書識別ソフトウェアモジュールはそれぞれ、典型的には、文書の１つ以上の属性を決定する機能を備えた、関連文書識別アルゴリズムを実行する。問題の属性が特定の機密文書１２内に存在するかに基づき、処理エンジンは文書フレームワークを走査し、継続する分類器を選択し適用する。例示的な文書識別ソフトウェアモジュールとしては、固有画像文書マッチングアルゴリズム又は文書レイアウトマッチングアルゴリズムが挙げられ、その両方が以下で更に詳細に記述される。]
[0022] 文書識別フレームワークのデータ構造を走査中に、文書認証システム１０は、複数の文書識別ソフトウェアモジュールの１つ以上を起動し、捕捉画像データの部分を処理し、及び／又は追加データを得るために機密文書１２に問い合わせを行う。例えば、文書タイプの識別中、文書認証システム１０の文書処理エンジンは、階層的文書識別フレームワークのルートノード（root node）から開始して引き続き、フレームワーク内の各親ノードにおいて分類器によって定義されたアルゴリズムの結果に基づき、フレームワークのノードを通して選択的にパスを走査する。すなわち、１つ以上の計算効率のよい分類器を階層的な文書識別フレームワーク内の各親ノードに適用し、その親ノードのいずれかの子ノードへのパスを走査するかを決定し得る。これらの分類器は、子ノードによって表されるサブ文書タイプの特徴を参照し、パス選択のための一般比較に用いられる。分類器は未知の文書の一般的特徴を、サブ文書タイプを表す子ノードの特徴と比較する。所与のノードの分類器は、可能なリファレンス文書オブジェクトタイプを表す子ノードをゼロ以上含み得る部分集合を（例えばリストの形で）戻す。分類器は、リンクインデックスの形で格納され、可能なリファレンス文書オブジェクトタイプを戻し得る。]
[0023] 階層的な文書識別フレームワークの走査中に、親ノード、子ノード又はその両方に関連した確認器が、より高レベルの分類器によって抽出された属性に適用され、機密文書が分類器によって選択された子ノードとして適正な特徴を有することを、更に確定し得る。確認器は、ノード自体によって代表される文書タイプの特徴を参照し、更に識別処理においても用いられる。確認器によって特定されるアルゴリズムは、正確な識別結果を得るために、この特定の文書タイプに対してより厳密な制約を課す。確認器によって特定されるアルゴリズムはまた、分類器によって特定されるアルゴリズムよりもより集約的計算であり得る。分類器と確認器との組み合わせにより、高速性と正確性、両方の要求のバランスの取れた、効率的かつ柔軟な構造が得られる。本開示で述べるように、子ノードの評価の順序は確実度又は類似度に基づいてよく、未知の文書に対して最高の類似度を有する子ノードが選択され得る。実施形態によっては、確実度又は類似度の閾値に達しないうちは、いずれの子ノードをも、未知の文書に一致可能なものと見なすことはできない。いったん選択されれば、子ノードは親ノードと見なされ、引き続き走査処理が再帰的に行われ、新しい親ノードについて分類器及び確認器が再び適用される。]
[0024] リーフノード（すなわちフレームワーク中のノードで子ノードを１つも持たないもの）に到達した時点で、機密文書の真正性を確定するために、１つ以上の検証器の集合が適用される。検証器は、リーフノードによって表される文書タイプの特徴を参照する。また検証器は、確認器又は分類器のいずれによって特定されるアルゴリズムよりもより集約的計算であり得るが、それに限定はされない。検証器は、典型的には画像比較アルゴリズムを用いて未知の文書のいずれかの機密特徴を１つ以上の既知のリファレンスと比較し、確実度又は類似度を戻す。類似度が認証閾値を超えていれば、未知の文書は真正確定と見なされる。]
[0025] このようにして、文書認証システム１０は文書識別フレームワークを走査し、文書識別ソフトウェアモジュールを選択的に起動して、最終的には未知の文書を検証する。すなわち、動的文書識別フレームワークによって実行される処理は、文書識別フレームワークが、以前に起動された文書識別ソフトウェアモジュールの結果に応じて、特定の処理を起動するように文書認証ステム１０に命令するという点において「動的」であり、階層内における開始点及び処理の呼出しの順序は、識別されるべき特定の機密文書に応じて変化する。つまり、文書認証システム１０は、例えば第１、第２、及び第３の処理を順に適用して米国パスポートである機密文書１２を解析し得るし、第１、第３及び第５の処理を順に適用して米国運転免許証である機密文書１２を解析し得る。ここで、各処理はそれぞれ、機密文書の１つ以上の限られた属性のみを決定する。この点で本技術は、典型的に文書識別アルゴリズム全体を認証の対象となる機密文書１２のタイプにかかわらず所定の順序で静的に適用する必要がある従来のシステムとは異なっている。以下に更に詳細に述べるように、この動的態様ゆえに、捕捉画像（単数又は複数）そのものの解析に基づいて処理の集合を選択的かつ動的に用いることによって、より効率的で包括的な機密文書確認が容易になる。]
[0026] 文書認証システム１０は文書識別フレームワークを、階層的に配列された、木状のデータ構造としてメモリ、データベース、又はその他の格納媒体（図１には示さず）内に格納し得る。本開示において文書オブジェクトタイプと呼ぶデータ構造は、木状データ構造内の各ノードを表すものとして用いられる。親ノードは、文書タイプのカテゴリー又はサブカテゴリーを表し、この親ノードは階層の複数レベルにわたって、下方に向けて再帰的に走査され得る。リーフノードは具体的な文書タイプ、例えば米国パスポート文書タイプオブジェクト、米国運転免許証文書タイプオブジェクト、又は米国身分証明カード文書タイプオブジェクトなどを表す。フレームワーク内の文書タイプオブジェクトによっては、１つ以上の格納された画像又はテンプレートを、１つの文書タイプオブジェクトを明確に他の文書タイプオブジェクトから画定する特定の特徴の集合とともに含み得る。例えば米国パスポート文書タイプオブジェクトは、米国パスポートテンプレート画像の下端に機械可読ゾーンが存在することを規定する特徴、テンプレート内における写真の位置を画定する手段、及び様々な特徴間の相対位置を決定するその他のデータの集合とともに、テンプレート米国パスポートの画像を含み得る。] 図１
[0027] 文書認証システム１０は、フレームワークのデータ構造を走査し、文書タイプオブジェクトによって参照される１つ以上の実行可能な分類器、確認器、及び検証器を起動し得る。起動される具体的な文書定義ソフトウェアモジュールに応じて、文書認証システム１０は、文書タイプオブジェクトを捕捉画像（単数又は複数）と比較し、あるいは画像データ及び／又は機密文書から得られた他のデータについてその他の解析を行い、機密文書１２がカテゴリー、サブカテゴリー、又は特定の文書タイプと一致する類似度を示す確度値を得ることができる。確度値が、その親ノードに関連した複数の分類器及び／又は確認器についてのプログラマブル又は計算された最小確度レベルを上回れば、文書認証システム１０は、１つ以上のリーフノードに到達した時点で最終的に最高の確度値を戻すことによって機密文書１２が識別されるまで、その親ノードからフレームワークを通して複数のパスを走査する。]
[0028] 機密文書１２が、格納された複数の文書タイプオブジェクトの１つに一致することが首尾よく識別された後、文書認証システム１２は認証処理を実行し、機密文書の真正性を確定する。例えば、文書認証システム１２は捕捉画像（単数又は複数）を解析し、格納されたリファレンス画像の１つ以上の存在がその機密文書内に認められるかを決定する。リファレンス画像が捕捉画像内に存在する場合、文書認証システム１０は、機密文書１２が適切に認証されたという（例えば聴覚的及び、又は視覚的）表示を与え得る。リファレンス画像が捕捉画像内に存在しない場合、文書認証システム１０は、機密文書１２が自動的に認証できず、否定し得るという表示を与える。]
[0029] 作業においては、ユーザーが、文書読取り器１１のビューフレーム１４上に機密文書１２を置く。ビューフレーム１４は、文書認証システム１０の他の構成要素に対して機密文書１２を正確に位置付ける。図１の例示的な実施形態において、文書認証システム１０は、ビューフレーム１４の上に置かれた機密文書１２を照明するための光源（単数又は複数）を有する。実施形態によっては、文書認証システム１０は、赤外（ＩＲ）光源及び／又は紫外（ＵＶ）光源などの光源を複数含み得る。文書認証システム１０は、機密文書１２から画像データを捕捉するための画像捕捉装置を更に含む。画像捕捉装置は、ピクセルの配列を備えた電荷結合素子（ＣＣＤ）などのＣＭＯＳ画像センサー、カメラ、ラインスキャナー、又は他の入力装置であってよい。ホストシステム２０は、機密文書読取り器１１と相互作用することで、画像データを捕捉し、ＲＦＩＤチップに対する問い合わせを行い、又は機密文書１２に関して他の処理を行ったりするための命令を発する。光源の輝度は、ホストシステム２０によって自動的に又はユーザーからの入力に基づいて、最小値から最大値までの輝度範囲にわたって調節することができる。] 図１
[0030] ユーザーが機密文書をビューフレーム１４内に配置した後、文書読取り器１１が、機密文書１２の１つ以上の画像のシーケンスを捕捉する。捕捉画像は機密文書１２の全体又は一部を表し得るが、典型的には捕捉画像は機密文書１２の全体を表す。画像捕捉装置は、画像処理のために、捕捉画像データをホストシステム２０に伝達する。ホストシステム２０によって処理された捕捉画像（単数又は複数）は、検査のために、ホストシステム２０と関連付けられたディスプレイ（図示せず）上に表示することができる。ホストシステム２０は、例えば、コンピュータ、ラップトップ、携帯情報端末（ＰＤＡ）、又は捕捉画像（単数又は複数）を解析するのに十分なプロセッサ及びメモリ資源を有する他のコンピュータシステムを含んでもよい。ホストシステム２０の例示的な構成及び動作について、以下で更に詳細に説明する。]
[0031] 図２は、物品、例えば図１の機密文書１２を認証する、例示的なホストシステム２０を示すブロック図であり、本発明の原理に従って動的文書識別フレームワークにより機密文書１２を識別する。ホストシステム２０は文書読取り器１１（図１）から受信した画像データ２２、及び所望により他のデータ（例えばＲＦＩＤデータ）を解析して機密文書１２を動的に識別する。] 図１図２
[0032] この例では、ホストシステム２０は、文書読取り器１１からのデータ（例えば画像及びＲＦＩＤデータ）を受信するためのデータインターフェース２４を含む。データインターフェース２４は例えば、データ読取り器１１と通信するためのシリアル又はパラレルインターフェースであってよい。もう１つの例として、データインターフェース２４は、ユニバーサルシリアルバス（ＵＳＢ）インターフェースであってもよい。]
[0033] 図２に示すように、文書識別フレームワーク３４は、機密文書のカテゴリー、機密文書のサブカテゴリー、又は機密文書の特定のタイプを表す複数のノードを備えた木状構造として表され得る文書識別フレームワーク３４の各ノードは、分類器４７、確認器４８及び検証器４９をはじめとする、文書識別ソフトウェアモジュール４１の集合へのリファレンスを１つ以上、含むことができ、各モジュールは、それぞれ機密文書の１つ以上の属性又は特徴の照査を行うための処理を定義する実行可能な命令を含む。一例として、親ノードに関連する分類器４７の１つは、機械可読ゾーン（ＭＲＺ）が機密文書の特定の位置に存在するかを決定し、それによって機密文書の可能なタイプを具体的なクラスへと絞り込む。その親ノードに関連するか又はその親ノードの子ノードのいずれかに関連するかを問わず確認器４７の１つが、更にＭＲＺの処理を行い、ＭＲＺテキスト内にテキスト識別器の特定シーケンスが存在することを確定してもよい。これに関連して、確認器４８は文書木階層内のより高いレベルの分類器によって抽出された属性、例えば、上記テキスト識別器の特定シーケンス、例えば「ＡＵ」が存在するかを確定し、可能な文書タイプをオーストラリアの文書の集合へと更に絞り込む。最終的に、リーフノード（すなわちフレームワーク中のノードで子ノードを１つも持たないもの）に到達した時点で、機密文書の真正性を確定するために、リーフノードにより参照される１つ以上の検証器４９の集合が適用される。] 図２
[0034] ホストシステム２０は、レイアウトエディタ３０を備えたユーザーインターフェース２８を含み、それによってユーザー（図示せず）は、データベース３２に格納されたデータを編集することが可能である。特に、ユーザーは、レイアウトエディタ３０が提示するＧＵＩ（ｇｒａｐｈｉｃａｌｕｓｅｒｉｎｔｅｒｆａｃｅ）と相互作用することによってデータベース３２に格納された文書タイプを編集することにより、文書識別フレームワーク３４を拡張して別の文書タイプをサポートするようにすることができる。例えば、場合によって、ユーザーはレイアウトエディタ３０と相互作用し、文書識別フレームワーク３４に挿入するための新しい文書タイプオブジェクトを手動で特定することができる。この時ユーザーは、カテゴリー、サブカテゴリー、又は個々の文書タイプを定義するために存在する属性を定義することができる。加えて、ユーザーは、分類器、４７、確認器４８、及び検証器４９として挿入されている文書オブジェクトを、１つ以上の新規又は既存のアルゴリズムと関連付けることができる。]
[0035] あるいは、ホストシステム２０は「学習」モードに設定し、新しいタイプの機密文書のテンプレートからの画像データ及びその他のデータ２２の受信及び処理に応じて、文書識別フレームワーク３４を適応するよう更新するようにしてもよい。このモードでは、ホストシステム２０はデータを処理し、新しいタイプの機密文書の、任意の識別された属性に一致する新しい文書タイプオブジェクトを、文書識別フレームワーク３４中に自動的に挿入する。]
[0036] すなわち、ユーザー入力２６は、ユーザーインターフェース２８と相互作用することにより、文書タイプオブジェクトを編集する命令、例えば所定の文書タイプオブジェクトに関連した分類器４７、確認器４８、及び検証器４９を加える又は削除する命令を特定し、新しい文書タイプオブジェクトを手動又は自動で挿入し、文書タイプオブジェクトを削除し、文書識別フレームワークのノードを整理しなおして分類器４７、確認器４８、検証器４９、及びその他の命令の優先順位をつけることができる。このようにしてユーザーは、レイアウトエディタ３０を用いて文書識別フレームワーク３４を調整することにより、機密文書タイプをより迅速に識別するようにすることができる。]
[0037] データインターフェース２４によって受信される画像データは、機密文書１２の全体又は一部の捕捉画像（単数又は複数）を表し得る。上述したように、画像データは、画像、テキスト、ＭＲＺ、バーコード、透かし、又はその他の情報の１つ以上を含み得る。ホストシステム２０は、捕捉データを受信し、上述した識別及び継続認証処理を実行する文書処理エンジン３６を含む。この例では、文書処理エンジン３６は画像処理モジュール３８及び文書識別モジュール４０を含み、文書識別処理を実行する。文書処理エンジン３６はまた、識別済みの機密文書の認証を確定する文書認証モジュール４２と、確認及び認証されるべき機密文書１２などの物品から関連情報を抽出するデータ収集モジュール４４とを含む。具体的なデータ収集モジュール４４は、文書読取り器１１を用いて機密文書１２上に存在するバーコードを読取り、ＲＦＩＤチップに問い合わせ、磁気ストリップを読み取ることにより、画像データには含まれない可能性のあるデータを収集することができる。]
[0038] 捕捉画像データを受信すると、画像処理所モジュール３８は画像前処理アルゴリズムを起動し、捕捉画像データからより高い品質のグレー、カラー、又は２値化画像を作成する。本開示の目的のため、これらの処理済み捕捉画像を捕捉画像と呼び、「捕捉画像」は、処理したものであるか否かを問わず、元の機密文書１２を反映する任意の画像を意味するものとする。画像処理モジュール３８は、画像捕捉時に用いる光源のタイプ又は捕捉画像（単数又は複数）の特定の態様に応じて、画像処理が必要かを決定し得る。例えばＵＶ光源では特定の画像処理アルゴリズムが必要となり得るし、例えば暗い背景に明るいテキストなら特定の画像反転アルゴリズムが必要となり得る。画像データが前処理されると、文書識別モジュール４０は更に画像データ及びデータ収集モジュール４４によって得られたその他のデータを解析し、機密文書のタイプを識別する。]
[0039] 特に、捕捉画像データの捕捉時に、文書識別モジュール４０はデータベース３２に格納された文書識別フレームワーク３４を走査し、その機密文書が、文書識別フレームワーク３４によってサポートされる文書タイプオブジェクトの１つとして識別するか、又はその機密文書を拒絶する。データベース３２はこのシステム内に、メモリ又はホストシステム２０のコンピュータ可読媒体内に配備してよい。しかしながら、他の実施形態では、データベース３２はホストシステム２０から離れて存在し、ネットワーク接続又はその他の何らかの遠隔アクセス法を介してホストシステム２０に結合し得る。データベース３２は、リレーショナルデータベースなど、いかなるタイプのデータベースをも、又は、文書識別フレームワーク３４を格納し得るものであれば他のいかなるタイプのメモリをも含み得る。]
[0040] 文書識別フレームワーク３４は、拡張が容易なように、木状データ構造として組織される。以下により詳細に述べるように、文書識別モジュール４０は、複数の分類器４７、確認器４８及び検証器４９を選択的に起動することにより文書識別フレームワーク３４を走査し、機密文書を類別し、最終的には文書識別フレームワーク３４に格納された複数の文書タイプオブジェクトの１つとして識別する。]
[0041] 文書識別フレームワーク３４を走査した後、文書識別モジュール４０は、識別された機密文書のタイプをユーザーインターフェース２８に伝達し得るし、これに応じてユーザーインターフェース２８は、選択された文書タイプをディスプレイ４３を介してユーザーに提示し、ユーザーの承認を得ることもできる。あるいは、ユーザーによる確定は不要とすることもできる。いずれの場合でも、機密文書が特定の文書タイプオブジェクトの１つとして識別された時点で、文書認証モジュール４２は上述したように認証段階を開始する。識別又は認証のいずれの段階を通じても、データ収集モジュール４４は、データベース３２から要求された情報を、画像（単数又は複数）から抽出し得る。認証が行われれば、文書処理エンジン３６は、典型的には認証結果をユーザーインターフェース２８に伝達し、これに応じてユーザーインターフェース２８は、この結果をディスプレイ４３に表示する。ディスプレイ４３は、液晶ディスプレイ（ＬＣＤ）、平面ディスプレイ、プラズマディスプレイ、陰極線管（ＣＲＴ）ディスプレイ、又は、図形、テキスト、及びビデオを表示できる、他の任意のいずれのタイプのディスプレイであってもよい。]
[0042] ホストシステム２０はまた、最近識別された文書タイプオブジェクトを格納する待ち行列データ構造４６（「待ち行列４６」）をも含み得る。すなわち、機密文書１２が例えば米国パスポート文書タイプオブジェクトとして識別された時点で、文書処理エンジン３６は米国パスポートタイプオブジェクト又はそのリファレンスを待ち行列４６に格納し得る。他の機密文書を識別する要求を受信した時点で、文書識別モジュール４０は、他の可能性を求めて文書識別フレームワーク３４の走査を行う前にまず、その機密文書を待ち行列４６に格納されている文書タイプオブジェクトの１つとして識別するよう試みる。場合によっては、次に識別される文書は同一文書の裏側であることもある。この場合、文書処理エンジン３６は自動的に情報を関連付け、２つの情報の集合を重ね合わせて１つの出力とする。図２では分離したものとして示したが、待ち行列４６はデータベース３２内にあってもよい。ホストシステム２０は、待ち行列データ構造を格納できるものであれば、ランダムアクセスメモリ（ＲＡＭ）、磁気ディスク若しくはハードドライブ、ディジタルビデオディスク（ＤＶＤ）、コンパクトディスク（ＣＤ）、フラッシュ読取り専用メモリ（ＲＯＭ）、及びサムドライブなど、いずれのタイプのメモリを含んでもよい。あるいは、文書処理エンジン３６は、文書識別フレームワークの配列及び／又は走査パスを変更することによって、最近識別された機密文書タイプを優先するようにしてもよい。] 図２
[0043] 図３は、図１の文書認証システム１０の例示的な動作を示すフローチャートである。はじめ、ホストシステム２０は、動的文書識別フレームワークに従って、例えば図２の文書識別フレームワーク３４のようなデータ構造に１つ以上の文書タイプオブジェクトを格納している。次に、ユーザーが例えばパスポートのような機密文書１２を、画像捕捉装置１１下のビューフレーム１４内に置く（図３の工程５０）。ホストシステム２０が、機密文書１２の１つ以上の捕捉画像のシーケンスを受信、格納する（工程５２）。] 図１図２図３
[0044] 格納後、ホストシステム２０が文書識別フレームワーク３４を走査することによって捕捉画像（単数又は複数）を識別する。ホストシステム２０は１つ以上の文書識別ソフトウェアモジュール４１を選択的に起動することによってデータ構造を走査し、未知の文書を文書識別フレームワーク３４に格納された複数の文書タイプオブジェクトの１つとして識別する（工程５４）。動的文書識別フレームワークは、データ構造が確実に拡張可能、柔軟、かつ効率的であり続けるよう、明確な方向付けを行う。すなわち、動的文書識別フレームワークは、走査、オブジェクトの編集若しくはデータ構造からの削除、及びオブジェクトのデータ構造への挿入のためのプロトコル、又は、より一般的には、文書タイプデータ構造３２の一体性を維持するためのプロトコルを特定する。]
[0045] 未知の文書を識別した時点で（一致するものが見つからず文書が拒絶される場合を除き）、ホストシステム２０は、確認中に識別された具体的な文書タイプオブジェクトに特有の、特定の機密特徴が存在する事実に基づいて、機密文書を認証し得る（工程５６）。例えば、識別処理の結果、機密文書は米国パスポート文書タイプオブジェクトとして識別され得る。ホストシステム２０は、認証処理中、米国パスポートの認証に関係する機密特徴を決定するため、データ構造３４内の米国パスポート文書タイプオブジェクトにアクセスし得る。ホストシステム２０は次いで、文書タイプオブジェクトによって参照された適切な処理を起動することで、関係する機密特徴すべての認証を開始し、例えばＭＲＺを読取り、透かし、反射性の記号、又はこれらに類した他のマークなどを探すための様々な画像テンプレートマッチングアルゴリズムを実行し、かつテキストの一致を見出すためのスキャンを行う。完了後、ホストシステム２０は識別処理、認証処理、若しくはその両方の結果及びその他の収集情報をディスプレイ４３を介してユーザーに表示し、又は任意の適切な聴覚的若しくは視覚的表示をし生成し得る（工程５８）。]
[0046] 図４は、図２のホストシステム２０の例示的な動作を更に詳細に示すフローチャートである。ホストシステム２０は、図１の機密文書１２の少なくとも１つの捕捉画像を解析することによって、機密文書１２を確認する。上述したように、ホストシステム２０は、文書処理画像エンジン３６による前処理のため、データインターフェース２４を介して機密文書１２の捕捉画像（単数又は複数）を受信する（工程６０）。] 図１図２図４
[0047] 文書処理画像エンジン３６は画像処理モジュール３８を含み、これによって、その捕捉画像について、識別及び認証処理を進めるために更なる画像処理が必要となるかを決定する（工程６２）。捕捉画像に追加的な画像処理が必要と決定されると（工程６４の分岐「ＹＥＳ」）、画像処理モジュール３８は１つ以上の画像強調アルゴリズムを実行して捕捉画像の品質を向上させ（工程６６）、終了後、識別処理のために捕捉画像を文書識別モジュール４０に送信する。更なる画像処理が不要であれば（工程６４の分岐「ＮＯ」）、画像処理モジュール３８は識別処理のために捕捉画像をそのまま文書識別モジュール４０に送信する。]
[0048] 文書識別モジュール４０は、文書識別フレームワーク３４をルートオブジェクトから走査することによって識別処理を開始する（工程６８）。一般に文書識別モジュール４０は、性能向上のため、３レベルの制御により文書識別フレームワーク３４の走査を行ってもよい。最初の優先度の基づく走査方法において、文書識別のジュール４０は、文書識別フレームワーク３４を文書識別フレームワークに格納された文書タイプオブジェクトに関連付けられた優先度に従って走査し、この場合優先度は、ユーザーが規定し得る。第２の待ち行列走査方法においては、文書識別モジュール４０は待ち行列データ構造４６にアクセスし、どの文書タイプオブジェクトが直前に処理されたかを決定し、文書識別フレームワーク３４内に格納されたその文書タイプオブジェクトを走査し得る。第３の動的走査方法では、文書識別モジュール４０は文書識別フレームワーク３４全体を動的に走査する。すなわち、文書識別モジュール４０は、文書識別フレームワーク３４のルートオブジェクトから開始して、フレームワークの各親ノードオブジェクトにおいて参照される１つ以上の複数の分類器４７を起動し得る。分類器４７を起動した結果に応じて、文書識別モジュールは４０はその親ノードの１つ以上の子ノードを選択し、文書識別フレームワーク３４に格納されたより低レベルのオブジェクトへと下方に向けて走査を行い得る。文書識別モジュール４０は、親ノードか、又は選択された子ノード（単数又は複数）か、いずれかに関連付けられた１つ以上の確認器４８を適用し、機密文書が分類器によって選択されたパスに相応の特徴を備えていることを確定し得る。]
[0049] この走査による識別処理は、文書識別モジュール４０が、その文書の属性に一致する１つ以上の検証器の集合を参照するリーフノードに到達し、したがって捕捉画像（単数又は複数）を、文書識別フレームワーク３４に格納された複数の文書タイプオブジェクトに関する所定の閾値を超えて、最もよく一致、又は十分に一致するものとして識別するまで、続けられ得る。]
[0050] 文書識別モジュール４０は、走査方法の先行するすべての方法から２つ以上の方法を（続けて又は直列的に）適用し得る。すなわち文書識別モジュール４０は、例えば、最初に待ち行列データ構造４８にアクセスして待ち行列に従ってデータ構造を走査し、次いで、複数の分類器４７の１つ以上を選択的に起動することによってデータ構造３４を動的に走査し得る。]
[0051] 文書識別フレームワーク３４の走査に基づき、文書識別モジュール４０は、捕捉画像（単数又は複数）を文書識別フレームワーク３４に格納された複数の文書タイプオブジェクトの１つとして識別する（工程７０）。上述したように、捕捉画像（単数又は複数）を適切に識別するため、文書識別フレームワーク３４の動的走査の間に、文書識別モジュール４０は確度値を算出し、その確度値を他の確度値又は所定の最小確度値と比較し得る。識別後、文書識別モジュール４０は、その識別された書類タイプオブジェクトをディスプレイ４３を介して確度値とともにユーザーに表示し、その承認を求めることもできる（工程７２）。]
[0052] 識別及びユーザーによる承認後、必要に応じて、文書識別モジュール４０は、捕捉画像（単数又は複数）を識別された書類タイプオブジェクト又はそれに対するリファレンスとともに、書類認証モジュール４２に送信する。書類認証モジュール４２は、先に概説したように認証処理を行って機密画像１２の真正性を決定し（工程７４）、この認証結果をディスプレイ４３を介して表示する（工程７６）。]
[0053] 図５は、図２の文書識別フレームワーク３４をより詳細に示すブロック図である。図５に示すように、文書識別フレームワーク３４は木データ構造を含むが、文書識別フレームワーク３４は、複数の文書タイプオブジェクト７８Ａ〜７８Ｍ（「文書タイプオブジェクト７８」）を格納できるものであれば、その他のいずれのタイプのデータ構造をも含み得る。] 図２図５
[0054] この例では、文書識別フレームワーク３４はルートオブジェクト８０、複数の文書タイプオブジェクト７８、及び複数の文書サブタイプオブジェクト８２Ａ〜８２Ｍ（「文書サブタイプオブジェクト８２」）を含む。更に、この木は、サブ−サブタイプ文書オブジェクトを用いることにより、また、同一構造を用いて再帰的に、更に拡張することが可能である。ルートオブジェクト８０は例示的な木文書識別フレームワーク３４のルート、又はより一般的には、走査が上述した動的走査方法のみよって行われるとした場合に文書識別モジュール４０がそこから走査を開始することになるオブジェクトを表す。ルートオブジェクト８０は、ルートオブジェクト８０を各書類タイプオブジェクト７８に結びつける双方向リンク８４Ａ〜８４Ｍ（例えばポインタ）を保持する。書類タイプオブジェクト７８もまた、書類タイプオブジェクト７８を書類サブ−タイプオブジェクト８２に結びつける双方向リンク８４Ｎ〜８４Ｚを保持する。リンク８４Ａ〜８４Ｚ（「リンク８４」）は、データベース３４内でルートオブジェクト８０、文書タイプオブジェクト７８、及び文書サブ−タイプオブジェクト８２の１つが格納されているアドレスへのリファレンスを含み得る。一般に、文書タイプオブジェクト７８及び文書サブ−タイプオブジェクトは、その機密文書に共通の物理的属性、機密特徴、又はレイアウト特徴に基づいて、機密文書カテゴリー、サブ−カテゴリー及び個々の文書タイプ（リーフノード）の階層的組織を表す。例示目的で３つの木階層を用いるものとして示したが、機密文書を類別しかつ最終的には個々のタイプを識別するために、いかなるレベル数を繰り返してもよい。]
[0055] ルートオブジェクト８０は、図２の複数の分類器４７の１つ以上を参照する、少なくとも１つの分類器オブジェクト８６Ｎを含む。このリファレンスは、メモリ内の、参照される分類器４７が存在する場所に固有の、識別器、名称、又はアドレスを特定し得る。親ノードとして、文書タイプオブジェクト７８は多重分類器オブジェクト８６を含み、分類器のいくつかは二重化し得る。図５に示すように、各文書タイプオブジェクト７８はそれぞれの分類器オブジェクト８６Ａ〜８６Ｍへのリファレンスを含む。各分類器オブジェクト８６Ａ〜８６Ｍ（「分類器オブジェクト８６」）は、「分類器処理」を実行して識別される機密文書の１つ以上の特徴又は属性を評価する、実行可能なソフトウェアを含む、複数の分類器４７の１つ以上を参照する。各文書タイプオブジェクト７８はまた、それぞれ優先値８８Ａ〜８８Ｍを（「優先値８８」）を含み得るが、文書タイプオブジェクト７８はまた、優先値を含まなければならないものではない。上述したように、優先値８８は、文書識別モジュール４０が文書識別フレームワーク３４を走査する特定の走査順序を確定し得る。] 図２図５
[0056] 図５には示していないが、文書タイプオブジェクト７８又は文書サブ−オブジェクトタイプ８２のいずれも、機密文書が分類器８６によって選択されたパスに対して適切な特徴を有することを確定するために適用され得る、確認器オブジェクト９０Ａ〜９０Ｍへのリファレンスを含み得る。リーフノードに到達した時点で、機密文書の真正性の確定を目的として、１つ以上の検証器の集合が適用される。] 図５
[0057] 文書サブタイプオブジェクト８２は、リーフノードを代表し、そのためそれぞれ、１つ以上の検証器４９を表す、各自の検証器オブジェクト９３Ａ〜９３Ｍを含む。加えて、文書サブタイプオブジェクト８２は、各自のテンプレートデータ９１Ａ〜９１Ｍ（「テンプレートデータ９１」）、及び１つ以上の各自の最小確度値９２Ａ〜９２Ｍ（「最小確度値９２」）を含む。検証器オブジェクト９３Ａ〜９３Ｍはポインタ又は固有の識別器を介して、機密文書１２の素性を確定するために親ノードの、及び可能性としては任意の確認器の、各分類器によって収集された特定の属性又は特徴の存在又は不在を、比較又はその他の方法によって確定する、複数の検証器４９の１つ以上を参照する。図５には示していないが、実施形態によっては、各文書サブタイプオブジェクト８２は、それぞれが１つ以上の確認器処理を参照する多重確認器オブジェクトを含み得る。テンプレートデータ９１は一般に、具体的な１つの文書サブタイプオブジェクト８２の分類及び／又は確認時に使用することが必要となり得る、いずれのテンプレート画像、レイアウト特徴、機密特徴、及び関連する他のいずれのデータをも定義する。一般に確認器４８は、文書識別フレームワーク３４内における文書識別モジュール４０の現在地に応じて可能な文書タイプ又はサブタイプオブジェクトの分類器処理に従い、特定の属性についての確度値を戻す。例えば、既に述べたように、１つの文書ノードの特定の分類器（単数又は複数）４７の集合及び確認器（単数又は複数）は、現在解析中の機密文書のタイプに対応し得る、そのサブ文書タイプオブジェクト７８の格付け集合を戻し得る。文書識別モジュール４０は、戻された確度値を、最小確度値９２の対応する１つと比較し得る。] 図５
[0058] 現在の機密書類１２を識別するために、文書識別モジュール４０は、典型的には文書識別フレームワーク３４を動的走査方法によって走査する。この動的方法により、文書識別モジュール４０は、分類器オブジェクト８６Ｎによって参照された分類器４７を起動するためにルートオブジェクト８０から開始する。この最初の分類器４７は、捕捉画像及び機密文書１２から得られたその他のデータを解析し、子ノードによって表される可能な文書タイプオブジェクトの集合、すなわち文書タイプオブジェクト７８を戻す。この集合は、文書タイプオブジェクト７８の任意の１つ以上を特定し得る。]
[0059] １つの文書タイプオブジェクト７８への走査において、文書識別モジュール４０は関連する分類器８６Ａ〜８６Ｍにアクセスし、参照される分類器４７を起動し、かつ可能な属性又は特徴の集合を受信する。次いで、子サブ書類オブジェクトのそれぞれについて、対応する確認器オブジェクト９０Ａ〜９０Ｍを用いて予測値との比較を行い、類似確度要素を作成し、かつそれに基づいて、文書サブタイプオブジェクト８２への１つ以上のパスを最終的に選択するためにその機密文書とサブ文書タイプとの間のマッチング類似性の程度が格付けされる。このようにフレームワーク３４を垂直方向に走査してカテゴリー、サブカテゴリーの類別を行い、かつ機密文書を最終的に識別し得る。]
[0060] 走査は、木の下方へと、特定の機密文書を表すリーフノードに到達するまで繰り返し行い得る。この分類器４７及び確認器４８は、１つ以上の確度値を戻すことができ、文書識別モジュール４０は走査中に、文書サブタイプオブジェクト８２内に格納されている方程式によってこれらの確度値の加重平均を算出し得るこの加重平均を用いることにより、文書識別モジュール４０は走査中に加重平均を文書サブタイプオブジェクト８２に対応した最小確度値９２と比較し、機密文書１２が確かにその具体的な機密文書タイプであるかを確定する。この加重平均が対応した最小確度値９２を満たさない、つまりそれを超えない場合には、文書識別モジュール４０はそのサブタイプオブジェクト８２に関連した全ブランチ（枝）を更なる考慮の対象から破棄することにより、効率性を向上させることができる。文書識別モジュール４０は、確実度が破棄される又は更なる考慮の対象として格納されるまで、上の分類器オブジェクト８６から戻された可能な文書サブタイプの残りの集合を通じ、引き続き反復し得る。]
[0061] 集合内のすべての文書サブタイプオブジェクト８２が解析されたら、文書識別モジュール４０は、残りの文書サブタイプオブジェクト８２に関連した確度値を相互に比較し、最適な確度値を、例えば最も高い確度値を選択することで識別し、それによって文書識別フレームワーク３４の走査を終了することができる。文書識別モジュール４０はこの識別確度値を、ディスプレイ４３を介して表示するため、関連する文書タイプオブジェクト７８又はサブタイプオブジェクト８２とともにユーザーインターフェース２８に送ってもよい。ユーザーは、この識別された文書タイプオブジェクト７８又はサブタイプオブジェクト８２を承認するか、又はその他の方法で、文書識別モジュール４０が捕捉画像（単数又は複数）の解析から機密文書１２を正しく識別したことを認めることが必要とされることがある。]
[0062] 図６は図２の文書識別モジュール４０が、図５に示すように動的走査方法によって文書識別フレームワーク３４を再帰的に走査中の、例示的な動作を示すフローチャートである。以下、動的走査方法に関連して述べるが、文書識別モジュール４０は文書識別フレームワーク３４を、待ち行列データ構造４６に格納された文書タイプオブジェクト７８へのリファレンスに従って、優先値８８に従って、若しくはこれらの方法の組み合わせによって文書識別フレームワーク３４を走査することを含め、他のいかなる方法、又はそれらの組み合わせによって走査してもよい。] 図２図５図６
[0063] はじめ、文書識別モジュール４０は、機密文書１２の捕捉画像（単数又は複数）を所望により他のデータ（例えばＲＦＩＤデータ）とともに受信し、文書識別フレームワーク３４のルートオブジェクト８０にアクセスして文書識別モジュール４０の走査を開始するとともに、ルートオブジェクトを現在処理中の文書として扱う（工程９４）。文書識別モジュール４０は、例えば現在の文書に関連する分類器オブジェクト８６Ａにアクセスし、それによって、分類器オブジェクト８６Ａによって参照される複数の分類器４７の１つ以上、すなわち分類器処理を起動し得る（工程９５）。この起動に応じて、文書識別モジュール４０は可能な属性又は特徴の集合を算出する。文書識別モジュール４０は、このノードにおけるこの文書タイプオブジェクトから可能な文書サブタイプオブジェクトの集合を受信し得る。この集合は、一般に１つ以上の文書サブタイプオブジェクト７８を含む（工程９６）。例えば、可能な文書サブタイプオブジェクトの１つの例示的な集合は、文書タイプオブジェクト７８Ａ及び７８Ｍを含み得る。この可能な文書タイプオブジェクトの集合、すなわち「サブタイプ集合」を得ると、そのタイプ集合に従って、文書識別モジュール４０は文書識別フレームワーク３４の走査を続ける（工程９６）。]
[0064] 文書識別モジュール４０は、タイプ集合の形で戻された第１の文書タイプオブジェクト７８Ａ及びそれに関連した分類器オブジェクト８６にアクセスすることにより、文書識別フレームワーク３４の１レベル下位を走査する。文書タイプオブジェクト７８Ａについての確認器のいずれかが、分類器オブジェクト８６によって抽出された属性を確定すれば（又はこの例におけるように確定オブジェクトが全く存在しなければ）、文書識別フレームワーク３４はここで、文書タイプオブジェクト７８Ａを現在の文書として扱い、分類器オブジェクト８６Ａを用いて、可能な属性又は特徴物の追加的な集合を算出する（工程９５）。その後、文書識別モジュール４０はもう１レベル下位へと走査を行い、その子サブ文書８２Ａ〜８２Ｄ、すなわち「サブタイプ集合」のそれぞれの照査を行う（工程９６）。文書識別モジュール４０は次に、この新しいサブタイプ集合に従って文書識別フレームワーク３４の走査を行う（工程９６）。]
[0065] 文書識別モジュール４０は、サブタイプ集合の形で戻された第１のサブタイプオブジェクト８２Ａ及びそれに関連した確認器オブジェクト９０Ａにアクセスすることにより、文書識別フレームワーク３４の下位を走査する。文書識別モジュール４０は、関連する確認器オブジェクト９０Ａによって参照された１つ以上の確認器４８を、確認器オブジェクト９２Ａによって参照された１つ以上の検証器４９とともに起動し、（これがリーフノードであることから、）確度値の集合を受信する（工程９７）。確度値を決定するに当たっては、確認器４８は、関連するテンプレートデータ９１Ａにアクセスし得る。確度値は、起動された１対の分類器４７と確認器４８とにより、捕捉画像（単数又は複数）に関して関連するテンプレートデータ９１Ａと比較することによって実施された解析についての、類似のレベルを反映する。例えば、確度値１００は、関連テンプレートデータ９１Ａと捕捉画像（単数又は複数）との間の完全な一致を反映するものであり得るし、確度値８０は、関連テンプレートデータ９１Ａと捕捉画像（単数又は複数）との間の十分な一致を反映し得るが、捕捉画像の１つ以上の特徴が関連テンプレートデータ９１と完全には一致していないことを示すものであってよく、ゼロは全く一致しないことを意味する。実施形態によっては、文書識別モジュール４０は、起動された確認器４８によって戻された各確度値を最小確度値９２Ａと比較し、最小値条件を満たさなければ（工程９８）、このサブ文書若しくはこのノードから始まるブランチ全体の照査を停止し、又はこのサブ文書についての組み合わせ確度値をゼロに設定する。他の実施形態では、文書識別モジュール４０は、捕捉画像（単数又は複数）を確認器４８の全起動から戻された全確度値加重平均を用いてこのサブ文書のための組み合わせの確度値を算出し（工程１０２）、この加重平均を最小確度値９２Ａと比較して、最小確度値９２Ａを上回る加重平均確度値のみを格納する（工程１０４）。]
[0066] このサブ文書が最小確度値条件を満たせば、そのノードがその文書木のブランチノードであって子サブ文書を有するか、すなわち親ノードであるかが照査される（工程１０６）。このサブ文書の下に付加された子サブ文書を有する場合、このサブ文書は現在の文書として扱われ、文書識別モジュールは、上述したプロセスを繰り返すことにより、文書木をもう１レベル下位へと走査する（工程９５）。これが再帰的縦型法として実施され、リーフノードに達するまで、文書木全体にわたって下方へと走査が行われる。]
[0067] サブタイプ集合中の１つの文書サブタイプオブジェクト８２について終了すれば、文書識別モジュール４０は、サブタイプ集合を全体についての反復を終了したかを決定し得る（１０８）。サブタイプ集合全体についての反復が終了していなければ、文書識別モジュール４０は引き続き他の文書サブタイプオブジェクト８２にアクセスし、関連する確認器オブジェクト９０によって参照される確認器４８を起動し、確度値を受信し、かつ比較に基づいて確度値を格納することにより、サブタイプ集合を通して反復を継続する（工程９６〜１０８）。終了したら、文書識別モジュール４０は算出された関連確度値によって全サブ文書を格付けし、所与の文書ノードにおけるパス選択処理のサイクルを完了する（工程１１０）。次の工程では、現在処理中の文書がルート文書であるか親文書タイプを有するかに応じて、結果を戻すかを決定する（工程１１２）。子サブ文書であれば、制御は文書木を１レベル上昇して親文書へと戻り（工程１１４）、子サブ文書の確度値は親文書に合流する。そうでなければ、文書識別モジュール４０は文書木全体を通しての反復を終了したことになり、文書識別モジュール４０は、格納された確度値に基づいて捕捉画像（単数又は複数）を識別する（工程１１６）。文書識別モジュール４０は、格納された全確度値を相互に比較して最高の確度レベルを選択し、これによって、捕捉画像（単数又は複数）を最高の確度レベルに対応した文書サブタイプオブジェクト８２に属するものとして識別してもよい。]
[0068] 以上、文書識別フレームワーク３４を走査中の文書識別モジュール４０の動作を説明した。文書識別フレームワーク３４は、動的文書識別フレームワークを介して文書タイプオブジェクト７８及び文書サブタイプオブジェクト８２を格納する。このフレームワークは、機密文書の属性及び特徴に応じて走査の順序が変化するという意味で、またフレームワークが、それぞれレイアウトエディタを介して文書タイプ及びサブタイプオブジェクト７８、８０の更新、削除、及び挿入を進めるという意味で、「動的」である。動的文書識別フレームワークは、そのプロトコルに従ってこれらの動的更新、削除、及び挿入を行い得るプロトコルを提供することで、機密文書１２を識別する、柔軟で拡張可能なフレームワークを保持する。このフレームワークは、米国及び他の国のパスポート、米国及び他の国の運転免許証、米国及び他の国の身分証明書、及び金融書類等、多くの異なるタイプの物品識別し得るという点で柔軟である。このフレームワークは、以下に詳述するように、更に１つ以上の、サブタイプを含む文書タイプを迅速にフレームワークに追加し、文書識別フレームワーク３４に挿入し得るという点で、拡張可能である。]
[0069] 図７Ａ〜７Ｃは、レイアウトエディタ３０によってディスプレイ４３を介してユーザーに提示されるウィンドウ１１８のスクリーンショットである。スクリーン１１８は、文書タブ１１９、文書タイプオブジェクト１２０の拡張可能なリストとして表される識別フレームワーク３４、及びビューサブウィンドウ１２１を含む。文書タイプオブジェクト１２０は１つ以上のテキスト領域を含み、各テキスト領域は、それぞれ図５の複数の文書タイプオブジェクト７８の１つを参照する。例えば、文書タイプオブジェクト７８Ａは、図７Ａに示したように、リスト１２０上の最初のアイテムとして「Ｄｏｃｕｍｅｎｔ−２Ｌｉｎｅ４４」文書タイプを含み得る。すなわち、文書タイプオブジェクトリスト１２０は、文書識別フレームワーク３４により定義され得る組織階層の一例を示す。ビューサブウィンドウ１２１は典型的には、データベース３２に格納されかつ文書タイプオブジェクトリスト１２０中の選択された１つのアイテムに関連した、任意の関係テンプレートデータ９１を示す。] 図５図７Ａ図７Ｂ図７Ｃ
[0070] 図７Ｂは、ユーザーが、識別処理中のアイテム１３０をこの文書タイプとして選択した時のウィンドウ１１８を示す。この選択に応じてレイアウトエディタ３０はポップアップウィンドウ１３２をウィンドウ１１８上にオーバーレイし、このポップアップウィンドウ１３２によりユーザーは、アイテム１３０に関連した確認器オブジェクト９０の１つを編集し、文書タイプの識別処理を定義することが可能となる。この例では、ポップアップウィンドウ１３２は、最小確度値入力欄１３４、光源選択入力欄１３６、既存確認器処理選択ボックス１３８Ａ、及び使用確認器処理選択ボックス１３８Ｂを含む。ユーザーは、最小確度値インプット１３４との相互作用を介して特定の最小確度値をこの文書タイプと関連付ける、例えば最小確度値９２Ａを図５の文書サブタイプオブジェクト８２Ａと関連付けることができる。ユーザーはまた、光源選択インプット１３６を介し、機密文書１２の画像捕捉時に用いる可視光、ＵＶ光、赤外光などのリファレンス光を特定できる。ユーザーは更に、既存確認器処理選択ボックス１３８Ａを介して、確認器オブジェクト９０Ａの１つによって現在参照されている確認器４８を編集することもできる。最後にユーザーは、使用確認器処理選択ボックス１３８Ｂを介して、ユーザーが検討中の確認器オブジェクト９０Ａに対し、追加の確認器４８を関連付け、又は削除することができる。] 図５図７Ｂ
[0071] 図７Ｃは、ユーザーが現確認器タブ１４０を選択して分類器４７又は確認器の１つを具体的に適用するようにした後の、ポップアップウィンドウ１３２がオーバーレイしたウィンドウ１１８を示す。図７Ｃに示すように、ユーザーは現在、捕捉画像のドミナントカラーを解析し、その解析結果をリファレンス入力欄１４２内に特定されたリファレンスと比較する、「ＣＤｏｃＶｅｒｉｆｉｅｒＤｏｍｉｎａｔＣｏｌｏｒ」処理を編集中である。ポップアップウィンドウ１３２はリファレンス入力欄１４２を含み、ユーザーがこれらのリファレンスを手動で編集できるようになっている。例えば、ドミナントカラー処理は、捕捉画像の解析結果をリファレンス入力欄１４２内に定義される様々な色（ここではマゼンタ０．００７パーセント、レッド１５．０２１パーセント、イエロー３４．５４７パーセントを特定する）と比較対照する。ユーザーはこれらの個別の色の割合（青色の強調表示領域に表示される割合）を手動で編集し得る。あるいは、ユーザーが物理的なテンプレートをスキャンのために用意していれば、ユーザーはｌｅａｒｎボタン１４４を選択することで、レイアウトエディタ３０が予め又は同時にスキャンしてシステムに読み込んだテンプレート画像から、これらのリファレンスを得るようにしてもよい。] 図７Ｃ
[0072] ポップアップウィンドウ１３２もまた、加重入力欄１４６及び特定最小確度値入力欄１４８を含む。ユーザーが加重入力欄１４６に加重値を入力することにより、起動された数個の確認器４８の加重平均の算出において、文書識別モジュール４０がこの特定の加重値を使用するようにしてもよい。同様にユーザーは、図６の工程９８に述べたように、走査時に使用するため、特定最小確度値を入力欄１４８に入力してもよい。このようにして、ユーザーは、加重及び最小確度値を設定することにより、分類器４７及び確認器４８を動的に構成し、分類器４７及び確認器４８を特定のオブジェクト８６、９０に関連付け、フレームワーク３４の走査を動的に修正することができる。] 図６
[0073] 図８Ａ、８Ｂは、ホストシステム２０が識別及び継続認証の双方を完了した後に、図２のデモンストレーションユーザーインターフェース２８によってディスプレイ４３を介してユーザーに提示されたウィンドウ１５０のスクリーンショットである。この文書は米国ニューヨーク州運転免許証の現行標準版の表側として識別される。ウィンドウ１５０は、識別確実度テキスト出力欄１５２を含み、この欄は典型的には、識別処理中に文書識別モジュール４０によって算出される加重確度値を表示する。ウィンドウ１５０はまた、認証及び識別タブ１５６の結果を示す認証詳細出力欄１５４を含み、この欄には、上記タブの選択に応じて識別処理の結果が提示される。ウィンドウ１５０はまた、他の付随的な情報、例えば捕捉画像１５８、及び捕捉画像１５８の解析結果から得られた機密情報詳細１６０をも提示する。] 図２図８Ａ
[0074] 図８Ｂはユーザーが識別タブ１５６を選択した後のウィンドウ１５０を示す。ユーザーインターフェース２８はウィンドウ１５０内に、文書識別フレームワーク３４の動的走査結果を示すテキスト出力欄１６２を提示する。テキスト出力欄１６２の一番上から始めて、文書識別モジュール４０はまず、「２ｌｉｎｅ４４」と名付けられた文書タイプオブジェクト７８の１つへの走査を行い、その関連分類器オブジェクト８６にアクセスし、そこで文書識別モジュール４０は参照された分類器４７を起動した。結果としては、検査が（テキスト出力欄１６２の第２行目に示すように）「ｌｉｎｅｃｏｕｎｔ」のところで失敗したため、いずれの使用可能な文書サブタイプオブジェクト８２も戻ってこなかった。] 図８Ｂ
[0075] 次に文書識別モジュール４０は、（テキスト出力欄１６２の第３行目に示すように）「ｕｓｄｌ」と名付けられた文書タイプオブジェクト８２の走査を行うが、テキスト出力欄１６２の第４行目によれば、関連分類器オブジェクト８６はまたも、米国一般運転免許証としての「ｏｎｉｄｅｎｔｉｆｉｃａｔｉｏｎ」に失敗した。最後に、「ｕｓｄｌｎｙ」と名付けられた文書タイプオブジェクト７８の走査で、文書識別モジュール４０は（テキスト出力欄１６２の第６行目に示すように）一致するものを見出し、文書サブタイプオブジェクトの集合を受信した。このサブタイプ集合の走査で文書識別モジュール４０は、第７〜１３行に示すように参照された分類器４７及び確認器４８を起動し、そのそれぞれが「ｃｆ」値を戻した。この「ｃｆ」値は、各確認器によって決定された確度値を反映し、「ｍｉｎｃｆ」値は各確認器を通過するために必要な最小確度値を示す。テキスト出力欄１６２の第６行目は、得られた「ｃｆ」値、すなわち確度値の加重平均の比較結果を、捕捉画像（単数又は複数）が、「第１４行目の文書［タイプオブジェクト］ｕｓｄｌｎｙ」、かつ「特定の［サブタイプオブジェクト］ｓｔａｎｄａｒｄｆｒｏｎｔ版であるとして識別された」ことを確定する形で示している。]
[0076] 図９は、図２のホストシステム２０のメモリ構造の一部をより詳細に示すブロック図である。この限定的な例では、分離域４７及び確認器４８は、レイアウトマッチング処理１６４Ａ及び固有画像書類マッチング処理１６４Ｂを含む。図９に更に示すように、書類データ構造３４は、ルートオブジェクト１６６、書類タイプオブジェクト１６８、及び書類サブタイプオブジェクト１７０を含む。文書タイプオブジェクト１６８は分類器オブジェクト１７２を含み、文書サブタイプオブジェクト１７０は確認器オブジェクト１７４、テンプレートデータ１７６、及び最小確度値１７８を含む。各オブジェクト１６８〜１７４、テンプレートデータ１７６、及び最小確度値１７８は、図５を参照して説明したオブジェクトと実質的に同様のものであり得る。文書識別フレームワーク３４は、各オブジェクト１６８〜１７４、テンプレートデータ１７６、及び最小確度値１７８のそれぞれを複数含むことができ、この分類構造もまた、複数の層へと再帰的に繰り返され得るが、図を簡略にするため、これらの追加的なオブジェクトは図９には示していない。] 図２図５図９
[0077] 文書識別モジュール４０に配備する２つの汎用識別方法として、レイアウトマッチング処理１６４Ａ及び固有書類マッチング処理は、可能な候補の絞込みに非常に効果的である。これら２方法はまた、文書識別用に構成することが極めて容易である。これらについては、以下に詳述する。文書識別モジュール４０はこれら２方法に限られるものではなく、新しい方法を導入するのに柔軟なプログラミング構造を提供する。一般に使用可能なその他の識別方法には、文書の寸法、ドミナントカラー、空白、濃度ヒストグラム、テキスト及びバーコードのＯＣＲ結果、並びにテンプレートマッチングなどが含まれる。]
[0078] 図１０は、図２の文書識別モジュール４０の１つにおいて、文書識別フレームワーク３４を走査して図９のレイアウトマッチング処理１６４Ａを起動するのに用いられる処理工程を例示するフローチャートである。この処理工程のシーケンスをリファレンス画像データに適用することで、文書タイプを識別するための文書テンプレート又は捕捉ライブ画像データを構築し得る（工程１８０）。文書リファレンステンプレートデータは、上述したように、レイアウトエディタ３０により手動で修正可能である。文書レイアウトは、特定の光源の下での、明るい背景中の連続した暗い領域、又はその逆に、グレー又はカラー画像中の画像又は平面のセグメンテーション及び分類によって解析し得る。] 図１０図２図９
[0079] レイアウトマッチング処理１６４Ａを呼び出すことにより、文書識別モジュール４０はレイアウトマッチング処理１６４Ａを実行し、可能な文書サブタイプオブジェクトの集合、すなわちサブタイプ集合を決定する。何らかの画像品質向上処理を行った後にまず、画像は閾値化処理によりバイナリデータに変換され（工程１８２）、次いで暗ピクセルの連続性に基づいて複数の領域にセグメント化される（工程１８４）。次に、孤立した領域を何らかの特徴によっていくつかのカテゴリー、例えばテキスト、バーコード、写真、磁気ストライプ、指紋などに分類してから（工程１８６）、各領域を寸法、位置、及び方向などの追加的な情報よって特徴づける（１８８）。バーコード、写真、磁気ストライプ、及び静的テキストなど、ほとんどの場合において、領域リファレンスは中心にあると考えられる。しかし時には、可変領域、例えば氏名や住所の動的テキストなどについて、領域の左側を使用することが必要な場合もある。文書は領域オブジェクトの木構造中において、タイプ及び他の特徴によって代表され（工程１９０）、領域オブジェクトは、エリアによって、人間にとってより意味を成し得るリファレンステンプレート表現の形で階層構造へとグループ化され得る。文書の位置又はそのコンテンツが、印刷のずれ、スキャンの際の文書位置の違い、又は他の理由により変化し得る一方、領域オブジェクトの相対位置は、文書タイプの決定においてより厳密な拘束条件となるが、画像のシフト又は回転は、読取り器によるスキャンの適用環境内に限定される。いったん明確な画像領域が図式化され、捕捉画像として結びつけられれば、文書識別モジュール４０は更に、複数の連続した領域を、データベースに格納した複数の文書タイプオブジェクトの１つに関連したテンプレートデータ、例えば図９のテンプレートデータ１７６と比較する（工程１９２）。一般に、テンプレートデータ１７６は、所定の、複数の連続画像領域及びこれら複数の所定の連続画像領域間の関係を定義し、文書識別モジュール４０は決定された連続領域及び関係をこれら所定の連続領域及び関係と比較する。最後に、この比較に基づいて、文書識別モジュール４０は捕捉画像（単数又は複数）が現在比較中の複数の文書タイプオブジェクトの１つ、すなわち文書タイプオブジェクト１７８に属するかを、例えば０〜１００に一元化した類似確度値（工程９７）によって決定する（工程１９４）。] 図９
[0080] 図１１Ａ〜１１Ｃは、図２の文書識別モジュール４０が図９のレイアウトマッチング処理１６４Ａを実行する際の捕捉画像の状態を示す例示的画像である。図１１Ａは、画像処理及び２値化（工程１８２）を受けた後の捕捉画像１９４Ａを示す。レイアウトマッチング処理１６４Ａの実行には必須ではないものの、このような画像処理を行うことによって、レイアウトマッチング処理１６４Ａを適用した結果は大きく向上し得る。図１１Ｂは、文書セグメンテーション（工程１８４）を受けた後の捕捉画像１９４Ｂを示す。文書識別モジュール４０はレイアウトマッチング処理１６４Ａによって実行され、捕捉画像１９４Ｂを複数の連続領域１９６Ａ〜１９６Ｎにセグメント化する。図１１Ｃは、捕捉画像の図式１９４Ｃを示し、複数の連続領域１９６Ａ〜１９６Ｎのそれぞれは、ノード１９８Ａ〜１９８Ｎの１つに写像される（工程１９０）。各ノード１９８Ａ〜１９８Ｎはまた、他のノード間の関係をも特定し得る。] 図１１Ａ図１１Ｂ図１１Ｃ図２図９
[0081] 捕捉画像が図式化されれば、文書識別モジュール４０はこの図式１９４Ｃを図９のテンプレートデータ１７６のようなテンプレートデータと比較し得る。文書識別モジュール４０は、レイアウトマッチング処理１６４Ａに従い、１つ以上の異なる比較を行い得る。例えば、文書識別モジュール４０は単純に、図式１９４Ｃ中における同タイプの領域の存在をテンプレートデータ１７６中における領域の存在と比較し得る。この領域タイプ比較に替えて、又は追加的に、文書識別モジュール４０は図式１９４Ｃをテンプレートデータ１７６内に格納された図式と、何らかの追加的な拘束、例えば寸法及び位置、又はより厳格には領域の空間的関係などによる比較を行ってもよい。この種の図式比較は、動的計画法アルゴリズムによる不完全図式マッチングなどにより迅速に行われ得る。図式比較の例によっては文書識別モジュール４０は、この比較について、図１の画像捕捉装置１１の環境及び文書タイプ１２に特定の限定、例えば限定移動及び回転制限、マスク化マッチング制限、欠落若しくは余分領域制限、動的コンテンツ制限、並びに不完全セグメンテーション及び印刷ずれ制限などを課し得る。これらの制限の１つ以上を適用することで、レイアウトマッチング識別処理１６４Ａの実行に必要な時間を著しく削減し得る。] 図１図９
[0082] 限定移動及び回転限度は、比較を受ける前に領域又は文書全体が回転し得る程度を限定する。マスク化マッチング制限は、特定の文書のいくつかの領域を除外することで必要な比較数を削減し得る。欠落又は余分領域制限はカスタマイズされた印刷又は、捕捉画像中の不鮮明若しくはノイズの多い画像の劣悪な画像処理によって生じた、欠落、融合、又は余分領域についての比較を停止し得る。動的コンテンツ制限は、氏名及び住所テキスト領域などの動的コンテンツを含む領域の評価に必要な関係数を削減し得る。不完全セグメンテーション及び印刷ずれ制限は、不適切にセグメント化された２つ以上のテキスト領域を組み合わせることで、被比較領域数を削減し得る。]
[0083] 図１２の右側は、レイアウトエディタ３０による固有画像分類器４７のトレーニング動作工程（工程２００〜２０８）を例示するフローチャートである。ＰＣＡ（ＰｒｉｎｃｉｐａｌＣｏｍｐｏｎｅｎｔＡｎａｌｙｓｉｓ主成分解析）とも呼ばれる情報圧縮スキームとして、固有画像方法は、多数の画像の表現複雑性を数個の正規直交固有画像へと効果的に低減し、迅速なオブジェクト認識及びその他のタスクを達成し得る。対象とする領域は文書全体、又は動的コンテンツをうまく除外する一部であってもよい。加えて、文書の前処理を利用して任意の動的コンテンツの影響を低減するようにしてもよい。] 図１２
[0084] いずれの場合も、第１の工程は、すべての可能な、又は選択的に典型的な画像テンプレートを収集することである（工程２００）。画像テンプレートについて収集されたテンプレートデータは、ゼロ平均に正規化され得る。次に、各列が異なる画像テンプレートの画像を格納したデータマトリックスを形成する（工程２０２）。各列中のエントリーのそれぞれは、１つのテンプレートの同じ部分的又は全領域を代表し得る。このデータマトリックスの共分散マトリックスにより固有ベクトルの集合が算出され、それぞれの固有値によってソートされる（工程２０４）。固有ベクトルは、テンプレートの元の画像データから得られたデータマトリックスから算出し、又はこのデータマトリックスの転置によってより低次元に縮小してよく、いずれの技法も数学的に等価の結果をもたらす。閾値を用い、十分に大きな固有値、すなわち所定の閾値を超える固有値を有する固有ベクトルのみを選択するようにしてもよい（工程２０６）。一例としてカットオフを適用し、最大固有値の１０％の範囲内にある固有値のみを選択するようにしてもよい。これらの選択された各固有ベクトルは、それぞれあたかも転置されたデータリックスから算出されたかのように、固有画像として写像しなおされ格納され得る。上述した処理は、典型的には非常に高次元である元の画像を低次元に落とすことで、正規直交固有ベクトルをはるかに迅速に見つけられるようにする、数学的単純化処理として見ることが可能である。この固有ベクトルはその後、高次の元の画像へと写像しなおされる。固有画像形式の最後の表現は、以下に説明するように、最終的に捕捉画像を適用するのが容易となり得る。この選択された正規直交固有画像の集合は、テンプレート画像データの元の集合を最小二乗誤差の形で最もよく表現するものと見てよい。]
[0085] 図１２の左側は、図２の文書識別モジュール４０が文書識別フレームワーク３４を走査し、図９の固有画像文書マッチング処理１６４Ｂを起動する動作工程を例示するフローチャートである（工程２１０〜２１６）。この処理工程のシーケンスは、（ｉ）データベースに格納された各文書サブタイプオブジェクトについて、文書テンプレート及び事前計算済みのリファレンス重み付け係数ベクトルを構築するために、リファレンス画像データに、又は（ｉｉ）文書タイプを識別するために捕捉画像データに、適用し得る（工程２１０）。] 図１２図２図９
[0086] 固有画像文書マッチング処理１６４Ｂの起動により、文書識別モジュール４０は固有画像文書マッチング処理１６４Ｂを実行し、上述したように選択された正規直交固有画像によって表現された捕捉画像の重み付け係数ベクトルを算出する（工程２１２）。これは、捕捉画像データベクトル（又はリファレンス画像データ）を選択正規直交固有画像によって構成されたデータマトリックスに乗じ、捕捉画像についての重み付け係数ベクトルを得ることによって行われる。すなわち、データマトリックスの各列は固有画像の１つを代表し、捕捉画像データベクトルを乗じることによって係数ベクトルが得られる。ここで、各係数は、正規直交固有画像によって形成された高次元空間内における捕捉画像の表現を代表する。次に、文書識別モジュール４０は捕捉画像データの重み付け係数ベクトルを、データベースに格納された複数の文書サブタイプオブジェクト、すなわち可能なリファレンス文書タイプのそれぞれの１つに関連付けられた、事前計算済みのリファレンス重み付け係数ベクトルと比較する（工程２１４）。これにより、２つのベクトルの距離又は類似性が、捕捉画像についての重み付け係数ベクトルと事前計算済みのリファレンス重み付け係数ベクトルとの関係で、算出される。典型的には、文書識別モジュール４０はこの距離を次の４つの標準距離計算アルゴリズムの１つによって算出し得る。すなわち、１）ユークリッド距離、２）ハミング距離、３）ＮＣＣ（正規化相互相関）、及び４）マハナロビス（Mahanalobis）距離で算出し得る。この距離に基づいて、文書識別モジュール４０は固有画像文書マッチング処理１６４Ｂにより、物品が現在比較を受けている複数の文書サブタイプオブジェクトの１つ、すなわち文書サブタイプオブジェクト１７０に属するかを決定する（工程２１６）。分類は、通常、最近傍（ＮＮ）（ｎｅａｒｅｓｔｎｅｉｇｈｂｏｒｈｏｏｄ）方法に基づく。この決定は、可能なリファレンス文書タイプオブジェクトのそれぞれについて、例えば０〜１００のような、統一したスケールで距離を表す確度値の形で行われ得る。この方法では、確度値は、捕捉画像の重み付け係数ベクトルと、可能なリファレンス文書のそれぞれについての重み付け係数ベクトルとの間の距離が所定の閾値を下回るかを表す。]
[0087] 図１３Ａ〜１３Ｃは、文書識別モジュール、例えば図２の文書識別モジュール４０が固有画像文書マッチング処理、例えば図９の固有画像文書マッチング処理１６４Ｂを実行する際の、図１３Ｃの捕捉画像２３０の状態を示す例示的画像である。図１３Ａ及び図１３Ｂは、この文書を識別する前に使用された例示的なトレーニング画像及び結果を示す。図１３Ａは、米国運転免許証の７つのサンプル、すなわちカリフォルニア州及びニューヨーク州の各２タイプ、ミネソタ州、モンタナ州、及びアメリカ合衆国の各１タイプの集合を示す。実際の用途においては、このテンプレート画像の集合は数百に迫るか、又はそれを上回り得る。レイアウトエディタ３０は、図１３Ｂに示すような、これらの固有画像及び固有値を算出する。この固有画像の集合は、元の７つのテンプレート画像を近似的に表現するため、より高い固有値を有するそれらの一部のみを用いて選択し得る。次いで、図１３の７つのテンプレート画像のそれぞれを、選択固有画像により構成されたマトリックスに乗じ、この文書サブタイプについてのテンプレートデータとしてのリファレンス重み付け係数ベクトルを得て、これをデータベース３２に格納する。] 図１３Ａ図１３Ｂ図１３Ｃ図２図９
[0088] 図１３Ｃの画像２３０を新たに捕捉したら、文書識別モジュール４０は図９の固有画像文書マッチング処理１６４Ｂを起動し、画像データを、選択固有画像によって構成された、上述の同じマトリックスに乗じて重み付け係数ベクトルを得る。固有画像文書マッチング処理は、この新たな重み付け係数ベクトルを、現在比較中の複数の文書サブタイプオブジェクト、すなわち、トレーニングに用いる図１３Ａの７つの米国運転免許証に関連付けられた、事前計算済みのリファレンス重み付け係数ベクトルのそれぞれと比較する。例えば、文書識別モジュール４０は、ハミング距離計算アルゴリズム又は他のアルゴリズムを用いて新規捕捉画像データの７つのテンプレート画像データへの距離を決定し、図１３Ｃに示す例示的結果２３２を得ることができる。] 図１３Ａ図１３Ｃ図９
[0089] 新規捕捉画像データについての結果２３２は、選択固有画像によりハミング距離アルゴリズムに従って決定された多次元空間において、ミネソタ州の文書サブタイプオブジェクトに関連したテンプレートデータからの最短距離５２８．２１を示す。この距離は他の６つの文書サブタイプオブジェクトに関連したものに比較してはるかに小さく、最近傍（ＮＮ）方法に基づいた文書分類において、より良好な一致を示している。]
[0090] 文書識別モジュール４０によって特定の文書タイプが認識された後に、図２の文書処理エンジン３６によって認証を行うための次の工程は、文書認証モジュール４２を起動し、要求される特徴の存在を確定することである。実際には、認証特徴は上述した識別特徴と交換可能な概念である。つまり、画像解析方法が検証器、確認器、又は更に分類器の実行にも適用し得る。基本的な指針としては、識別時間が最短で正しい文書タイプの拒絶率が最小の識別を行うため、できるだけ少数の可能な特徴を利用し、残りは、偽造品の許容確率がより低い識別済みの文書からのみ起動される、いわゆる認証処理に用いることである。] 図２
[0091] 偽造品を識別するために使用された印刷技術の特徴を取得するための例示的な検証方法として、ここでは３方法を提示する。原本を複製するために、写真式複写機などの代替的な印刷技術を用いることは、偽造の一般的な形態である。実際には、文書認証モジュール４２は、ここに提示する例示的な３技術以外にも多くの方法を用い得る。]
[0092] 例えば凹版印刷は、原本の印刷のためにドイツで１４３０年代までに発明されたが、今でも広く用いられている方法の１つである。この方法は板を彫り込み、又は切り込んで凹部を設け、これにインクを満たし、圧力をかけて紙に刷り込み領域を写し取ることで、刻んだ外観が３Ｄ効果をもって得られるものである。偽造によく用いられる安価な代替方法は、名刺の印刷に一般に用いられるようなサーモグラフ（盛り上げインク）である。]
[0093] ３Ｍ文書読取り器のＣＣＤカメラのような透視環境下で見ると、ある顕著な３Ｄ効果が捕捉され得る。３Ｍの名刺のサンプルにおけるように、図１４Ａの画像２４０がフラットベッドスキャナーによって得られるのに対し、図１の文書読取り器１１によって図１４Ｂの画像２４４が捕捉された。図１４Ｂに示すように、画像２４０は、文字からの影を含む３Ｄ効果を示す。] 図１図１４Ａ図１４Ｂ
[0094] 上記２つの画像における文字「Ｍ」の右足を水平に横切る方法の濃度変化プロファイルを取ると、ある顕著な相違が図１４Ａの画像２４２と図１４Ｂの画像２４６に見られる。すなわち、スキャナーにおいては、この線を横切る方向の濃度レベル変化は、図１４Ａのプロファイル２４２においては常に対象であるのに対し、ＣＣＤカメラ殻の場合には、図１４Ｂのプロファイル２４６に示すように、そうではない。濃い谷は内側に向かってカメラの起点位置へと偏移している。全視野にわたって測定すると、３Ｍの名刺について図１４Ｃに示したように、各谷が示す非対称な偏移は変化し、視野の基点からずれた距離との関係で定量化され得る。図示の例におけるずれの測定単位はミル（０．０２５４ｍｍ）である。] 図１４Ａ図１４Ｂ図１４Ｃ
[0095] この技術は、画像からの正確な３Ｄパラメータを測定することにより（例えばその線がどれだけ高く上がっているかは、図１４Ｃにおける傾斜がどれだけ急峻かによって決定し得る）、非対称性が存在するかを確定するために、いわゆる「陰影から立体」を起こす技術から容易に応用可能であり得る。] 図１４Ｃ
[0096] もう１つの印刷技術はエングレービング（engraving）である。これは、印刷表面に彫刻を施し、それによって上述した方法とは逆の光学的効果を得るものある。上述したプロファイリング技術は、そのような技法から得られる画像及び／又は文字の３Ｄ特徴を解析するためにも同様に利用し得る。]
[0097] 画像を紙又はその他の媒体に印刷する場合、連続的結像（例えば写真及びＩＤプリンター）に加え、連続色調画像をバイナリ画像（単数又は複数）によって模す、更に２つの複写技術が一般に使用される。すなわち、様々な大きさの等間隔に配置したドット（網点）を用いるハーフトーンスクリーニング技術（振幅変調）と、同じ大きさのドットを異なる位置及び密度で配置するストキャスティックスクリーニング技術（周波数変調）である。これらの印刷技術のサンプルを図１５Ａのサンプル画像２５０、２５２、及び２５４に示す。] 図１５Ａ
[0098] 規則的間隔のドットによるものについての測定では、画像構造解析からの共分散マトリックス方法が良好であるが、ストキャスティックスクリーニングについては高周波ノイズ又はエッジ検出が理想的な指標である。]
[0099] 別の例として、通常は多重画面によってカラー画像を再生することがあり、ハーフトーンスクリーニングにおいて、図１５Ｂのサンプル２５６及び図１５Ｂの拡大画像２５８に示すように、異なる角度のＣＭＹＫ４色平面によってロゼットパターンが構築される。] 図１５Ｂ
[0100] 図１５Ｃは、カラーＣＣＤカメラで捕捉した画像２５６のＲＧＢ平面を分解することによって生成されたサンプル画像２６０，２６２及び２６４の集合を示す。図１５Ｃの画像の集合は、同様に処理し得る、図１５Ｃのサンプル画像２６０，２６２及び２６４中の角度のついたスクリーンを示す。] 図１５Ｃ
[0101] 複製は文書偽造において最も一般的な例であるが、スキャンされたテキストはまた、図１５Ｄに連続色調方法による画像２６６、ハーフトーン方法による画像２６８、及びストキャスティックスクリーニング方法による画像２７０を比較対照して示すように、異なるスクリーニング方法を用いることによって変化する。この例では、線の幅及びエッジの曲率の変動に、スクリーニング方法によって元の文書の複製中に生じた文字変形がよく表れ得る。] 図１５Ｄ
[0102] 上述した伝統的な印刷技術に加え、多数の新しい方法が考案され、媒体上への画像の複写を制限するのみならず、他の情報を微細構造の形で伝えることで、偽造防止に更に役立っている。これらの方法の大部分はそれぞれに独自のアルゴリズムによってのみデコードされるが、経済的な解決として認証目的のため、画像処理中に一定の単純な特徴抽出法を用いてその特徴の存否を確定することもなお、可能である。いくつかの例を以下に述べる。]
[0103] 例えば、企業によっては、機械可読コード及び人間が読めるコンテンツの両方が識別できるように、人間が読めるコンテンツをオーバーレイした機械可読コードを含む文書をエンコード及びデコードする。実施に当たっては、グレースケール画像データ値に基づいたコード化されたグリフ色調セルを含む背景画像が作成される。ここで、図１６Ａに示すように、各ハーフトーンセルは、少なくとも２つの区別可能なパターンの１つを含む。] 図１６Ａ
[0104] 近年提唱された別の方法は、図１６Ｂの画像２８０に示すように、いくつかのドットを偏移させることで、通常のハーフトーンスクリーニング上に位相変調を施すことに基づく。この場合、同一のスクリーニング周波数を有するデコード用レンチキュラーレンズによって、図１６Ｂの画像２８２内にエンコードされた文字「ＳＩ」が見えるようになる。ここに述べた技術はこのような画像に容易に適用し得る。] 図１６Ｂ
[0105] もう１つの方法では、カラー又はグレースケール像面（単数又は複数）を、各層が他の層に対して異なった確度で配置された微細文字層に変換する。微細文字幅は、図１６Ｃ及びこれにオーバーレイした拡大図に示すように、グレースケール又は（多色の場合には）カラー値に基づいて、その幅に変調が施される。ここに述べた技術はこのような画像に容易に適用し得る。] 図１６Ｃ
[0106] このシステムがいかに迅速かつ効率的に文書を高精度で識別するかを紹介する一例として、図１７Ａ〜１７Ｃに、ＩＣＡＯ準拠のＭＲＺゾーンを用いることなく、２０６種の異なった米国運転免許証の集合から現行のニューヨーク州の運転免許証を識別かつ検証する処理を例証する。画像の属性を抽出及び再帰的に処理するために起動した、実装分類器及び確認器を下の表Ｉに列挙する。] 図１７Ａ図１７Ｂ図１７Ｃ
[0107] ]
[0108] 表Ｉの右欄は、それぞの光源を示す。このリストは計算効率順になっており、順に実行される。最後の２つは、文書中に予期される２つの画像パターン一致により定義される。]
[0109] 図１７Ｂは本実施例において、１つの検査で、各分類器又は確認器ごとにいくつの文書が精査されたかを示す。図示のように、空白分類器／確認器は、検査開始時、２０６種の候補すべてについて照査を行ったが、可視パターンマッチング分類器／確認器では正しい文書タイプである可能性のあるものはただ１つに限られている。図１７Ｂの曲線は、可能な候補が訳２００ミリ秒の間に、効率的に絞り込まれていく様子を例証している。図１７Ｃは各動作ごとの拒絶率を示し、これはこのタイプの文書に関しての文書識別フレームワーク上の識別成績を表す。ロゴパターンマッチング分類器／確認器は、１５の候補から１つの正しい文書を識別し他の１４を破棄ことで、拒絶率９３％という最高の成績を示す一方、これは比較的時間のかかる作業である。] 図１７Ｂ図１７Ｃ
[0110] 図１７Ａは、この文書が現行のニューヨーク州の運転免許証として識別された後に呼び出される成功認証結果の一部を示し、それぞれ赤外、可視、紫外、及び再帰反射による４つの画像中に予期される機密画像パターンを探査中の様子である。結果は、システムが識別及び継続検証の両方を完了後は、図８Ａに示したものと同様である。] 図１７Ａ図８Ａ
[0111] 本発明の様々な実施形態について説明してきた。これら及び他の実施形態は、以下の特許請求の範囲に含まれる。]

权利要求:

請求項1
未知の文書の１つ以上の捕捉画像を受信する工程と、前記捕捉画像から属性を抽出し前記未知の文書を文書タイプオブジェクトの１つに代表される文書タイプとして類別し確認するために複数の再帰的処理を参照する複数の文書タイプオブジェクトを、動的文書識別フレームワークに従ってデータ構造内に格納する工程と、前記データ構造の前記文書タイプオブジェクトを、前記複数の再帰的処理を前記捕捉画像に適用することにより抽出した前記属性に基づいて変更可能な順序で走査する工程と、前記データ構造の走査において前記未知の文書を前記複数の文書タイプオブジェクトの１つとして識別する工程と、を含む方法。
請求項2
捕捉画像を受信する工程が、赤外（ＩＲ）画像、可視光スペクトル画像、紫外（ＵＶ）画像、及び再帰反射画像の１つ以上を受信する工程を含む、請求項１に記載の方法。
請求項3
前記未知の文書の捕捉画像を受信する工程が、パスポート、運転免許証、出生証明書、金融書類、商業手形、身分証明書、及びソーシャルセキュリティー（社会保障）カードのうちの１つの捕捉画像を受信する工程を含む、請求項１に記載の方法。
請求項4
前記複数の文書タイプオブジェクトを格納する工程が、前記複数の文書タイプオブジェクトを動的文書識別フレームワークによる木データ構造内に格納する工程を含む、請求項１に記載の方法。
請求項5
前記複数の文書タイプオブジェクトを格納する工程が、前記複数の文書タイプオブジェクト及びサブタイプオブジェクトを前記動的文書識別フレームワークによるデータ構造内に、サブ文書タイプを前記文書タイプオブジェクトの子として備える再帰的方法で格納する工程を含む、請求項１に記載の方法。
請求項6
前記複数の文書タイプオブジェクトを格納する工程が、前記複数の処理の１つ以上を参照する分類器オブジェクトを格納する工程を含み、前記データ構造を走査する工程が、前記分類器オブジェクトを走査することで、前記分類器オブジェクトによって参照される１つ以上の処理を起動して可能なリファレンス文書タイプオブジェクトの集合を決定し、かつ前記集合を走査して前記捕捉画像を前記複数の可能なリファレンス文書タイプオブジェクトの１つとして識別する工程を含む、請求項１に記載の方法。
請求項7
前記複数の文書タイプオブジェクトを格納する工程が、最小確度値と、前記複数の処理の１つ以上を参照する確認器オブジェクトとを格納する工程を含み、前記集合を走査する工程が、前記確認器オブジェクトを走査することで、前記確認器オブジェクトによって参照される前記複数の処理の１つ以上を起動し、前記確認器オブジェクトによって参照される前記複数の処理の１つ以上を起動することから受信した１つ以上の戻り値から確度値を算出し、前記分類器オブジェクトにより前記リファレンス文書タイプオブジェクトと比較することによって前記未知の文書から抽出された属性を処理し、かつ前記確度値と最小確度値との比較に基づいて、前記集合から前記可能なリファレンス文書タイプオブジェクトの１つ以上を選択的に破棄する工程を含む、請求項６に記載の方法。
請求項8
前記複数の文書タイプオブジェクトを格納する工程が、それぞれ前記複数の処理の１つ以上を参照する第１及び第２の確認器オブジェクトを格納する工程を含み、前記集合を走査する工程が、前記第１の確認器オブジェクトを走査し、前記第１の確認器オブジェクトによって参照される前記処理を起動後に受信した結果値に基づいて第１の確度値を算出する工程と、前記第２の確認器オブジェクトを走査し、前記第２の確認器オブジェクトによって参照される前記処理を起動後に受信した結果値に基づいて第２の確度値を算出する工程と、前記第１及び第２の確度値の比較に基づいて、前記捕捉画像を前記複数の可能なリファレンス文書タイプオブジェクトの１つとして識別する工程とを含む、請求項６に記載の方法。
請求項9
前記複数の文書タイプオブジェクトを格納する工程が、複数の優先度を格納する工程と、前記複数の優先度のそれぞれを前記データ構造内の前記複数の文書タイプオブジェクト１つと関連付ける工程と、前記データ構造を走査する工程が、前記複数の可能なリファレンス文書タイプオブジェクトのそれぞれに関連した前記優先度に基づいて前記データ構造を走査する工程と、を含む、請求項６に記載の方法。
請求項10
最近確認された文書タイプオブジェクトの集合を待ち行列データ構造内に格納する工程を更に含み、前記データ構造を走査する工程が、前記データ構造内の最近確認された文書タイプオブジェクトの前記集合を走査する工程を含む、請求項６に記載の方法。
請求項11
前記データ構造を走査する工程が、前記複数の処理のレイアウトマッチング識別処理を起動し、前記捕捉画像の複数の連続領域をセグメント化及び識別し、前記複数の連続領域を分類し、前記複数の連続領域間の関係の集合を確立することによって前記捕捉画像を図式化し、前記複数の連続領域を前記複数の文書タイプオブジェクトの１つに関連したテンプレートデータと比較し、かつ前記比較に基づき、前記捕捉画像が、現在比較の対象となっている、前記複数の文書タイプオブジェクトの１つに属するかを決定する工程を含む、請求項６に記載の方法。
請求項12
前記データ構造を走査する工程が、前記複数の処理の固有画像文書マッチング処理を起動し、前記複数の可能なリファレンス文書タイプオブジェクトの固有画像及び固有値を算出し、より大きな固有値を有する、前記データ構造中に格納された前記リファレンス文書タイプオブジェクトの１つ以上を選択し、学習段階において前記データ構造中に格納された前記複数の可能なリファレンス文書タイプオブジェクトのそれぞれのリファレンス重み付け係数ベクトルを算出し、前記捕捉画像の重み付け係数ベクトルを算出し、前記画像と文書の重み付け係数ベクトルとを比較して距離を算出し、かつ前記距離に基づき、前記未知の文書が現在比較の対象となっている前記複数の可能なリファレンス文書タイプオブジェクトの１つに属するかを決定する工程を含む、請求項６に記載の方法。
請求項13
前記識別処理の結果が１つ以上の異なる文書タイプの候補リストを含み、候補リストが前記確度値に基づいて順序付けられたリストであり、前記識別処理の結果を、サブ文書タイプの継続処理を決定するための入力として使用する、請求項７に記載の方法。
請求項14
自動方法を適用して、サンプル画像から文書タイプのリファレンスデータを獲得する工程と、前記データ構造のノードによる起動のために前記リファレンスデータを格納する工程と、動的方法を適用して前記未知の文書を前記データ構造内の文書の１つとして類別し、継続処理及び前記データ構造の走査を誘起する工程と、を更に含む、請求項１に記載の方法。
請求項15
識別された文書の真正性を確定する工程が、前記未知の文書の印刷方法が凹版印刷又はエングレービング印刷技術によるものである可能性を評価する第１の方法、画像及びテキストの印刷に用いられたスクリーニング方法を判別する第２の方法、又は前記未知の文書の印刷材料が微細構造を含むかを評価する第３の方法の１つ以上を起動する工程と、前記可能性に基づいて、前記識別された文書が真正のものであるか否かを決定する工程と、を含む、請求項１に記載の方法。
請求項16
前記未知の文書を、無線自動識別（ＲＦＩＤ）データ、電子パスポートデータ、スマートカードデータ、又は磁気ストリップデータの１つ以上を含む埋め込み電子情報を組み込んだ機密文書として識別及び確認する工程を更に含む、請求項１記載の方法。
請求項17
ユーザーに視覚又は音声形式でフィードバックを提示することを含む、識別及び確認処理の結果を前記ユーザーに提示する工程を更に含む、請求項１記載の方法。
請求項18
未知の文書から１つ以上の画像を捕捉する画像捕捉インターフェースと、前記捕捉画像から属性を抽出するために複数の再帰的処理を参照する複数の文書タイプオブジェクトを、動的文書識別フレームワークに従ってデータ構造内に格納するメモリと、前記データ構造の前記文書タイプオブジェクトを、前記複数の再帰的処理を前記捕捉画像に適用することにより抽出した前記属性に基づいて変更可能な順序で走査し、前記データ構造の走査において前記未知の文書を前記複数の文書タイプオブジェクトの１つとして識別する文書処理エンジンと、を含む、機密文書認証装置。
請求項19
前記画像捕捉インターフェースが、赤外（ＩＲ）画像、可視光スペクトル画像、紫外（ＵＶ）画像、及び再帰反射画像の１つ以上を受信することによって前記捕捉画像を受信する、請求項１８に記載の機密文書認証装置。
請求項20
前記画像捕捉インターフェースが、パスポート、運転免許証、出生証明書、金融書類、商業手形、身分証明書、ソーシャルセキュリティーカードのうちの１つの捕捉画像を受信することによって前記未知の文書の前記捕捉画像を受信する、請求項１８に記載の機密文書認証装置。
請求項21
前記メモリが、前記複数の文書タイプオブジェクトを動的文書識別フレームワークに従って木データ構造内に格納することにより前記複数の文書タイプオブジェクトを格納する、請求項１８に記載の機密文書認証装置。
請求項22
前記メモリが、複数の文書タイプ及びサブタイプオブジェクトを動的文書識別フレームワークに従って、再帰的方法による処理のための親及び子ノードとして相互結合された状態で前記データ構造内に格納することにより、前記複数の文書タイプオブジェクトを格納する、請求項１８に記載の機密文書認証装置。
請求項23
前記文書処理エンジンが、前記データ構造を走査する文書識別モジュールを含む、請求項１８に記載の機密文書認証装置。
請求項24
前記メモリが、前記複数の処理の１つ以上を参照する分類器オブジェクトを格納することによって前記複数の文書タイプオブジェクトを格納し、前記文書識別モジュールが、前記分類器オブジェクトによって参照される１つ以上の処理を起動して可能なリファレンス文書タイプオブジェクトの集合を決定することと、前記集合を走査して前記捕捉画像を前記複数の文書タイプオブジェクトの１つとして識別することと、によって前記データ構造を走査する、請求項２３に記載の機密文書認証装置。
請求項25
前記メモリが、最小確度値と、前記複数の処理の１つ以上を参照する確認器オブジェクトを格納することによって前記複数の文書タイプオブジェクトを格納し、前記文書識別モジュールが、前記確認器オブジェクトの集合にアクセスし、前記文書識別モジュールが、前記確認器ノードによって参照される前記複数の確認器処理を起動し、前記確認器オブジェクトにより参照される処理を起動することから得られる戻り値の１つ以上から確度値を算出し、かつ前記確度値と前記最小確度値との比較に基づいて、前記可能なリファレンス文書タイプオブジェクトの１つ以上を前記集合から選択的に破棄することによって、前記集合を走査することとする、請求項２４に記載の機密文書認証装置。
請求項26
前記メモリが、それぞれ複数の確認器処理の１つ以上を参照する、２つの確認器オブジェクトを格納することによって、前記複数の文書タイプオブジェクトを格納し、前記文書識別モジュールが、前記第１の確認器オブジェクトを走査することで、前記文書識別モジュールが、前記第１の確認器オブジェクトによって参照される前記確認器処理を起動後に受信した結果値に基づいて第１の確度値を算出し、前記第２の確認器オブジェクトを走査することで、前記文書識別モジュールが、前記第２の確認器オブジェクトによって参照される前記確認器処理を起動後に受信した結果値に基づいて第２の確度値を算出し、かつ前記第１及び第２の確度値の比較に基づいて前記捕捉画像を前記リファレンス文書タイプオブジェクトの前記複数の文書タイプの１つとして識別することによって、前記集合を走査する、請求項２４に記載の機密文書認証装置。
請求項27
前記メモリが、複数の優先度を更に格納し、前記複数の優先度のそれぞれを前記データ構造内の前記複数の文書タイプオブジェクトの１つに関連付け、前記文書識別モジュールが、前記複数の文書タイプオブジェクトのそれぞれに関連した前記優先度に従って前記データ構造を走査することにより前記データ構造を走査する、請求項２４に記載の機密文書認証装置。
請求項28
前記メモリが更に、最近確認された文書タイプオブジェクトの集合を待ち行列データ構造内に格納し、前記文書識別モジュールが、前記データ構造内の、前記最近確認された文書タイプオブジェクトの集合をまず走査することにより前記データ構造を走査する、請求項２４に記載の機密文書認証装置。
請求項29
前記文書識別モジュールが、前記複数の処理の固有画像文書マッチング識別処理を起動することにより前記データ構造を走査し、これにより前記処理によって前記文書識別モジュールが、前記捕捉画像の複数の連続領域をセグメント化及び識別し、前記複数の連続領域を分類し、前記複数の連続領域間の関係の集合を確立することによって前記捕捉画像を図式化し、前記複数の連続領域を前記データ構造に格納された前記複数の文書タイプオブジェクトの１つに関連したテンプレートデータと比較し、かつ前記比較に基づき、前記捕捉画像が、現在比較の対象となっている前記複数の文書タイプオブジェクトの１つに属するかを決定する、請求項２４に記載の機密文書認証装置。
請求項30
前記文書識別モジュールが、前記複数の処理の固有画像文書マッチング処理データ構造を起動することによって前記データ構造を走査することで、複数のリファレンス文書タイプオブジェクトの固有画像及び固有値を算出し、大きな固有値を有する、前記リファレンス文書タイプオブジェクトの１つ以上を選択し、前記学習段階において前記データ構造中に格納された前記複数の可能なリファレンス文書タイプオブジェクトのそれぞれのリファレンス重み付け係数ベクトルを算出し、前記捕捉画像の重み付け係数ベクトルを算出し、前記画像と文書の重み付け係数ベクトルを比較して距離を算出し、前記距離に基づき、前記未知の文書が現在比較の対象となっている前記複数のリファレンス文書タイプオブジェクトの１つに属するかを決定する、請求項２４に記載の機密文書認証装置。
請求項31
プログラマブルプロセッサに、未知の文書の捕捉画像を受信させ、複数の処理を参照する複数の文書タイプオブジェクトを、動的文書識別フレームワークに従ってデータ構造内に格納させ、かつ前記複数の処理の１つ以上を選択的に起動することによって前記データ構造を走査させ、前記捕捉画像に基づいて未知の文書を前記複数の文書タイプオブジェクトの１つとして識別させるための、命令を含む、コンピュータ可読媒体。

类似技术:
公开号 | 公开日 | 专利标题
US10440219B2|2019-10-08|Apparatus and methods for computerized authentication of electronic documents
US10607073B2|2020-03-31|Systems and methods for classifying payment documents during mobile image processing
US9769354B2|2017-09-19|Systems and methods of processing scanned data
US9946865B2|2018-04-17|Document authentication based on expected wear
Piva2013|An overview on image forensics
US9754164B2|2017-09-05|Systems and methods for classifying objects in digital images captured using mobile devices
EP2897082B1|2019-07-31|Methods and systems for improved license plate signature matching
US10242285B2|2019-03-26|Iterative recognition-guided thresholding and data extraction
US10354472B2|2019-07-16|Self-learning system and methods for automatic document recognition, authentication, and information extraction
US20160253359A1|2016-09-01|Efficient image matching for large sets of images
CN102144236B|2013-08-21|用于图像和视频ocr的文本定位
USRE44139E1|2013-04-09|Method and apparatus for decoding mixed code
US8189862B2|2012-05-29|Visible authentication patterns for printed document
JP4557866B2|2010-10-06|混合コード、及び、混合コードの生成方法と装置、記録媒体
JP4515999B2|2010-08-04|混合コードのデコーディング方法及びその装置、記録媒体
US10552848B2|2020-02-04|Method and system for determining whether a barcode is genuine using a deviation from an idealized grid
US7711140B2|2010-05-04|Secure recorded documents
US5845008A|1998-12-01|Image processing device and method for identifying an input image, and copier scanner and printer including same
JP2016540329A|2016-12-22|２次元バーコードおよびそのようなバーコードの認証方法
US5293429A|1994-03-08|System and method for automatically classifying heterogeneous business forms
US8666174B2|2014-03-04|Techniques for shape clustering and assignment of character codes in post optical character recognition processing
US7031519B2|2006-04-18|Orthogonal technology for character recognition
US8744196B2|2014-06-03|Automatic recognition of images
Alkawaz et al.2018|Detection of copy-move image forgery based on discrete cosine transform
US6370271B2|2002-04-09|Image processing apparatus and methods for pattern recognition

同族专利:
公开号 | 公开日
BRPI0819426A2|2015-05-05|
TW200929013A|2009-07-01|
EP2232399A4|2016-03-23|
WO2009075987A3|2009-08-13|
US20090152357A1|2009-06-18|
AU2008335637B2|2012-02-02|
TWI484421B|2015-05-11|
CA2708588A1|2009-06-18|
KR20100101141A|2010-09-16|
EP2232399A2|2010-09-29|
US8540158B2|2013-09-24|
IL206309D0|2010-12-30|
NZ586077A|2012-09-28|
CN101925904A|2010-12-22|
MX2010006496A|2010-09-07|
ZA201004858B|2011-03-30|
AU2008335637A1|2009-06-18|
WO2009075987A2|2009-06-18|

引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题

法律状态:

优先权:
申请号 | 申请日 | 专利标题

[返回顶部]

相关专利
Sulfonates, polymers, resist compositions and patterning process Washing machine Washing machine Device for fixture finishing and tension adjusting of membrane Structure for Equipping Band in a Plane Cathode Ray Tube Process for preparation of 7 alpha-carboxyl 9, 11-epoxy steroids and intermediates useful therein an

国家/地区