专利摘要:
本願は、機密文書を動的文書識別フレームワークに従って識別及び検証する技術を開示する。例えば、機密文書認証装置は、文書の捕捉画像を受信する画像捕捉インターフェースと、複数の文書タイプオブジェクトを動的文書識別フレームワークに従ってデータ構造内に格納するメモリとを含む。機密文書認証装置はまた、複数の処理の1つ以上を選択的に起動することにより捕捉画像をデータ構造を複数の文書タイプオブジェクトの1つとして識別する走査する文書処理エンジンを含む。従来の識別技術に反し、動的文書識別フレームワークに従って格納されたデータ構造を走査することにより実行されるこの識別方法は、適応可能な処理のみが捕捉画像の識別に適応され得ることから、より正確な識別結果をより効率的な方法で提供し得る。文書タイプが識別されたら、1つ以上の確認器を適用して更に文書の真正性を確定する。
公开号:JP2011510365A
申请号:JP2010538020
申请日:2008-11-12
公开日:2011-03-31
发明作者:イー. マクレーン,ジェイムズ;レイ,イーウ
申请人:スリーエム イノベイティブ プロパティズ カンパニー;
IPC主号:G06T7-00
专利说明:

[0001] 本発明は、柔軟な文書検証フレームワークを用いた、パスポート、運転免許証、出生証明書、又は金融書類などの機密文書のコンピュータ利用識別及び検証に関する。]
背景技術

[0002] 機密文書からの情報を捕捉、識別、検証、及び抽出するため、コンピュータ利用技術を用いることがますます盛んになっている。例えば、電子パスポート読取り器などの機密文書読取り器を導入して機密文書を読取り、その真正性を確定することがより一般的になりつつある。機密文書の例としては、パスポート、クレジットカード、身分証明書、運転免許証、出生証明書、商業手形、及び金融書類が挙げられる。機密文書によっては、ICAO(国際民間航空機関)が機密文書をコンピュータ利用技術によって識別するための明確な手順を提供している。他の機密文書については、コンピュータ利用技術によってICAO非準拠の機密文書を識別する際に拠り所とし得るような標準は存在しない。]
[0003] 一般に、所与の機密文書の真正性を確定する前に、まず機密文書のタイプを識別する必要がある。例えば、最新の機密文書読取り器によっては、様々な国が発行したパスポートのように、多様な異なる機密文書タイプをサポートしている。例えば機密文書が真正のパスポートであると確定するためには、認証しようとしているパスポートが具体的にどの国のどの版のものであるかをまず決定する必要がある。イギリスのパスポートの認証には、例えばオーストラリアのパスポートと比較すると、異なったアルゴリズムの適用、及び/又は、パスポート上の異なる部分の解析をする必要があり得る。より具体的には、異なる機密文書の認証のためには、機密文書読取り器は、文書の寸法、静止画像パターン、及び/又は、文書の特定部分及び/又はバーコード、機械可読ゾーン、若しくはRFIDチップ等の記憶媒体の特定部分から収集した情報を解析するものを含む、多種多様なアルゴリズムを利用し得る。]
発明が解決しようとする課題

[0004] 最初に機密文書タイプを識別する処理は、ICAO非準拠文書にとっては極めて困難なものであり得る。1つのアプローチでは、文書の真正性を確定する処理に先立って、作業者が手動で機密文書タイプを選択する必要がある。このアプローチはしかしながら、過酷な作業であり、大量の機密文書を処理する環境においては誤りも生じやすい。]
[0005] 代案として、機密文書のタイプを自動的又は半自動的に識別するために、ある種のコンピュータ利用技術を適用することも可能である。しかしながら、これまでのところ、このような技術は典型的には事実上静的である(つまり柔軟性なく定義されている)。すなわち、文書認証システムは第1のタイプの機密文書を検査するために第1のアルゴリズムを適用するよう、静的にプログラムされ得る。第1の検査が失敗すれば、文書認証システムは第2のタイプの機密文書を検査するために第2のアルゴリズムを適用する。機密文書が認証されるか又は拒絶されるまで、この静的処理が順次続けられる。この静的アプローチは、その硬直した性質と長い所要処理時間ゆえに、多数の異なる文書タイプをサポートするよう設計される文書認証システムには適さず、このようなシステムの拡張性を制限する恐れがある。]
課題を解決するための手段

[0006] 一般的には、本発明は、拡張可能、効率的、かつ動的な文書識別フレームワークによる、機密文書、より広くは物品の識別及び検証のための技術に関する。すなわち、機密文書の異なるタイプを容易に定義し得る、拡張可能なソフトウェアフレームワークが記述され、このフレームワークは大量の異なるタイプの機密文書の効率的な識別及び検証に適応するよう容易に拡張され得る。更に、文書の各タイプの識別に必要なアルゴリズムを容易に追加し、共通の、再利用可能な文書識別ソフトウェアモジュールの集合から選択し得る。一実施形態では、文書識別ソフトウェアモジュールは論理的に、「分類器」、「確認器」、及び「検証器」に分けられる。文書識別フレームワークは、階層的な、木状構造として組織されたノードの集合を含み、これを走査することにより、文書が、再利用可能な文書識別ソフトウェアモジュールの適用に基づいて文書タイプ及びサブタイプに分けられる。]
[0007] ある文書タイプを識別する際、木の各親ノードにおける分類器による結果に基づいて、文書処理エンジンが階層的文書識別フレームワークを通して選択的にパスを走査する。すなわち、1つ以上の計算効率のよい分類器を階層的な文書識別フレームワーク内の各親ノードに適用して、そのノードのいずれかの子ノードの走査を行うかを決定し得る。分類器(単数又は複数)は未知の文書の一般的特徴を、サブ文書タイプを表す子ノードの特徴と比較する。所与のノードの分類器は、可能なリファレンス文書オブジェクトタイプを表す子ノードをゼロ以上含み得る部分集合を(例えばリストの形で)戻す。]
[0008] 階層的な文書識別フレームワークを走査中に、より集約的な計算による確認器を部分集合中の子ノードの各々に適用して一層の制約を加えることにより、機密文書が分類器によって識別された子ノードに適合した特徴を有することを高い精密度で更に確定するようにしてもよい。本開示で述べるように、子ノードの評価の順序は確実度又は類似度に基づいてよく、未知の文書に対して最高の類似度を有する子ノードが選択され得る。実施形態によっては、確実度又は類似度の閾値に達しないうちは、いずれの子ノードをも、未知の文書に一致可能なものと見なすことはできない。いったん選択されれば、子ノードは親ノードと見なされ、引き続き走査処理が再帰的に行われ、新しい親ノードについて分類器及び確認器が再び適用される。]
[0009] あるリーフノード(leaf node)に達したら、この最終の親が識別結果と見なされる。この時点で、機密文書の真正性を確定するために、結果として得られた識別ノードに対して1以上の検証器の集合が適用される。検証器は、典型的には画像比較アルゴリズムを用いて未知の文書のいずれかの機密特徴を1つ以上の既知のリファレンスと比較し、確実度又は類似度を戻す。類似度が認証閾値を超えていれば、未知の文書は真正確定と見なされる。]
[0010] この方法では、文書識別モジュールにより定義されたアルゴリズムが適用される順序(すなわちフレームワークが走査される方法)は、その機密文書の特定の属性に基づいて動的である。このアプローチにより、容易に拡張して、機密文書の何百、又は更に何千という文書タイプをサポートすることが可能な、効率的で拡張可能な文書認証システムが提供される。]
[0011] 例えば、機密文書の識別及び継続検証には、機密文書からのデータ、例えば機械可読ゾーン(MRZ)、バーコード、磁気ストリップ、テキストコンテンツ、画像認証、又は機密文書に埋め込まれた無線自動識別(RFID)チップからのデータを利用し得る。本開示に記述した原理によれば、機密文書認証システムはフレームワークによって定義された分類器及び確認器が階層的フレームワークを走査し、機密文書からのデータを処理して、機密文書が特定の識別特徴を含むかを決定する。このフレームワークの階層的な性質は、文書タイプのカテゴリー及びサブカテゴリーの識別に再利用可能な文書分類器を用いていることとも相まって、多くの異なったタイプの文書をサポートする環境においても機密文書を迅速かつ効率的に識別することを可能にする。本開示に記述した技術は、必要な比較回数を絞り込むことによって機密文書を迅速に識別した後、機密文書の真正性を確定する方法で、現在世界中で使用されている機密文書数の増大にかかわらず、動的文書識別フレームワークを維持するのに特に有用であり得る。]
[0012] 例えば、本発明の技術は機密文書認証装置として具体化し得る。この装置は、物品の捕捉画像(単数又は複数)を受信する画像捕捉インターフェースと、複数の文書タイプオブジェクトを動的文書識別フレームワークに従ってデータ構造内に格納するメモリとを含み得る。機密文書認証装置はまた、複数の処理の1つ以上を選択的に起動することによりデータ構造を走査し、機密文書を複数の文書タイプオブジェクトの1つとして識別する、文書処理エンジンを含む。通常はデータ構造は、捕捉画像(単数又は複数)と文書タイプオブジェクトとの間の比較回数を大幅な低減を可能にするために木状データ構造を含む。更に、木データ構造のような動的データ構造を用いることによりデータ構造は、その数を増大させつつある機密文書を扱うよう容易に拡張することができ、実行時に追加的なデータ構造に迅速に対応するため、動的に適応し得る。]
[0013] 一実施形態では、方法は未知の文書の1つ以上の捕捉画像を受信する工程と、複数の文書タイプオブジェクトを動的文書識別フレームワークに従ってデータ構造内に格納する工程とを含み、複数の文書タイプオブジェクトは、捕捉画像から属性を抽出して未知の文書を文書タイプオブジェクトの1つに代表される文書タイプとして類別し確認するために複数の再帰的処理を参照する。方法は、データ構造の文書タイプオブジェクトを、複数の再帰的処理を捕捉画像に適用することにより抽出した属性に基づいて変更可能な順序で走査する工程と、データ構造の走査において未知の文書を複数の文書タイプオブジェクトの1つとして識別する工程とを更に含む。]
[0014] 別の実施形態では、機密文書認証装置は、未知の文書の1つ以上の画像を捕捉する画像捕捉インターフェースと、複数の文書タイプオブジェクトを動的文書識別フレームワークに従ってデータ構造内に格納するメモリとを含み、複数の文書タイプオブジェクトは、捕捉画像から属性を抽出するために複数の再帰的処理を参照する。装置は、データ構造の文書タイプオブジェクトを、複数の再帰的処理を捕捉画像に適用することにより抽出した属性に基づき変更可能な順序で走査する文書処理エンジンを更に含み、文書処理エンジンは、データ構造の走査において未知の文書を複数の文書タイプオブジェクトの1つとして識別する。]
[0015] 別の実施形態では、本発明は、命令を収容したコンピュータ可読媒体を目的とする。命令によりプログラマブルプロセッサが物品の捕捉画像を受信し、複数の文書タイプオブジェクトを動的文書識別フレームワークに従ってデータ構造内に格納する。ここで、複数の文書タイプオブジェクトは複数の処理を参照する。命令によりプロセッサは更に、複数の処理の1つ以上を選択的に起動することによってデータ構造を走査することで、捕捉画像を複数の文書タイプオブジェクトの1つとして識別する。]
[0016] 本発明の1つ以上の実施形態の詳細を、添付図及び以下の説明で明らかにする。本発明の他の特徴、目的、及び利点は、説明及び図面、並びに特許請求の範囲から明らかとなるであろう。]
図面の簡単な説明

[0017] 本発明の原理に従って機密文書12を解析するための例示的な文書認証システム10を示す略図。
本発明の原理による動的文書識別フレームワークに従って物品を確認する例示的なホストシステムを示すブロック図。
図1の文書認証システムの例示的な動作を示すフローチャート。
図2のホストシステム20の例示的な動作を更に詳細に示すフローチャート。
図2の文書識別フレームワークをより詳細に示すブロック図。
文書識別フレームワークを走査中の、文書識別モジュールの例示的な動作を示すフローチャート。
文書識別フレームワークのためのユーザーインターフェースにより、ディスプレイを介してユーザーに提示されるウィンドウのスクリーンショット。
文書識別フレームワークのためのユーザーインターフェースにより、ディスプレイを介してユーザーに提示されるウィンドウのスクリーンショット。
文書識別フレームワークのためのユーザーインターフェースにより、ディスプレイを介してユーザーに提示されるウィンドウのスクリーンショット。
ホストシステムが識別及び継続検証をともに完了した後に、ユーザーインターフェースによってディスプレイを介してユーザーに提示されるウィンドウのスクリーンショット。
ホストシステムが識別及び継続検証をともに完了した後に、ユーザーインターフェースによってディスプレイを介してユーザーに提示されるウィンドウのスクリーンショット。
図2のホストシステムのメモリ構造の一部をより詳細に示すブロック図。
レイアウトマッチング識別処理を起動するために文書識別フレームワークを走査中の、文書識別モジュールの例示的な動作を示すフローチャート。
文書識別モジュールによるレイアウトマッチング識別処理の実行中における、捕捉画像の状態を示す例示的な画像。
文書識別モジュールによるレイアウトマッチング識別処理の実行中における、捕捉画像の状態を示す例示的な画像。
文書識別モジュールによるレイアウトマッチング識別処理の実行中における、捕捉画像の状態を示す例示的な画像。
固有画像(Eigenimage)文書マッチング処理を起動するために文書識別フレームワークを走査中の文書識別モジュールの例示的な動作を示すフローチャート。
文書識別モジュールが固有画像文書マッチング処理を実行中に捕捉された画像の状態を示す例示的な画像。
文書識別モジュールが固有画像文書マッチング処理を実行中に捕捉された画像の状態を示す例示的な画像。
文書識別モジュールが固有画像文書マッチング処理を実行中に捕捉された画像の状態を示す例示的な画像。
捕捉画像及び画像中の文字についての濃度変化プロファイルを示すことによる、文書検証モジュールとしての例示的画像。
捕捉画像及び画像中の文字についての濃度変化プロファイルを示すことによる、文書検証モジュールとしての例示的画像。
捕捉画像及び画像中の文字についての濃度変化プロファイルを示すことによる、文書検証モジュールとしての例示的画像。
印字見本技術及びその解析を示すことによる、文書検証モジュールとしての例示的画像。
印字見本技術及びその解析を示すことによる、文書検証モジュールとしての例示的画像。
印字見本技術及びその解析を示すことによる、文書検証モジュールとしての例示的画像。
印字見本技術及びその解析を示すことによる、文書検証モジュールとしての例示的画像。
印字見本技術及びその解析を示すことによる、文書検証モジュールとしての例示的画像。
印字見本技術及びその解析を示すことによる、文書検証モジュールとしての例示的画像。
印字見本技術及びその解析を示すことによる、文書検証モジュールとしての例示的画像。
206の異なる米国の運転免許証の集合から、ICAO準拠のMRZを用いずにニューヨーク州の運転免許証の現行版を識別及び検証する際における、システムの効率性及び高い精度を実証するもの。
206の異なる米国の運転免許証の集合から、ICAO準拠のMRZを用いずにニューヨーク州の運転免許証の現行版を識別及び検証する際における、システムの効率性及び高い精度を実証するもの。
206の異なる米国の運転免許証の集合から、ICAO準拠のMRZを用いずにニューヨーク州の運転免許証の現行版を識別及び検証する際における、システムの効率性及び高い精度を実証するもの。] 図1 図2
実施例

[0018] 図1は、本発明の原理に従って機密文書12を解析するための例示的な文書認証システム10を示す略図である。文書認証システム10は、電子パスポート文書読取り器などの文書読取り器11に結合したホストシステム20を含む。文書読取り器11は画像捕捉装置として機能し、機密文書12が有効かつ真正な機密文書であると確定する。本開示に記述するように、文書読取り器11は多種多様な機密文書のタイプをサポートする。認証作業の一環として、文書読取り器11はまず、装置に挿入された機密文書の具体的なタイプを識別する。例えば、機密文書12は、米国のパスポート、米国の特定の州の運転免許証、米国の特定の州の身分証明書、欧州連合(EU)の運転免許証、EUの身分証明書、パスポート、又は世界中における特定の州若しくは国家政府機関が発行した身元確認書類、権利証券、身分証明書、その他の多様な文書タイプであり得る。機密文書のタイプを識別した後、文書認証システム10は、次いで機密文書12の検証及び機密文書12からの情報抽出へと進む。] 図1
[0019] 例えば、文書認証システム10のホストコンピュータシステム20を使用して、はじめに機密文書12の全体又は一部の1つ以上の画像のシーケンスを捕捉するよう、文書読取り器11に命令し得る。次に、2段階処理を用いることにより、文書認証システム10が、まず機密文書のタイプを識別し、次いで、捕捉画像データの解析に基づき(場合によっては機密文書から得られた他のデータも用いて)、機密文書12が識別されたタイプの有効な文書であると確定する。例えば、機密文書12から捕捉したスキャン画像データに加え、文書認証システム10は、1つ以上の機械可読ゾーン(例えばバーコード)から受信したデータ、文書内に埋め込まれ、若しくは文書に取り付けられた無線自動識別(RFID)チップ文書、又は文書が提供するその他の情報源から受信したデータを用いてもよい。]
[0020] 本開示に記述するように、ホストコンピュータ20は、機密文書の多種多様なタイプをサポートするよう容易に拡張及び修正可能な、動的文書識別フレームワークを用いた文書処理エンジンに、動作環境を提供する。すなわち、文書識別フレームワークは、機密文書の異なったタイプにわたって容易に識別アルゴリズムを追加、定義、及び活用できる環境を提供する。文書処理エンジンは必要に応じてフレームワークと相互作用して様々なアルゴリズムを起動し、機密文書12を類別し、かつ最終的には、その後の認証に必要とされる特定の文書タイプ、例えば特定の機関が発行した特定の特徴及びレイアウト特徴を有する機密文書として識別する。]
[0021] 文書認証システム10は、機密文書をスキャンし、機密文書12の全体又は一部から1つ以上の画像のシーケンスを捕捉することにより、機密文書12の識別処理を開始する。次に、文書認証システム10は、動的文書識別フレームワークに従って、複数の文書タイプオブジェクトを定義するデータを格納したデータ構造を走査する。複数の文書タイプオブジェクトは、ノード形式で階層的に配置され、それぞれ機密文書タイプのカテゴリー又はサブカテゴリーを代表す。各オブジェクトは、複数の実行可能な文書識別ソフトウェアモジュール(すなわち、カテゴリー及びサブカテゴリーに類別しかつ最終的には特定の文書タイプを識別、認証するために必要なアルゴリズムを提供する「分類器」、「確認器」、及び「検証器」)のいずれをも参照し得る(すなわち、それらへのポインタを含み得る)。例えば、これらの文書識別ソフトウェアモジュールはそれぞれ、典型的には、文書の1つ以上の属性を決定する機能を備えた、関連文書識別アルゴリズムを実行する。問題の属性が特定の機密文書12内に存在するかに基づき、処理エンジンは文書フレームワークを走査し、継続する分類器を選択し適用する。例示的な文書識別ソフトウェアモジュールとしては、固有画像文書マッチングアルゴリズム又は文書レイアウトマッチングアルゴリズムが挙げられ、その両方が以下で更に詳細に記述される。]
[0022] 文書識別フレームワークのデータ構造を走査中に、文書認証システム10は、複数の文書識別ソフトウェアモジュールの1つ以上を起動し、捕捉画像データの部分を処理し、及び/又は追加データを得るために機密文書12に問い合わせを行う。例えば、文書タイプの識別中、文書認証システム10の文書処理エンジンは、階層的文書識別フレームワークのルートノード(root node)から開始して引き続き、フレームワーク内の各親ノードにおいて分類器によって定義されたアルゴリズムの結果に基づき、フレームワークのノードを通して選択的にパスを走査する。すなわち、1つ以上の計算効率のよい分類器を階層的な文書識別フレームワーク内の各親ノードに適用し、その親ノードのいずれかの子ノードへのパスを走査するかを決定し得る。これらの分類器は、子ノードによって表されるサブ文書タイプの特徴を参照し、パス選択のための一般比較に用いられる。分類器は未知の文書の一般的特徴を、サブ文書タイプを表す子ノードの特徴と比較する。所与のノードの分類器は、可能なリファレンス文書オブジェクトタイプを表す子ノードをゼロ以上含み得る部分集合を(例えばリストの形で)戻す。分類器は、リンクインデックスの形で格納され、可能なリファレンス文書オブジェクトタイプを戻し得る。]
[0023] 階層的な文書識別フレームワークの走査中に、親ノード、子ノード又はその両方に関連した確認器が、より高レベルの分類器によって抽出された属性に適用され、機密文書が分類器によって選択された子ノードとして適正な特徴を有することを、更に確定し得る。確認器は、ノード自体によって代表される文書タイプの特徴を参照し、更に識別処理においても用いられる。確認器によって特定されるアルゴリズムは、正確な識別結果を得るために、この特定の文書タイプに対してより厳密な制約を課す。確認器によって特定されるアルゴリズムはまた、分類器によって特定されるアルゴリズムよりもより集約的計算であり得る。分類器と確認器との組み合わせにより、高速性と正確性、両方の要求のバランスの取れた、効率的かつ柔軟な構造が得られる。本開示で述べるように、子ノードの評価の順序は確実度又は類似度に基づいてよく、未知の文書に対して最高の類似度を有する子ノードが選択され得る。実施形態によっては、確実度又は類似度の閾値に達しないうちは、いずれの子ノードをも、未知の文書に一致可能なものと見なすことはできない。いったん選択されれば、子ノードは親ノードと見なされ、引き続き走査処理が再帰的に行われ、新しい親ノードについて分類器及び確認器が再び適用される。]
[0024] リーフノード(すなわちフレームワーク中のノードで子ノードを1つも持たないもの)に到達した時点で、機密文書の真正性を確定するために、1つ以上の検証器の集合が適用される。検証器は、リーフノードによって表される文書タイプの特徴を参照する。また検証器は、確認器又は分類器のいずれによって特定されるアルゴリズムよりもより集約的計算であり得るが、それに限定はされない。検証器は、典型的には画像比較アルゴリズムを用いて未知の文書のいずれかの機密特徴を1つ以上の既知のリファレンスと比較し、確実度又は類似度を戻す。類似度が認証閾値を超えていれば、未知の文書は真正確定と見なされる。]
[0025] このようにして、文書認証システム10は文書識別フレームワークを走査し、文書識別ソフトウェアモジュールを選択的に起動して、最終的には未知の文書を検証する。すなわち、動的文書識別フレームワークによって実行される処理は、文書識別フレームワークが、以前に起動された文書識別ソフトウェアモジュールの結果に応じて、特定の処理を起動するように文書認証ステム10に命令するという点において「動的」であり、階層内における開始点及び処理の呼出しの順序は、識別されるべき特定の機密文書に応じて変化する。つまり、文書認証システム10は、例えば第1、第2、及び第3の処理を順に適用して米国パスポートである機密文書12を解析し得るし、第1、第3及び第5の処理を順に適用して米国運転免許証である機密文書12を解析し得る。ここで、各処理はそれぞれ、機密文書の1つ以上の限られた属性のみを決定する。この点で本技術は、典型的に文書識別アルゴリズム全体を認証の対象となる機密文書12のタイプにかかわらず所定の順序で静的に適用する必要がある従来のシステムとは異なっている。以下に更に詳細に述べるように、この動的態様ゆえに、捕捉画像(単数又は複数)そのものの解析に基づいて処理の集合を選択的かつ動的に用いることによって、より効率的で包括的な機密文書確認が容易になる。]
[0026] 文書認証システム10は文書識別フレームワークを、階層的に配列された、木状のデータ構造としてメモリ、データベース、又はその他の格納媒体(図1には示さず)内に格納し得る。本開示において文書オブジェクトタイプと呼ぶデータ構造は、木状データ構造内の各ノードを表すものとして用いられる。親ノードは、文書タイプのカテゴリー又はサブカテゴリーを表し、この親ノードは階層の複数レベルにわたって、下方に向けて再帰的に走査され得る。リーフノードは具体的な文書タイプ、例えば米国パスポート文書タイプオブジェクト、米国運転免許証文書タイプオブジェクト、又は米国身分証明カード文書タイプオブジェクトなどを表す。フレームワーク内の文書タイプオブジェクトによっては、1つ以上の格納された画像又はテンプレートを、1つの文書タイプオブジェクトを明確に他の文書タイプオブジェクトから画定する特定の特徴の集合とともに含み得る。例えば米国パスポート文書タイプオブジェクトは、米国パスポートテンプレート画像の下端に機械可読ゾーンが存在することを規定する特徴、テンプレート内における写真の位置を画定する手段、及び様々な特徴間の相対位置を決定するその他のデータの集合とともに、テンプレート米国パスポートの画像を含み得る。] 図1
[0027] 文書認証システム10は、フレームワークのデータ構造を走査し、文書タイプオブジェクトによって参照される1つ以上の実行可能な分類器、確認器、及び検証器を起動し得る。起動される具体的な文書定義ソフトウェアモジュールに応じて、文書認証システム10は、文書タイプオブジェクトを捕捉画像(単数又は複数)と比較し、あるいは画像データ及び/又は機密文書から得られた他のデータについてその他の解析を行い、機密文書12がカテゴリー、サブカテゴリー、又は特定の文書タイプと一致する類似度を示す確度値を得ることができる。確度値が、その親ノードに関連した複数の分類器及び/又は確認器についてのプログラマブル又は計算された最小確度レベルを上回れば、文書認証システム10は、1つ以上のリーフノードに到達した時点で最終的に最高の確度値を戻すことによって機密文書12が識別されるまで、その親ノードからフレームワークを通して複数のパスを走査する。]
[0028] 機密文書12が、格納された複数の文書タイプオブジェクトの1つに一致することが首尾よく識別された後、文書認証システム12は認証処理を実行し、機密文書の真正性を確定する。例えば、文書認証システム12は捕捉画像(単数又は複数)を解析し、格納されたリファレンス画像の1つ以上の存在がその機密文書内に認められるかを決定する。リファレンス画像が捕捉画像内に存在する場合、文書認証システム10は、機密文書12が適切に認証されたという(例えば聴覚的及び、又は視覚的)表示を与え得る。リファレンス画像が捕捉画像内に存在しない場合、文書認証システム10は、機密文書12が自動的に認証できず、否定し得るという表示を与える。]
[0029] 作業においては、ユーザーが、文書読取り器11のビューフレーム14上に機密文書12を置く。ビューフレーム14は、文書認証システム10の他の構成要素に対して機密文書12を正確に位置付ける。図1の例示的な実施形態において、文書認証システム10は、ビューフレーム14の上に置かれた機密文書12を照明するための光源(単数又は複数)を有する。実施形態によっては、文書認証システム10は、赤外(IR)光源及び/又は紫外(UV)光源などの光源を複数含み得る。文書認証システム10は、機密文書12から画像データを捕捉するための画像捕捉装置を更に含む。画像捕捉装置は、ピクセルの配列を備えた電荷結合素子(CCD)などのCMOS画像センサー、カメラ、ラインスキャナー、又は他の入力装置であってよい。ホストシステム20は、機密文書読取り器11と相互作用することで、画像データを捕捉し、RFIDチップに対する問い合わせを行い、又は機密文書12に関して他の処理を行ったりするための命令を発する。光源の輝度は、ホストシステム20によって自動的に又はユーザーからの入力に基づいて、最小値から最大値までの輝度範囲にわたって調節することができる。] 図1
[0030] ユーザーが機密文書をビューフレーム14内に配置した後、文書読取り器11が、機密文書12の1つ以上の画像のシーケンスを捕捉する。捕捉画像は機密文書12の全体又は一部を表し得るが、典型的には捕捉画像は機密文書12の全体を表す。画像捕捉装置は、画像処理のために、捕捉画像データをホストシステム20に伝達する。ホストシステム20によって処理された捕捉画像(単数又は複数)は、検査のために、ホストシステム20と関連付けられたディスプレイ(図示せず)上に表示することができる。ホストシステム20は、例えば、コンピュータ、ラップトップ、携帯情報端末(PDA)、又は捕捉画像(単数又は複数)を解析するのに十分なプロセッサ及びメモリ資源を有する他のコンピュータシステムを含んでもよい。ホストシステム20の例示的な構成及び動作について、以下で更に詳細に説明する。]
[0031] 図2は、物品、例えば図1の機密文書12を認証する、例示的なホストシステム20を示すブロック図であり、本発明の原理に従って動的文書識別フレームワークにより機密文書12を識別する。ホストシステム20は文書読取り器11(図1)から受信した画像データ22、及び所望により他のデータ(例えばRFIDデータ)を解析して機密文書12を動的に識別する。] 図1 図2
[0032] この例では、ホストシステム20は、文書読取り器11からのデータ(例えば画像及びRFIDデータ)を受信するためのデータインターフェース24を含む。データインターフェース24は例えば、データ読取り器11と通信するためのシリアル又はパラレルインターフェースであってよい。もう1つの例として、データインターフェース24は、ユニバーサルシリアルバス(USB)インターフェースであってもよい。]
[0033] 図2に示すように、文書識別フレームワーク34は、機密文書のカテゴリー、機密文書のサブカテゴリー、又は機密文書の特定のタイプを表す複数のノードを備えた木状構造として表され得る文書識別フレームワーク34の各ノードは、分類器47、確認器48及び検証器49をはじめとする、文書識別ソフトウェアモジュール41の集合へのリファレンスを1つ以上、含むことができ、各モジュールは、それぞれ機密文書の1つ以上の属性又は特徴の照査を行うための処理を定義する実行可能な命令を含む。一例として、親ノードに関連する分類器47の1つは、機械可読ゾーン(MRZ)が機密文書の特定の位置に存在するかを決定し、それによって機密文書の可能なタイプを具体的なクラスへと絞り込む。その親ノードに関連するか又はその親ノードの子ノードのいずれかに関連するかを問わず確認器47の1つが、更にMRZの処理を行い、MRZテキスト内にテキスト識別器の特定シーケンスが存在することを確定してもよい。これに関連して、確認器48は文書木階層内のより高いレベルの分類器によって抽出された属性、例えば、上記テキスト識別器の特定シーケンス、例えば「AU」が存在するかを確定し、可能な文書タイプをオーストラリアの文書の集合へと更に絞り込む。最終的に、リーフノード(すなわちフレームワーク中のノードで子ノードを1つも持たないもの)に到達した時点で、機密文書の真正性を確定するために、リーフノードにより参照される1つ以上の検証器49の集合が適用される。] 図2
[0034] ホストシステム20は、レイアウトエディタ30を備えたユーザーインターフェース28を含み、それによってユーザー(図示せず)は、データベース32に格納されたデータを編集することが可能である。特に、ユーザーは、レイアウトエディタ30が提示するGUI(graphical user interface)と相互作用することによってデータベース32に格納された文書タイプを編集することにより、文書識別フレームワーク34を拡張して別の文書タイプをサポートするようにすることができる。例えば、場合によって、ユーザーはレイアウトエディタ30と相互作用し、文書識別フレームワーク34に挿入するための新しい文書タイプオブジェクトを手動で特定することができる。この時ユーザーは、カテゴリー、サブカテゴリー、又は個々の文書タイプを定義するために存在する属性を定義することができる。加えて、ユーザーは、分類器、47、確認器48、及び検証器49として挿入されている文書オブジェクトを、1つ以上の新規又は既存のアルゴリズムと関連付けることができる。]
[0035] あるいは、ホストシステム20は「学習」モードに設定し、新しいタイプの機密文書のテンプレートからの画像データ及びその他のデータ22の受信及び処理に応じて、文書識別フレームワーク34を適応するよう更新するようにしてもよい。このモードでは、ホストシステム20はデータを処理し、新しいタイプの機密文書の、任意の識別された属性に一致する新しい文書タイプオブジェクトを、文書識別フレームワーク34中に自動的に挿入する。]
[0036] すなわち、ユーザー入力26は、ユーザーインターフェース28と相互作用することにより、文書タイプオブジェクトを編集する命令、例えば所定の文書タイプオブジェクトに関連した分類器47、確認器48、及び検証器49を加える又は削除する命令を特定し、新しい文書タイプオブジェクトを手動又は自動で挿入し、文書タイプオブジェクトを削除し、文書識別フレームワークのノードを整理しなおして分類器47、確認器48、検証器49、及びその他の命令の優先順位をつけることができる。このようにしてユーザーは、レイアウトエディタ30を用いて文書識別フレームワーク34を調整することにより、機密文書タイプをより迅速に識別するようにすることができる。]
[0037] データインターフェース24によって受信される画像データは、機密文書12の全体又は一部の捕捉画像(単数又は複数)を表し得る。上述したように、画像データは、画像、テキスト、MRZ、バーコード、透かし、又はその他の情報の1つ以上を含み得る。ホストシステム20は、捕捉データを受信し、上述した識別及び継続認証処理を実行する文書処理エンジン36を含む。この例では、文書処理エンジン36は画像処理モジュール38及び文書識別モジュール40を含み、文書識別処理を実行する。文書処理エンジン36はまた、識別済みの機密文書の認証を確定する文書認証モジュール42と、確認及び認証されるべき機密文書12などの物品から関連情報を抽出するデータ収集モジュール44とを含む。具体的なデータ収集モジュール44は、文書読取り器11を用いて機密文書12上に存在するバーコードを読取り、RFIDチップに問い合わせ、磁気ストリップを読み取ることにより、画像データには含まれない可能性のあるデータを収集することができる。]
[0038] 捕捉画像データを受信すると、画像処理所モジュール38は画像前処理アルゴリズムを起動し、捕捉画像データからより高い品質のグレー、カラー、又は2値化画像を作成する。本開示の目的のため、これらの処理済み捕捉画像を捕捉画像と呼び、「捕捉画像」は、処理したものであるか否かを問わず、元の機密文書12を反映する任意の画像を意味するものとする。画像処理モジュール38は、画像捕捉時に用いる光源のタイプ又は捕捉画像(単数又は複数)の特定の態様に応じて、画像処理が必要かを決定し得る。例えばUV光源では特定の画像処理アルゴリズムが必要となり得るし、例えば暗い背景に明るいテキストなら特定の画像反転アルゴリズムが必要となり得る。画像データが前処理されると、文書識別モジュール40は更に画像データ及びデータ収集モジュール44によって得られたその他のデータを解析し、機密文書のタイプを識別する。]
[0039] 特に、捕捉画像データの捕捉時に、文書識別モジュール40はデータベース32に格納された文書識別フレームワーク34を走査し、その機密文書が、文書識別フレームワーク34によってサポートされる文書タイプオブジェクトの1つとして識別するか、又はその機密文書を拒絶する。データベース32はこのシステム内に、メモリ又はホストシステム20のコンピュータ可読媒体内に配備してよい。しかしながら、他の実施形態では、データベース32はホストシステム20から離れて存在し、ネットワーク接続又はその他の何らかの遠隔アクセス法を介してホストシステム20に結合し得る。データベース32は、リレーショナルデータベースなど、いかなるタイプのデータベースをも、又は、文書識別フレームワーク34を格納し得るものであれば他のいかなるタイプのメモリをも含み得る。]
[0040] 文書識別フレームワーク34は、拡張が容易なように、木状データ構造として組織される。以下により詳細に述べるように、文書識別モジュール40は、複数の分類器47、確認器48及び検証器49を選択的に起動することにより文書識別フレームワーク34を走査し、機密文書を類別し、最終的には文書識別フレームワーク34に格納された複数の文書タイプオブジェクトの1つとして識別する。]
[0041] 文書識別フレームワーク34を走査した後、文書識別モジュール40は、識別された機密文書のタイプをユーザーインターフェース28に伝達し得るし、これに応じてユーザーインターフェース28は、選択された文書タイプをディスプレイ43を介してユーザーに提示し、ユーザーの承認を得ることもできる。あるいは、ユーザーによる確定は不要とすることもできる。いずれの場合でも、機密文書が特定の文書タイプオブジェクトの1つとして識別された時点で、文書認証モジュール42は上述したように認証段階を開始する。識別又は認証のいずれの段階を通じても、データ収集モジュール44は、データベース32から要求された情報を、画像(単数又は複数)から抽出し得る。認証が行われれば、文書処理エンジン36は、典型的には認証結果をユーザーインターフェース28に伝達し、これに応じてユーザーインターフェース28は、この結果をディスプレイ43に表示する。ディスプレイ43は、液晶ディスプレイ(LCD)、平面ディスプレイ、プラズマディスプレイ、陰極線管(CRT)ディスプレイ、又は、図形、テキスト、及びビデオを表示できる、他の任意のいずれのタイプのディスプレイであってもよい。]
[0042] ホストシステム20はまた、最近識別された文書タイプオブジェクトを格納する待ち行列データ構造46(「待ち行列46」)をも含み得る。すなわち、機密文書12が例えば米国パスポート文書タイプオブジェクトとして識別された時点で、文書処理エンジン36は米国パスポートタイプオブジェクト又はそのリファレンスを待ち行列46に格納し得る。他の機密文書を識別する要求を受信した時点で、文書識別モジュール40は、他の可能性を求めて文書識別フレームワーク34の走査を行う前にまず、その機密文書を待ち行列46に格納されている文書タイプオブジェクトの1つとして識別するよう試みる。場合によっては、次に識別される文書は同一文書の裏側であることもある。この場合、文書処理エンジン36は自動的に情報を関連付け、2つの情報の集合を重ね合わせて1つの出力とする。図2では分離したものとして示したが、待ち行列46はデータベース32内にあってもよい。ホストシステム20は、待ち行列データ構造を格納できるものであれば、ランダムアクセスメモリ(RAM)、磁気ディスク若しくはハードドライブ、ディジタルビデオディスク(DVD)、コンパクトディスク(CD)、フラッシュ読取り専用メモリ(ROM)、及びサムドライブなど、いずれのタイプのメモリを含んでもよい。あるいは、文書処理エンジン36は、文書識別フレームワークの配列及び/又は走査パスを変更することによって、最近識別された機密文書タイプを優先するようにしてもよい。] 図2
[0043] 図3は、図1の文書認証システム10の例示的な動作を示すフローチャートである。はじめ、ホストシステム20は、動的文書識別フレームワークに従って、例えば図2の文書識別フレームワーク34のようなデータ構造に1つ以上の文書タイプオブジェクトを格納している。次に、ユーザーが例えばパスポートのような機密文書12を、画像捕捉装置11下のビューフレーム14内に置く(図3の工程50)。ホストシステム20が、機密文書12の1つ以上の捕捉画像のシーケンスを受信、格納する(工程52)。] 図1 図2 図3
[0044] 格納後、ホストシステム20が文書識別フレームワーク34を走査することによって捕捉画像(単数又は複数)を識別する。ホストシステム20は1つ以上の文書識別ソフトウェアモジュール41を選択的に起動することによってデータ構造を走査し、未知の文書を文書識別フレームワーク34に格納された複数の文書タイプオブジェクトの1つとして識別する(工程54)。動的文書識別フレームワークは、データ構造が確実に拡張可能、柔軟、かつ効率的であり続けるよう、明確な方向付けを行う。すなわち、動的文書識別フレームワークは、走査、オブジェクトの編集若しくはデータ構造からの削除、及びオブジェクトのデータ構造への挿入のためのプロトコル、又は、より一般的には、文書タイプデータ構造32の一体性を維持するためのプロトコルを特定する。]
[0045] 未知の文書を識別した時点で(一致するものが見つからず文書が拒絶される場合を除き)、ホストシステム20は、確認中に識別された具体的な文書タイプオブジェクトに特有の、特定の機密特徴が存在する事実に基づいて、機密文書を認証し得る(工程56)。例えば、識別処理の結果、機密文書は米国パスポート文書タイプオブジェクトとして識別され得る。ホストシステム20は、認証処理中、米国パスポートの認証に関係する機密特徴を決定するため、データ構造34内の米国パスポート文書タイプオブジェクトにアクセスし得る。ホストシステム20は次いで、文書タイプオブジェクトによって参照された適切な処理を起動することで、関係する機密特徴すべての認証を開始し、例えばMRZを読取り、透かし、反射性の記号、又はこれらに類した他のマークなどを探すための様々な画像テンプレートマッチングアルゴリズムを実行し、かつテキストの一致を見出すためのスキャンを行う。完了後、ホストシステム20は識別処理、認証処理、若しくはその両方の結果及びその他の収集情報をディスプレイ43を介してユーザーに表示し、又は任意の適切な聴覚的若しくは視覚的表示をし生成し得る(工程58)。]
[0046] 図4は、図2のホストシステム20の例示的な動作を更に詳細に示すフローチャートである。ホストシステム20は、図1の機密文書12の少なくとも1つの捕捉画像を解析することによって、機密文書12を確認する。上述したように、ホストシステム20は、文書処理画像エンジン36による前処理のため、データインターフェース24を介して機密文書12の捕捉画像(単数又は複数)を受信する(工程60)。] 図1 図2 図4
[0047] 文書処理画像エンジン36は画像処理モジュール38を含み、これによって、その捕捉画像について、識別及び認証処理を進めるために更なる画像処理が必要となるかを決定する(工程62)。捕捉画像に追加的な画像処理が必要と決定されると(工程64の分岐「YES」)、画像処理モジュール38は1つ以上の画像強調アルゴリズムを実行して捕捉画像の品質を向上させ(工程66)、終了後、識別処理のために捕捉画像を文書識別モジュール40に送信する。更なる画像処理が不要であれば(工程64の分岐「NO」)、画像処理モジュール38は識別処理のために捕捉画像をそのまま文書識別モジュール40に送信する。]
[0048] 文書識別モジュール40は、文書識別フレームワーク34をルートオブジェクトから走査することによって識別処理を開始する(工程68)。一般に文書識別モジュール40は、性能向上のため、3レベルの制御により文書識別フレームワーク34の走査を行ってもよい。最初の優先度の基づく走査方法において、文書識別のジュール40は、文書識別フレームワーク34を文書識別フレームワークに格納された文書タイプオブジェクトに関連付けられた優先度に従って走査し、この場合優先度は、ユーザーが規定し得る。第2の待ち行列走査方法においては、文書識別モジュール40は待ち行列データ構造46にアクセスし、どの文書タイプオブジェクトが直前に処理されたかを決定し、文書識別フレームワーク34内に格納されたその文書タイプオブジェクトを走査し得る。第3の動的走査方法では、文書識別モジュール40は文書識別フレームワーク34全体を動的に走査する。すなわち、文書識別モジュール40は、文書識別フレームワーク34のルートオブジェクトから開始して、フレームワークの各親ノードオブジェクトにおいて参照される1つ以上の複数の分類器47を起動し得る。分類器47を起動した結果に応じて、文書識別モジュールは40はその親ノードの1つ以上の子ノードを選択し、文書識別フレームワーク34に格納されたより低レベルのオブジェクトへと下方に向けて走査を行い得る。文書識別モジュール40は、親ノードか、又は選択された子ノード(単数又は複数)か、いずれかに関連付けられた1つ以上の確認器48を適用し、機密文書が分類器によって選択されたパスに相応の特徴を備えていることを確定し得る。]
[0049] この走査による識別処理は、文書識別モジュール40が、その文書の属性に一致する1つ以上の検証器の集合を参照するリーフノードに到達し、したがって捕捉画像(単数又は複数)を、文書識別フレームワーク34に格納された複数の文書タイプオブジェクトに関する所定の閾値を超えて、最もよく一致、又は十分に一致するものとして識別するまで、続けられ得る。]
[0050] 文書識別モジュール40は、走査方法の先行するすべての方法から2つ以上の方法を(続けて又は直列的に)適用し得る。すなわち文書識別モジュール40は、例えば、最初に待ち行列データ構造48にアクセスして待ち行列に従ってデータ構造を走査し、次いで、複数の分類器47の1つ以上を選択的に起動することによってデータ構造34を動的に走査し得る。]
[0051] 文書識別フレームワーク34の走査に基づき、文書識別モジュール40は、捕捉画像(単数又は複数)を文書識別フレームワーク34に格納された複数の文書タイプオブジェクトの1つとして識別する(工程70)。上述したように、捕捉画像(単数又は複数)を適切に識別するため、文書識別フレームワーク34の動的走査の間に、文書識別モジュール40は確度値を算出し、その確度値を他の確度値又は所定の最小確度値と比較し得る。識別後、文書識別モジュール40は、その識別された書類タイプオブジェクトをディスプレイ43を介して確度値とともにユーザーに表示し、その承認を求めることもできる(工程72)。]
[0052] 識別及びユーザーによる承認後、必要に応じて、文書識別モジュール40は、捕捉画像(単数又は複数)を識別された書類タイプオブジェクト又はそれに対するリファレンスとともに、書類認証モジュール42に送信する。書類認証モジュール42は、先に概説したように認証処理を行って機密画像12の真正性を決定し(工程74)、この認証結果をディスプレイ43を介して表示する(工程76)。]
[0053] 図5は、図2の文書識別フレームワーク34をより詳細に示すブロック図である。図5に示すように、文書識別フレームワーク34は木データ構造を含むが、文書識別フレームワーク34は、複数の文書タイプオブジェクト78A〜78M(「文書タイプオブジェクト78」)を格納できるものであれば、その他のいずれのタイプのデータ構造をも含み得る。] 図2 図5
[0054] この例では、文書識別フレームワーク34はルートオブジェクト80、複数の文書タイプオブジェクト78、及び複数の文書サブタイプオブジェクト82A〜82M(「文書サブタイプオブジェクト82」)を含む。更に、この木は、サブ−サブタイプ文書オブジェクトを用いることにより、また、同一構造を用いて再帰的に、更に拡張することが可能である。ルートオブジェクト80は例示的な木文書識別フレームワーク34のルート、又はより一般的には、走査が上述した動的走査方法のみよって行われるとした場合に文書識別モジュール40がそこから走査を開始することになるオブジェクトを表す。ルートオブジェクト80は、ルートオブジェクト80を各書類タイプオブジェクト78に結びつける双方向リンク84A〜84M(例えばポインタ)を保持する。書類タイプオブジェクト78もまた、書類タイプオブジェクト78を書類サブ−タイプオブジェクト82に結びつける双方向リンク84N〜84Zを保持する。リンク84A〜84Z(「リンク84」)は、データベース34内でルートオブジェクト80、文書タイプオブジェクト78、及び文書サブ−タイプオブジェクト82の1つが格納されているアドレスへのリファレンスを含み得る。一般に、文書タイプオブジェクト78及び文書サブ−タイプオブジェクトは、その機密文書に共通の物理的属性、機密特徴、又はレイアウト特徴に基づいて、機密文書カテゴリー、サブ−カテゴリー及び個々の文書タイプ(リーフノード)の階層的組織を表す。例示目的で3つの木階層を用いるものとして示したが、機密文書を類別しかつ最終的には個々のタイプを識別するために、いかなるレベル数を繰り返してもよい。]
[0055] ルートオブジェクト80は、図2の複数の分類器47の1つ以上を参照する、少なくとも1つの分類器オブジェクト86Nを含む。このリファレンスは、メモリ内の、参照される分類器47が存在する場所に固有の、識別器、名称、又はアドレスを特定し得る。親ノードとして、文書タイプオブジェクト78は多重分類器オブジェクト86を含み、分類器のいくつかは二重化し得る。図5に示すように、各文書タイプオブジェクト78はそれぞれの分類器オブジェクト86A〜86Mへのリファレンスを含む。各分類器オブジェクト86A〜86M(「分類器オブジェクト86」)は、「分類器処理」を実行して識別される機密文書の1つ以上の特徴又は属性を評価する、実行可能なソフトウェアを含む、複数の分類器47の1つ以上を参照する。各文書タイプオブジェクト78はまた、それぞれ優先値88A〜88Mを(「優先値88」)を含み得るが、文書タイプオブジェクト78はまた、優先値を含まなければならないものではない。上述したように、優先値88は、文書識別モジュール40が文書識別フレームワーク34を走査する特定の走査順序を確定し得る。] 図2 図5
[0056] 図5には示していないが、文書タイプオブジェクト78又は文書サブ−オブジェクトタイプ82のいずれも、機密文書が分類器86によって選択されたパスに対して適切な特徴を有することを確定するために適用され得る、確認器オブジェクト90A〜90Mへのリファレンスを含み得る。リーフノードに到達した時点で、機密文書の真正性の確定を目的として、1つ以上の検証器の集合が適用される。] 図5
[0057] 文書サブタイプオブジェクト82は、リーフノードを代表し、そのためそれぞれ、1つ以上の検証器49を表す、各自の検証器オブジェクト93A〜93Mを含む。加えて、文書サブタイプオブジェクト82は、各自のテンプレートデータ91A〜91M(「テンプレートデータ91」)、及び1つ以上の各自の最小確度値92A〜92M(「最小確度値92」)を含む。検証器オブジェクト93A〜93Mはポインタ又は固有の識別器を介して、機密文書12の素性を確定するために親ノードの、及び可能性としては任意の確認器の、各分類器によって収集された特定の属性又は特徴の存在又は不在を、比較又はその他の方法によって確定する、複数の検証器49の1つ以上を参照する。図5には示していないが、実施形態によっては、各文書サブタイプオブジェクト82は、それぞれが1つ以上の確認器処理を参照する多重確認器オブジェクトを含み得る。テンプレートデータ91は一般に、具体的な1つの文書サブタイプオブジェクト82の分類及び/又は確認時に使用することが必要となり得る、いずれのテンプレート画像、レイアウト特徴、機密特徴、及び関連する他のいずれのデータをも定義する。一般に確認器48は、文書識別フレームワーク34内における文書識別モジュール40の現在地に応じて可能な文書タイプ又はサブタイプオブジェクトの分類器処理に従い、特定の属性についての確度値を戻す。例えば、既に述べたように、1つの文書ノードの特定の分類器(単数又は複数)47の集合及び確認器(単数又は複数)は、現在解析中の機密文書のタイプに対応し得る、そのサブ文書タイプオブジェクト78の格付け集合を戻し得る。文書識別モジュール40は、戻された確度値を、最小確度値92の対応する1つと比較し得る。] 図5
[0058] 現在の機密書類12を識別するために、文書識別モジュール40は、典型的には文書識別フレームワーク34を動的走査方法によって走査する。この動的方法により、文書識別モジュール40は、分類器オブジェクト86Nによって参照された分類器47を起動するためにルートオブジェクト80から開始する。この最初の分類器47は、捕捉画像及び機密文書12から得られたその他のデータを解析し、子ノードによって表される可能な文書タイプオブジェクトの集合、すなわち文書タイプオブジェクト78を戻す。この集合は、文書タイプオブジェクト78の任意の1つ以上を特定し得る。]
[0059] 1つの文書タイプオブジェクト78への走査において、文書識別モジュール40は関連する分類器86A〜86Mにアクセスし、参照される分類器47を起動し、かつ可能な属性又は特徴の集合を受信する。次いで、子サブ書類オブジェクトのそれぞれについて、対応する確認器オブジェクト90A〜90Mを用いて予測値との比較を行い、類似確度要素を作成し、かつそれに基づいて、文書サブタイプオブジェクト82への1つ以上のパスを最終的に選択するためにその機密文書とサブ文書タイプとの間のマッチング類似性の程度が格付けされる。このようにフレームワーク34を垂直方向に走査してカテゴリー、サブカテゴリーの類別を行い、かつ機密文書を最終的に識別し得る。]
[0060] 走査は、木の下方へと、特定の機密文書を表すリーフノードに到達するまで繰り返し行い得る。この分類器47及び確認器48は、1つ以上の確度値を戻すことができ、文書識別モジュール40は走査中に、文書サブタイプオブジェクト82内に格納されている方程式によってこれらの確度値の加重平均を算出し得るこの加重平均を用いることにより、文書識別モジュール40は走査中に加重平均を文書サブタイプオブジェクト82に対応した最小確度値92と比較し、機密文書12が確かにその具体的な機密文書タイプであるかを確定する。この加重平均が対応した最小確度値92を満たさない、つまりそれを超えない場合には、文書識別モジュール40はそのサブタイプオブジェクト82に関連した全ブランチ(枝)を更なる考慮の対象から破棄することにより、効率性を向上させることができる。文書識別モジュール40は、確実度が破棄される又は更なる考慮の対象として格納されるまで、上の分類器オブジェクト86から戻された可能な文書サブタイプの残りの集合を通じ、引き続き反復し得る。]
[0061] 集合内のすべての文書サブタイプオブジェクト82が解析されたら、文書識別モジュール40は、残りの文書サブタイプオブジェクト82に関連した確度値を相互に比較し、最適な確度値を、例えば最も高い確度値を選択することで識別し、それによって文書識別フレームワーク34の走査を終了することができる。文書識別モジュール40はこの識別確度値を、ディスプレイ43を介して表示するため、関連する文書タイプオブジェクト78又はサブタイプオブジェクト82とともにユーザーインターフェース28に送ってもよい。ユーザーは、この識別された文書タイプオブジェクト78又はサブタイプオブジェクト82を承認するか、又はその他の方法で、文書識別モジュール40が捕捉画像(単数又は複数)の解析から機密文書12を正しく識別したことを認めることが必要とされることがある。]
[0062] 図6は図2の文書識別モジュール40が、図5に示すように動的走査方法によって文書識別フレームワーク34を再帰的に走査中の、例示的な動作を示すフローチャートである。以下、動的走査方法に関連して述べるが、文書識別モジュール40は文書識別フレームワーク34を、待ち行列データ構造46に格納された文書タイプオブジェクト78へのリファレンスに従って、優先値88に従って、若しくはこれらの方法の組み合わせによって文書識別フレームワーク34を走査することを含め、他のいかなる方法、又はそれらの組み合わせによって走査してもよい。] 図2 図5 図6
[0063] はじめ、文書識別モジュール40は、機密文書12の捕捉画像(単数又は複数)を所望により他のデータ(例えばRFIDデータ)とともに受信し、文書識別フレームワーク34のルートオブジェクト80にアクセスして文書識別モジュール40の走査を開始するとともに、ルートオブジェクトを現在処理中の文書として扱う(工程94)。文書識別モジュール40は、例えば現在の文書に関連する分類器オブジェクト86Aにアクセスし、それによって、分類器オブジェクト86Aによって参照される複数の分類器47の1つ以上、すなわち分類器処理を起動し得る(工程95)。この起動に応じて、文書識別モジュール40は可能な属性又は特徴の集合を算出する。文書識別モジュール40は、このノードにおけるこの文書タイプオブジェクトから可能な文書サブタイプオブジェクトの集合を受信し得る。この集合は、一般に1つ以上の文書サブタイプオブジェクト78を含む(工程96)。例えば、可能な文書サブタイプオブジェクトの1つの例示的な集合は、文書タイプオブジェクト78A及び78Mを含み得る。この可能な文書タイプオブジェクトの集合、すなわち「サブタイプ集合」を得ると、そのタイプ集合に従って、文書識別モジュール40は文書識別フレームワーク34の走査を続ける(工程96)。]
[0064] 文書識別モジュール40は、タイプ集合の形で戻された第1の文書タイプオブジェクト78A及びそれに関連した分類器オブジェクト86にアクセスすることにより、文書識別フレームワーク34の1レベル下位を走査する。文書タイプオブジェクト78Aについての確認器のいずれかが、分類器オブジェクト86によって抽出された属性を確定すれば(又はこの例におけるように確定オブジェクトが全く存在しなければ)、文書識別フレームワーク34はここで、文書タイプオブジェクト78Aを現在の文書として扱い、分類器オブジェクト86Aを用いて、可能な属性又は特徴物の追加的な集合を算出する(工程95)。その後、文書識別モジュール40はもう1レベル下位へと走査を行い、その子サブ文書82A〜82D、すなわち「サブタイプ集合」のそれぞれの照査を行う(工程96)。文書識別モジュール40は次に、この新しいサブタイプ集合に従って文書識別フレームワーク34の走査を行う(工程96)。]
[0065] 文書識別モジュール40は、サブタイプ集合の形で戻された第1のサブタイプオブジェクト82A及びそれに関連した確認器オブジェクト90Aにアクセスすることにより、文書識別フレームワーク34の下位を走査する。文書識別モジュール40は、関連する確認器オブジェクト90Aによって参照された1つ以上の確認器48を、確認器オブジェクト92Aによって参照された1つ以上の検証器49とともに起動し、(これがリーフノードであることから、)確度値の集合を受信する(工程97)。確度値を決定するに当たっては、確認器48は、関連するテンプレートデータ91Aにアクセスし得る。確度値は、起動された1対の分類器47と確認器48とにより、捕捉画像(単数又は複数)に関して関連するテンプレートデータ91Aと比較することによって実施された解析についての、類似のレベルを反映する。例えば、確度値100は、関連テンプレートデータ91Aと捕捉画像(単数又は複数)との間の完全な一致を反映するものであり得るし、確度値80は、関連テンプレートデータ91Aと捕捉画像(単数又は複数)との間の十分な一致を反映し得るが、捕捉画像の1つ以上の特徴が関連テンプレートデータ91と完全には一致していないことを示すものであってよく、ゼロは全く一致しないことを意味する。実施形態によっては、文書識別モジュール40は、起動された確認器48によって戻された各確度値を最小確度値92Aと比較し、最小値条件を満たさなければ(工程98)、このサブ文書若しくはこのノードから始まるブランチ全体の照査を停止し、又はこのサブ文書についての組み合わせ確度値をゼロに設定する。他の実施形態では、文書識別モジュール40は、捕捉画像(単数又は複数)を確認器48の全起動から戻された全確度値加重平均を用いてこのサブ文書のための組み合わせの確度値を算出し(工程102)、この加重平均を最小確度値92Aと比較して、最小確度値92Aを上回る加重平均確度値のみを格納する(工程104)。]
[0066] このサブ文書が最小確度値条件を満たせば、そのノードがその文書木のブランチノードであって子サブ文書を有するか、すなわち親ノードであるかが照査される(工程106)。このサブ文書の下に付加された子サブ文書を有する場合、このサブ文書は現在の文書として扱われ、文書識別モジュールは、上述したプロセスを繰り返すことにより、文書木をもう1レベル下位へと走査する(工程95)。これが再帰的縦型法として実施され、リーフノードに達するまで、文書木全体にわたって下方へと走査が行われる。]
[0067] サブタイプ集合中の1つの文書サブタイプオブジェクト82について終了すれば、文書識別モジュール40は、サブタイプ集合を全体についての反復を終了したかを決定し得る(108)。サブタイプ集合全体についての反復が終了していなければ、文書識別モジュール40は引き続き他の文書サブタイプオブジェクト82にアクセスし、関連する確認器オブジェクト90によって参照される確認器48を起動し、確度値を受信し、かつ比較に基づいて確度値を格納することにより、サブタイプ集合を通して反復を継続する(工程96〜108)。終了したら、文書識別モジュール40は算出された関連確度値によって全サブ文書を格付けし、所与の文書ノードにおけるパス選択処理のサイクルを完了する(工程110)。次の工程では、現在処理中の文書がルート文書であるか親文書タイプを有するかに応じて、結果を戻すかを決定する(工程112)。子サブ文書であれば、制御は文書木を1レベル上昇して親文書へと戻り(工程114)、子サブ文書の確度値は親文書に合流する。そうでなければ、文書識別モジュール40は文書木全体を通しての反復を終了したことになり、文書識別モジュール40は、格納された確度値に基づいて捕捉画像(単数又は複数)を識別する(工程116)。文書識別モジュール40は、格納された全確度値を相互に比較して最高の確度レベルを選択し、これによって、捕捉画像(単数又は複数)を最高の確度レベルに対応した文書サブタイプオブジェクト82に属するものとして識別してもよい。]
[0068] 以上、文書識別フレームワーク34を走査中の文書識別モジュール40の動作を説明した。文書識別フレームワーク34は、動的文書識別フレームワークを介して文書タイプオブジェクト78及び文書サブタイプオブジェクト82を格納する。このフレームワークは、機密文書の属性及び特徴に応じて走査の順序が変化するという意味で、またフレームワークが、それぞれレイアウトエディタを介して文書タイプ及びサブタイプオブジェクト78、80の更新、削除、及び挿入を進めるという意味で、「動的」である。動的文書識別フレームワークは、そのプロトコルに従ってこれらの動的更新、削除、及び挿入を行い得るプロトコルを提供することで、機密文書12を識別する、柔軟で拡張可能なフレームワークを保持する。このフレームワークは、米国及び他の国のパスポート、米国及び他の国の運転免許証、米国及び他の国の身分証明書、及び金融書類等、多くの異なるタイプの物品識別し得るという点で柔軟である。このフレームワークは、以下に詳述するように、更に1つ以上の、サブタイプを含む文書タイプを迅速にフレームワークに追加し、文書識別フレームワーク34に挿入し得るという点で、拡張可能である。]
[0069] 図7A〜7Cは、レイアウトエディタ30によってディスプレイ43を介してユーザーに提示されるウィンドウ118のスクリーンショットである。スクリーン118は、文書タブ119、文書タイプオブジェクト120の拡張可能なリストとして表される識別フレームワーク34、及びビューサブウィンドウ121を含む。文書タイプオブジェクト120は1つ以上のテキスト領域を含み、各テキスト領域は、それぞれ図5の複数の文書タイプオブジェクト78の1つを参照する。例えば、文書タイプオブジェクト78Aは、図7Aに示したように、リスト120上の最初のアイテムとして「Document−2Line44」文書タイプを含み得る。すなわち、文書タイプオブジェクトリスト120は、文書識別フレームワーク34により定義され得る組織階層の一例を示す。ビューサブウィンドウ121は典型的には、データベース32に格納されかつ文書タイプオブジェクトリスト120中の選択された1つのアイテムに関連した、任意の関係テンプレートデータ91を示す。] 図5 図7A 図7B 図7C
[0070] 図7Bは、ユーザーが、識別処理中のアイテム130をこの文書タイプとして選択した時のウィンドウ118を示す。この選択に応じてレイアウトエディタ30はポップアップウィンドウ132をウィンドウ118上にオーバーレイし、このポップアップウィンドウ132によりユーザーは、アイテム130に関連した確認器オブジェクト90の1つを編集し、文書タイプの識別処理を定義することが可能となる。この例では、ポップアップウィンドウ132は、最小確度値入力欄134、光源選択入力欄136、既存確認器処理選択ボックス138A、及び使用確認器処理選択ボックス138Bを含む。ユーザーは、最小確度値インプット134との相互作用を介して特定の最小確度値をこの文書タイプと関連付ける、例えば最小確度値92Aを図5の文書サブタイプオブジェクト82Aと関連付けることができる。ユーザーはまた、光源選択インプット136を介し、機密文書12の画像捕捉時に用いる可視光、UV光、赤外光などのリファレンス光を特定できる。ユーザーは更に、既存確認器処理選択ボックス138Aを介して、確認器オブジェクト90Aの1つによって現在参照されている確認器48を編集することもできる。最後にユーザーは、使用確認器処理選択ボックス138Bを介して、ユーザーが検討中の確認器オブジェクト90Aに対し、追加の確認器48を関連付け、又は削除することができる。] 図5 図7B
[0071] 図7Cは、ユーザーが現確認器タブ140を選択して分類器47又は確認器の1つを具体的に適用するようにした後の、ポップアップウィンドウ132がオーバーレイしたウィンドウ118を示す。図7Cに示すように、ユーザーは現在、捕捉画像のドミナントカラーを解析し、その解析結果をリファレンス入力欄142内に特定されたリファレンスと比較する、「CDocVerifierDominatColor」処理を編集中である。ポップアップウィンドウ132はリファレンス入力欄142を含み、ユーザーがこれらのリファレンスを手動で編集できるようになっている。例えば、ドミナントカラー処理は、捕捉画像の解析結果をリファレンス入力欄142内に定義される様々な色(ここではマゼンタ0.007パーセント、レッド15.021パーセント、イエロー34.547パーセントを特定する)と比較対照する。ユーザーはこれらの個別の色の割合(青色の強調表示領域に表示される割合)を手動で編集し得る。あるいは、ユーザーが物理的なテンプレートをスキャンのために用意していれば、ユーザーはlearnボタン144を選択することで、レイアウトエディタ30が予め又は同時にスキャンしてシステムに読み込んだテンプレート画像から、これらのリファレンスを得るようにしてもよい。] 図7C
[0072] ポップアップウィンドウ132もまた、加重入力欄146及び特定最小確度値入力欄148を含む。ユーザーが加重入力欄146に加重値を入力することにより、起動された数個の確認器48の加重平均の算出において、文書識別モジュール40がこの特定の加重値を使用するようにしてもよい。同様にユーザーは、図6の工程98に述べたように、走査時に使用するため、特定最小確度値を入力欄148に入力してもよい。このようにして、ユーザーは、加重及び最小確度値を設定することにより、分類器47及び確認器48を動的に構成し、分類器47及び確認器48を特定のオブジェクト86、90に関連付け、フレームワーク34の走査を動的に修正することができる。] 図6
[0073] 図8A、8Bは、ホストシステム20が識別及び継続認証の双方を完了した後に、図2のデモンストレーションユーザーインターフェース28によってディスプレイ43を介してユーザーに提示されたウィンドウ150のスクリーンショットである。この文書は米国ニューヨーク州運転免許証の現行標準版の表側として識別される。ウィンドウ150は、識別確実度テキスト出力欄152を含み、この欄は典型的には、識別処理中に文書識別モジュール40によって算出される加重確度値を表示する。ウィンドウ150はまた、認証及び識別タブ156の結果を示す認証詳細出力欄154を含み、この欄には、上記タブの選択に応じて識別処理の結果が提示される。ウィンドウ150はまた、他の付随的な情報、例えば捕捉画像158、及び捕捉画像158の解析結果から得られた機密情報詳細160をも提示する。] 図2 図8A
[0074] 図8Bはユーザーが識別タブ156を選択した後のウィンドウ150を示す。ユーザーインターフェース28はウィンドウ150内に、文書識別フレームワーク34の動的走査結果を示すテキスト出力欄162を提示する。テキスト出力欄162の一番上から始めて、文書識別モジュール40はまず、「2line44」と名付けられた文書タイプオブジェクト78の1つへの走査を行い、その関連分類器オブジェクト86にアクセスし、そこで文書識別モジュール40は参照された分類器47を起動した。結果としては、検査が(テキスト出力欄162の第2行目に示すように)「line count」のところで失敗したため、いずれの使用可能な文書サブタイプオブジェクト82も戻ってこなかった。] 図8B
[0075] 次に文書識別モジュール40は、(テキスト出力欄162の第3行目に示すように)「us dl」と名付けられた文書タイプオブジェクト82の走査を行うが、テキスト出力欄162の第4行目によれば、関連分類器オブジェクト86はまたも、米国一般運転免許証としての「on identification」に失敗した。最後に、「us dl ny」と名付けられた文書タイプオブジェクト78の走査で、文書識別モジュール40は(テキスト出力欄162の第6行目に示すように)一致するものを見出し、文書サブタイプオブジェクトの集合を受信した。このサブタイプ集合の走査で文書識別モジュール40は、第7〜13行に示すように参照された分類器47及び確認器48を起動し、そのそれぞれが「cf」値を戻した。この「cf」値は、各確認器によって決定された確度値を反映し、「min cf」値は各確認器を通過するために必要な最小確度値を示す。テキスト出力欄162の第6行目は、得られた「cf」値、すなわち確度値の加重平均の比較結果を、捕捉画像(単数又は複数)が、「第14行目の文書[タイプオブジェクト]us dl ny」、かつ「特定の[サブタイプオブジェクト]standard front版であるとして識別された」ことを確定する形で示している。]
[0076] 図9は、図2のホストシステム20のメモリ構造の一部をより詳細に示すブロック図である。この限定的な例では、分離域47及び確認器48は、レイアウトマッチング処理164A及び固有画像書類マッチング処理164Bを含む。図9に更に示すように、書類データ構造34は、ルートオブジェクト166、書類タイプオブジェクト168、及び書類サブタイプオブジェクト170を含む。文書タイプオブジェクト168は分類器オブジェクト172を含み、文書サブタイプオブジェクト170は確認器オブジェクト174、テンプレートデータ176、及び最小確度値178を含む。各オブジェクト168〜174、テンプレートデータ176、及び最小確度値178は、図5を参照して説明したオブジェクトと実質的に同様のものであり得る。文書識別フレームワーク34は、各オブジェクト168〜174、テンプレートデータ176、及び最小確度値178のそれぞれを複数含むことができ、この分類構造もまた、複数の層へと再帰的に繰り返され得るが、図を簡略にするため、これらの追加的なオブジェクトは図9には示していない。] 図2 図5 図9
[0077] 文書識別モジュール40に配備する2つの汎用識別方法として、レイアウトマッチング処理164A及び固有書類マッチング処理は、可能な候補の絞込みに非常に効果的である。これら2方法はまた、文書識別用に構成することが極めて容易である。これらについては、以下に詳述する。文書識別モジュール40はこれら2方法に限られるものではなく、新しい方法を導入するのに柔軟なプログラミング構造を提供する。一般に使用可能なその他の識別方法には、文書の寸法、ドミナントカラー、空白、濃度ヒストグラム、テキスト及びバーコードのOCR結果、並びにテンプレートマッチングなどが含まれる。]
[0078] 図10は、図2の文書識別モジュール40の1つにおいて、文書識別フレームワーク34を走査して図9のレイアウトマッチング処理164Aを起動するのに用いられる処理工程を例示するフローチャートである。この処理工程のシーケンスをリファレンス画像データに適用することで、文書タイプを識別するための文書テンプレート又は捕捉ライブ画像データを構築し得る(工程180)。文書リファレンステンプレートデータは、上述したように、レイアウトエディタ30により手動で修正可能である。文書レイアウトは、特定の光源の下での、明るい背景中の連続した暗い領域、又はその逆に、グレー又はカラー画像中の画像又は平面のセグメンテーション及び分類によって解析し得る。] 図10 図2 図9
[0079] レイアウトマッチング処理164Aを呼び出すことにより、文書識別モジュール40はレイアウトマッチング処理164Aを実行し、可能な文書サブタイプオブジェクトの集合、すなわちサブタイプ集合を決定する。何らかの画像品質向上処理を行った後にまず、画像は閾値化処理によりバイナリデータに変換され(工程182)、次いで暗ピクセルの連続性に基づいて複数の領域にセグメント化される(工程184)。次に、孤立した領域を何らかの特徴によっていくつかのカテゴリー、例えばテキスト、バーコード、写真、磁気ストライプ、指紋などに分類してから(工程186)、各領域を寸法、位置、及び方向などの追加的な情報よって特徴づける(188)。バーコード、写真、磁気ストライプ、及び静的テキストなど、ほとんどの場合において、領域リファレンスは中心にあると考えられる。しかし時には、可変領域、例えば氏名や住所の動的テキストなどについて、領域の左側を使用することが必要な場合もある。文書は領域オブジェクトの木構造中において、タイプ及び他の特徴によって代表され(工程190)、領域オブジェクトは、エリアによって、人間にとってより意味を成し得るリファレンステンプレート表現の形で階層構造へとグループ化され得る。文書の位置又はそのコンテンツが、印刷のずれ、スキャンの際の文書位置の違い、又は他の理由により変化し得る一方、領域オブジェクトの相対位置は、文書タイプの決定においてより厳密な拘束条件となるが、画像のシフト又は回転は、読取り器によるスキャンの適用環境内に限定される。いったん明確な画像領域が図式化され、捕捉画像として結びつけられれば、文書識別モジュール40は更に、複数の連続した領域を、データベースに格納した複数の文書タイプオブジェクトの1つに関連したテンプレートデータ、例えば図9のテンプレートデータ176と比較する(工程192)。一般に、テンプレートデータ176は、所定の、複数の連続画像領域及びこれら複数の所定の連続画像領域間の関係を定義し、文書識別モジュール40は決定された連続領域及び関係をこれら所定の連続領域及び関係と比較する。最後に、この比較に基づいて、文書識別モジュール40は捕捉画像(単数又は複数)が現在比較中の複数の文書タイプオブジェクトの1つ、すなわち文書タイプオブジェクト178に属するかを、例えば0〜100に一元化した類似確度値(工程97)によって決定する(工程194)。] 図9
[0080] 図11A〜11Cは、図2の文書識別モジュール40が図9のレイアウトマッチング処理164Aを実行する際の捕捉画像の状態を示す例示的画像である。図11Aは、画像処理及び2値化(工程182)を受けた後の捕捉画像194Aを示す。レイアウトマッチング処理164Aの実行には必須ではないものの、このような画像処理を行うことによって、レイアウトマッチング処理164Aを適用した結果は大きく向上し得る。図11Bは、文書セグメンテーション(工程184)を受けた後の捕捉画像194Bを示す。文書識別モジュール40はレイアウトマッチング処理164Aによって実行され、捕捉画像194Bを複数の連続領域196A〜196Nにセグメント化する。図11Cは、捕捉画像の図式194Cを示し、複数の連続領域196A〜196Nのそれぞれは、ノード198A〜198Nの1つに写像される(工程190)。各ノード198A〜198Nはまた、他のノード間の関係をも特定し得る。] 図11A 図11B 図11C 図2 図9
[0081] 捕捉画像が図式化されれば、文書識別モジュール40はこの図式194Cを図9のテンプレートデータ176のようなテンプレートデータと比較し得る。文書識別モジュール40は、レイアウトマッチング処理164Aに従い、1つ以上の異なる比較を行い得る。例えば、文書識別モジュール40は単純に、図式194C中における同タイプの領域の存在をテンプレートデータ176中における領域の存在と比較し得る。この領域タイプ比較に替えて、又は追加的に、文書識別モジュール40は図式194Cをテンプレートデータ176内に格納された図式と、何らかの追加的な拘束、例えば寸法及び位置、又はより厳格には領域の空間的関係などによる比較を行ってもよい。この種の図式比較は、動的計画法アルゴリズムによる不完全図式マッチングなどにより迅速に行われ得る。図式比較の例によっては文書識別モジュール40は、この比較について、図1の画像捕捉装置11の環境及び文書タイプ12に特定の限定、例えば限定移動及び回転制限、マスク化マッチング制限、欠落若しくは余分領域制限、動的コンテンツ制限、並びに不完全セグメンテーション及び印刷ずれ制限などを課し得る。これらの制限の1つ以上を適用することで、レイアウトマッチング識別処理164Aの実行に必要な時間を著しく削減し得る。] 図1 図9
[0082] 限定移動及び回転限度は、比較を受ける前に領域又は文書全体が回転し得る程度を限定する。マスク化マッチング制限は、特定の文書のいくつかの領域を除外することで必要な比較数を削減し得る。欠落又は余分領域制限はカスタマイズされた印刷又は、捕捉画像中の不鮮明若しくはノイズの多い画像の劣悪な画像処理によって生じた、欠落、融合、又は余分領域についての比較を停止し得る。動的コンテンツ制限は、氏名及び住所テキスト領域などの動的コンテンツを含む領域の評価に必要な関係数を削減し得る。不完全セグメンテーション及び印刷ずれ制限は、不適切にセグメント化された2つ以上のテキスト領域を組み合わせることで、被比較領域数を削減し得る。]
[0083] 図12の右側は、レイアウトエディタ30による固有画像分類器47のトレーニング動作工程(工程200〜208)を例示するフローチャートである。PCA(Principal Component Analysis主成分解析)とも呼ばれる情報圧縮スキームとして、固有画像方法は、多数の画像の表現複雑性を数個の正規直交固有画像へと効果的に低減し、迅速なオブジェクト認識及びその他のタスクを達成し得る。対象とする領域は文書全体、又は動的コンテンツをうまく除外する一部であってもよい。加えて、文書の前処理を利用して任意の動的コンテンツの影響を低減するようにしてもよい。] 図12
[0084] いずれの場合も、第1の工程は、すべての可能な、又は選択的に典型的な画像テンプレートを収集することである(工程200)。画像テンプレートについて収集されたテンプレートデータは、ゼロ平均に正規化され得る。次に、各列が異なる画像テンプレートの画像を格納したデータマトリックスを形成する(工程202)。各列中のエントリーのそれぞれは、1つのテンプレートの同じ部分的又は全領域を代表し得る。このデータマトリックスの共分散マトリックスにより固有ベクトルの集合が算出され、それぞれの固有値によってソートされる(工程204)。固有ベクトルは、テンプレートの元の画像データから得られたデータマトリックスから算出し、又はこのデータマトリックスの転置によってより低次元に縮小してよく、いずれの技法も数学的に等価の結果をもたらす。閾値を用い、十分に大きな固有値、すなわち所定の閾値を超える固有値を有する固有ベクトルのみを選択するようにしてもよい(工程206)。一例としてカットオフを適用し、最大固有値の10%の範囲内にある固有値のみを選択するようにしてもよい。これらの選択された各固有ベクトルは、それぞれあたかも転置されたデータリックスから算出されたかのように、固有画像として写像しなおされ格納され得る。上述した処理は、典型的には非常に高次元である元の画像を低次元に落とすことで、正規直交固有ベクトルをはるかに迅速に見つけられるようにする、数学的単純化処理として見ることが可能である。この固有ベクトルはその後、高次の元の画像へと写像しなおされる。固有画像形式の最後の表現は、以下に説明するように、最終的に捕捉画像を適用するのが容易となり得る。この選択された正規直交固有画像の集合は、テンプレート画像データの元の集合を最小二乗誤差の形で最もよく表現するものと見てよい。]
[0085] 図12の左側は、図2の文書識別モジュール40が文書識別フレームワーク34を走査し、図9の固有画像文書マッチング処理164Bを起動する動作工程を例示するフローチャートである(工程210〜216)。この処理工程のシーケンスは、(i)データベースに格納された各文書サブタイプオブジェクトについて、文書テンプレート及び事前計算済みのリファレンス重み付け係数ベクトルを構築するために、リファレンス画像データに、又は(ii)文書タイプを識別するために捕捉画像データに、適用し得る(工程210)。] 図12 図2 図9
[0086] 固有画像文書マッチング処理164Bの起動により、文書識別モジュール40は固有画像文書マッチング処理164Bを実行し、上述したように選択された正規直交固有画像によって表現された捕捉画像の重み付け係数ベクトルを算出する(工程212)。これは、捕捉画像データベクトル(又はリファレンス画像データ)を選択正規直交固有画像によって構成されたデータマトリックスに乗じ、捕捉画像についての重み付け係数ベクトルを得ることによって行われる。すなわち、データマトリックスの各列は固有画像の1つを代表し、捕捉画像データベクトルを乗じることによって係数ベクトルが得られる。ここで、各係数は、正規直交固有画像によって形成された高次元空間内における捕捉画像の表現を代表する。次に、文書識別モジュール40は捕捉画像データの重み付け係数ベクトルを、データベースに格納された複数の文書サブタイプオブジェクト、すなわち可能なリファレンス文書タイプのそれぞれの1つに関連付けられた、事前計算済みのリファレンス重み付け係数ベクトルと比較する(工程214)。これにより、2つのベクトルの距離又は類似性が、捕捉画像についての重み付け係数ベクトルと事前計算済みのリファレンス重み付け係数ベクトルとの関係で、算出される。典型的には、文書識別モジュール40はこの距離を次の4つの標準距離計算アルゴリズムの1つによって算出し得る。すなわち、1)ユークリッド距離、2)ハミング距離、3)NCC(正規化相互相関)、及び4)マハナロビス(Mahanalobis)距離で算出し得る。この距離に基づいて、文書識別モジュール40は固有画像文書マッチング処理164Bにより、物品が現在比較を受けている複数の文書サブタイプオブジェクトの1つ、すなわち文書サブタイプオブジェクト170に属するかを決定する(工程216)。分類は、通常、最近傍(NN)(nearest neighborhood)方法に基づく。この決定は、可能なリファレンス文書タイプオブジェクトのそれぞれについて、例えば0〜100のような、統一したスケールで距離を表す確度値の形で行われ得る。この方法では、確度値は、捕捉画像の重み付け係数ベクトルと、可能なリファレンス文書のそれぞれについての重み付け係数ベクトルとの間の距離が所定の閾値を下回るかを表す。]
[0087] 図13A〜13Cは、文書識別モジュール、例えば図2の文書識別モジュール40が固有画像文書マッチング処理、例えば図9の固有画像文書マッチング処理164Bを実行する際の、図13Cの捕捉画像230の状態を示す例示的画像である。図13A及び図13Bは、この文書を識別する前に使用された例示的なトレーニング画像及び結果を示す。図13Aは、米国運転免許証の7つのサンプル、すなわちカリフォルニア州及びニューヨーク州の各2タイプ、ミネソタ州、モンタナ州、及びアメリカ合衆国の各1タイプの集合を示す。実際の用途においては、このテンプレート画像の集合は数百に迫るか、又はそれを上回り得る。レイアウトエディタ30は、図13Bに示すような、これらの固有画像及び固有値を算出する。この固有画像の集合は、元の7つのテンプレート画像を近似的に表現するため、より高い固有値を有するそれらの一部のみを用いて選択し得る。次いで、図13の7つのテンプレート画像のそれぞれを、選択固有画像により構成されたマトリックスに乗じ、この文書サブタイプについてのテンプレートデータとしてのリファレンス重み付け係数ベクトルを得て、これをデータベース32に格納する。] 図13A 図13B 図13C 図2 図9
[0088] 図13Cの画像230を新たに捕捉したら、文書識別モジュール40は図9の固有画像文書マッチング処理164Bを起動し、画像データを、選択固有画像によって構成された、上述の同じマトリックスに乗じて重み付け係数ベクトルを得る。固有画像文書マッチング処理は、この新たな重み付け係数ベクトルを、現在比較中の複数の文書サブタイプオブジェクト、すなわち、トレーニングに用いる図13Aの7つの米国運転免許証に関連付けられた、事前計算済みのリファレンス重み付け係数ベクトルのそれぞれと比較する。例えば、文書識別モジュール40は、ハミング距離計算アルゴリズム又は他のアルゴリズムを用いて新規捕捉画像データの7つのテンプレート画像データへの距離を決定し、図13Cに示す例示的結果232を得ることができる。] 図13A 図13C 図9
[0089] 新規捕捉画像データについての結果232は、選択固有画像によりハミング距離アルゴリズムに従って決定された多次元空間において、ミネソタ州の文書サブタイプオブジェクトに関連したテンプレートデータからの最短距離528.21を示す。この距離は他の6つの文書サブタイプオブジェクトに関連したものに比較してはるかに小さく、最近傍(NN)方法に基づいた文書分類において、より良好な一致を示している。]
[0090] 文書識別モジュール40によって特定の文書タイプが認識された後に、図2の文書処理エンジン36によって認証を行うための次の工程は、文書認証モジュール42を起動し、要求される特徴の存在を確定することである。実際には、認証特徴は上述した識別特徴と交換可能な概念である。つまり、画像解析方法が検証器、確認器、又は更に分類器の実行にも適用し得る。基本的な指針としては、識別時間が最短で正しい文書タイプの拒絶率が最小の識別を行うため、できるだけ少数の可能な特徴を利用し、残りは、偽造品の許容確率がより低い識別済みの文書からのみ起動される、いわゆる認証処理に用いることである。] 図2
[0091] 偽造品を識別するために使用された印刷技術の特徴を取得するための例示的な検証方法として、ここでは3方法を提示する。原本を複製するために、写真式複写機などの代替的な印刷技術を用いることは、偽造の一般的な形態である。実際には、文書認証モジュール42は、ここに提示する例示的な3技術以外にも多くの方法を用い得る。]
[0092] 例えば凹版印刷は、原本の印刷のためにドイツで1430年代までに発明されたが、今でも広く用いられている方法の1つである。この方法は板を彫り込み、又は切り込んで凹部を設け、これにインクを満たし、圧力をかけて紙に刷り込み領域を写し取ることで、刻んだ外観が3D効果をもって得られるものである。偽造によく用いられる安価な代替方法は、名刺の印刷に一般に用いられるようなサーモグラフ(盛り上げインク)である。]
[0093] 3M文書読取り器のCCDカメラのような透視環境下で見ると、ある顕著な3D効果が捕捉され得る。3Mの名刺のサンプルにおけるように、図14Aの画像240がフラットベッドスキャナーによって得られるのに対し、図1の文書読取り器11によって図14Bの画像244が捕捉された。図14Bに示すように、画像240は、文字からの影を含む3D効果を示す。] 図1 図14A 図14B
[0094] 上記2つの画像における文字「M」の右足を水平に横切る方法の濃度変化プロファイルを取ると、ある顕著な相違が図14Aの画像242と図14Bの画像246に見られる。すなわち、スキャナーにおいては、この線を横切る方向の濃度レベル変化は、図14Aのプロファイル242においては常に対象であるのに対し、CCDカメラ殻の場合には、図14Bのプロファイル246に示すように、そうではない。濃い谷は内側に向かってカメラの起点位置へと偏移している。全視野にわたって測定すると、3Mの名刺について図14Cに示したように、各谷が示す非対称な偏移は変化し、視野の基点からずれた距離との関係で定量化され得る。図示の例におけるずれの測定単位はミル(0.0254mm)である。] 図14A 図14B 図14C
[0095] この技術は、画像からの正確な3Dパラメータを測定することにより(例えばその線がどれだけ高く上がっているかは、図14Cにおける傾斜がどれだけ急峻かによって決定し得る)、非対称性が存在するかを確定するために、いわゆる「陰影から立体」を起こす技術から容易に応用可能であり得る。] 図14C
[0096] もう1つの印刷技術はエングレービング(engraving)である。これは、印刷表面に彫刻を施し、それによって上述した方法とは逆の光学的効果を得るものある。上述したプロファイリング技術は、そのような技法から得られる画像及び/又は文字の3D特徴を解析するためにも同様に利用し得る。]
[0097] 画像を紙又はその他の媒体に印刷する場合、連続的結像(例えば写真及びIDプリンター)に加え、連続色調画像をバイナリ画像(単数又は複数)によって模す、更に2つの複写技術が一般に使用される。すなわち、様々な大きさの等間隔に配置したドット(網点)を用いるハーフトーンスクリーニング技術(振幅変調)と、同じ大きさのドットを異なる位置及び密度で配置するストキャスティックスクリーニング技術(周波数変調)である。これらの印刷技術のサンプルを図15Aのサンプル画像250、252、及び254に示す。] 図15A
[0098] 規則的間隔のドットによるものについての測定では、画像構造解析からの共分散マトリックス方法が良好であるが、ストキャスティックスクリーニングについては高周波ノイズ又はエッジ検出が理想的な指標である。]
[0099] 別の例として、通常は多重画面によってカラー画像を再生することがあり、ハーフトーンスクリーニングにおいて、図15Bのサンプル256及び図15Bの拡大画像258に示すように、異なる角度のCMYK4色平面によってロゼットパターンが構築される。] 図15B
[0100] 図15Cは、カラーCCDカメラで捕捉した画像256のRGB平面を分解することによって生成されたサンプル画像260,262及び264の集合を示す。図15Cの画像の集合は、同様に処理し得る、図15Cのサンプル画像260,262及び264中の角度のついたスクリーンを示す。] 図15C
[0101] 複製は文書偽造において最も一般的な例であるが、スキャンされたテキストはまた、図15Dに連続色調方法による画像266、ハーフトーン方法による画像268、及びストキャスティックスクリーニング方法による画像270を比較対照して示すように、異なるスクリーニング方法を用いることによって変化する。この例では、線の幅及びエッジの曲率の変動に、スクリーニング方法によって元の文書の複製中に生じた文字変形がよく表れ得る。] 図15D
[0102] 上述した伝統的な印刷技術に加え、多数の新しい方法が考案され、媒体上への画像の複写を制限するのみならず、他の情報を微細構造の形で伝えることで、偽造防止に更に役立っている。これらの方法の大部分はそれぞれに独自のアルゴリズムによってのみデコードされるが、経済的な解決として認証目的のため、画像処理中に一定の単純な特徴抽出法を用いてその特徴の存否を確定することもなお、可能である。いくつかの例を以下に述べる。]
[0103] 例えば、企業によっては、機械可読コード及び人間が読めるコンテンツの両方が識別できるように、人間が読めるコンテンツをオーバーレイした機械可読コードを含む文書をエンコード及びデコードする。実施に当たっては、グレースケール画像データ値に基づいたコード化されたグリフ色調セルを含む背景画像が作成される。ここで、図16Aに示すように、各ハーフトーンセルは、少なくとも2つの区別可能なパターンの1つを含む。] 図16A
[0104] 近年提唱された別の方法は、図16Bの画像280に示すように、いくつかのドットを偏移させることで、通常のハーフトーンスクリーニング上に位相変調を施すことに基づく。この場合、同一のスクリーニング周波数を有するデコード用レンチキュラーレンズによって、図16Bの画像282内にエンコードされた文字「SI」が見えるようになる。ここに述べた技術はこのような画像に容易に適用し得る。] 図16B
[0105] もう1つの方法では、カラー又はグレースケール像面(単数又は複数)を、各層が他の層に対して異なった確度で配置された微細文字層に変換する。微細文字幅は、図16C及びこれにオーバーレイした拡大図に示すように、グレースケール又は(多色の場合には)カラー値に基づいて、その幅に変調が施される。ここに述べた技術はこのような画像に容易に適用し得る。] 図16C
[0106] このシステムがいかに迅速かつ効率的に文書を高精度で識別するかを紹介する一例として、図17A〜17Cに、ICAO準拠のMRZゾーンを用いることなく、206種の異なった米国運転免許証の集合から現行のニューヨーク州の運転免許証を識別かつ検証する処理を例証する。画像の属性を抽出及び再帰的に処理するために起動した、実装分類器及び確認器を下の表Iに列挙する。] 図17A 図17B 図17C
[0107] ]
[0108] 表Iの右欄は、それぞの光源を示す。このリストは計算効率順になっており、順に実行される。最後の2つは、文書中に予期される2つの画像パターン一致により定義される。]
[0109] 図17Bは本実施例において、1つの検査で、各分類器又は確認器ごとにいくつの文書が精査されたかを示す。図示のように、空白分類器/確認器は、検査開始時、206種の候補すべてについて照査を行ったが、可視パターンマッチング分類器/確認器では正しい文書タイプである可能性のあるものはただ1つに限られている。図17Bの曲線は、可能な候補が訳200ミリ秒の間に、効率的に絞り込まれていく様子を例証している。図17Cは各動作ごとの拒絶率を示し、これはこのタイプの文書に関しての文書識別フレームワーク上の識別成績を表す。ロゴパターンマッチング分類器/確認器は、15の候補から1つの正しい文書を識別し他の14を破棄ことで、拒絶率93%という最高の成績を示す一方、これは比較的時間のかかる作業である。] 図17B 図17C
[0110] 図17Aは、この文書が現行のニューヨーク州の運転免許証として識別された後に呼び出される成功認証結果の一部を示し、それぞれ赤外、可視、紫外、及び再帰反射による4つの画像中に予期される機密画像パターンを探査中の様子である。結果は、システムが識別及び継続検証の両方を完了後は、図8Aに示したものと同様である。] 図17A 図8A
[0111] 本発明の様々な実施形態について説明してきた。これら及び他の実施形態は、以下の特許請求の範囲に含まれる。]
权利要求:

請求項1
未知の文書の1つ以上の捕捉画像を受信する工程と、前記捕捉画像から属性を抽出し前記未知の文書を文書タイプオブジェクトの1つに代表される文書タイプとして類別し確認するために複数の再帰的処理を参照する複数の文書タイプオブジェクトを、動的文書識別フレームワークに従ってデータ構造内に格納する工程と、前記データ構造の前記文書タイプオブジェクトを、前記複数の再帰的処理を前記捕捉画像に適用することにより抽出した前記属性に基づいて変更可能な順序で走査する工程と、前記データ構造の走査において前記未知の文書を前記複数の文書タイプオブジェクトの1つとして識別する工程と、を含む方法。
請求項2
捕捉画像を受信する工程が、赤外(IR)画像、可視光スペクトル画像、紫外(UV)画像、及び再帰反射画像の1つ以上を受信する工程を含む、請求項1に記載の方法。
請求項3
前記未知の文書の捕捉画像を受信する工程が、パスポート、運転免許証、出生証明書、金融書類、商業手形、身分証明書、及びソーシャルセキュリティー(社会保障)カードのうちの1つの捕捉画像を受信する工程を含む、請求項1に記載の方法。
請求項4
前記複数の文書タイプオブジェクトを格納する工程が、前記複数の文書タイプオブジェクトを動的文書識別フレームワークによる木データ構造内に格納する工程を含む、請求項1に記載の方法。
請求項5
前記複数の文書タイプオブジェクトを格納する工程が、前記複数の文書タイプオブジェクト及びサブタイプオブジェクトを前記動的文書識別フレームワークによるデータ構造内に、サブ文書タイプを前記文書タイプオブジェクトの子として備える再帰的方法で格納する工程を含む、請求項1に記載の方法。
請求項6
前記複数の文書タイプオブジェクトを格納する工程が、前記複数の処理の1つ以上を参照する分類器オブジェクトを格納する工程を含み、前記データ構造を走査する工程が、前記分類器オブジェクトを走査することで、前記分類器オブジェクトによって参照される1つ以上の処理を起動して可能なリファレンス文書タイプオブジェクトの集合を決定し、かつ前記集合を走査して前記捕捉画像を前記複数の可能なリファレンス文書タイプオブジェクトの1つとして識別する工程を含む、請求項1に記載の方法。
請求項7
前記複数の文書タイプオブジェクトを格納する工程が、最小確度値と、前記複数の処理の1つ以上を参照する確認器オブジェクトとを格納する工程を含み、前記集合を走査する工程が、前記確認器オブジェクトを走査することで、前記確認器オブジェクトによって参照される前記複数の処理の1つ以上を起動し、前記確認器オブジェクトによって参照される前記複数の処理の1つ以上を起動することから受信した1つ以上の戻り値から確度値を算出し、前記分類器オブジェクトにより前記リファレンス文書タイプオブジェクトと比較することによって前記未知の文書から抽出された属性を処理し、かつ前記確度値と最小確度値との比較に基づいて、前記集合から前記可能なリファレンス文書タイプオブジェクトの1つ以上を選択的に破棄する工程を含む、請求項6に記載の方法。
請求項8
前記複数の文書タイプオブジェクトを格納する工程が、それぞれ前記複数の処理の1つ以上を参照する第1及び第2の確認器オブジェクトを格納する工程を含み、前記集合を走査する工程が、前記第1の確認器オブジェクトを走査し、前記第1の確認器オブジェクトによって参照される前記処理を起動後に受信した結果値に基づいて第1の確度値を算出する工程と、前記第2の確認器オブジェクトを走査し、前記第2の確認器オブジェクトによって参照される前記処理を起動後に受信した結果値に基づいて第2の確度値を算出する工程と、前記第1及び第2の確度値の比較に基づいて、前記捕捉画像を前記複数の可能なリファレンス文書タイプオブジェクトの1つとして識別する工程とを含む、請求項6に記載の方法。
請求項9
前記複数の文書タイプオブジェクトを格納する工程が、複数の優先度を格納する工程と、前記複数の優先度のそれぞれを前記データ構造内の前記複数の文書タイプオブジェクト1つと関連付ける工程と、前記データ構造を走査する工程が、前記複数の可能なリファレンス文書タイプオブジェクトのそれぞれに関連した前記優先度に基づいて前記データ構造を走査する工程と、を含む、請求項6に記載の方法。
請求項10
最近確認された文書タイプオブジェクトの集合を待ち行列データ構造内に格納する工程を更に含み、前記データ構造を走査する工程が、前記データ構造内の最近確認された文書タイプオブジェクトの前記集合を走査する工程を含む、請求項6に記載の方法。
請求項11
前記データ構造を走査する工程が、前記複数の処理のレイアウトマッチング識別処理を起動し、前記捕捉画像の複数の連続領域をセグメント化及び識別し、前記複数の連続領域を分類し、前記複数の連続領域間の関係の集合を確立することによって前記捕捉画像を図式化し、前記複数の連続領域を前記複数の文書タイプオブジェクトの1つに関連したテンプレートデータと比較し、かつ前記比較に基づき、前記捕捉画像が、現在比較の対象となっている、前記複数の文書タイプオブジェクトの1つに属するかを決定する工程を含む、請求項6に記載の方法。
請求項12
前記データ構造を走査する工程が、前記複数の処理の固有画像文書マッチング処理を起動し、前記複数の可能なリファレンス文書タイプオブジェクトの固有画像及び固有値を算出し、より大きな固有値を有する、前記データ構造中に格納された前記リファレンス文書タイプオブジェクトの1つ以上を選択し、学習段階において前記データ構造中に格納された前記複数の可能なリファレンス文書タイプオブジェクトのそれぞれのリファレンス重み付け係数ベクトルを算出し、前記捕捉画像の重み付け係数ベクトルを算出し、前記画像と文書の重み付け係数ベクトルとを比較して距離を算出し、かつ前記距離に基づき、前記未知の文書が現在比較の対象となっている前記複数の可能なリファレンス文書タイプオブジェクトの1つに属するかを決定する工程を含む、請求項6に記載の方法。
請求項13
前記識別処理の結果が1つ以上の異なる文書タイプの候補リストを含み、候補リストが前記確度値に基づいて順序付けられたリストであり、前記識別処理の結果を、サブ文書タイプの継続処理を決定するための入力として使用する、請求項7に記載の方法。
請求項14
自動方法を適用して、サンプル画像から文書タイプのリファレンスデータを獲得する工程と、前記データ構造のノードによる起動のために前記リファレンスデータを格納する工程と、動的方法を適用して前記未知の文書を前記データ構造内の文書の1つとして類別し、継続処理及び前記データ構造の走査を誘起する工程と、を更に含む、請求項1に記載の方法。
請求項15
識別された文書の真正性を確定する工程が、前記未知の文書の印刷方法が凹版印刷又はエングレービング印刷技術によるものである可能性を評価する第1の方法、画像及びテキストの印刷に用いられたスクリーニング方法を判別する第2の方法、又は前記未知の文書の印刷材料が微細構造を含むかを評価する第3の方法の1つ以上を起動する工程と、前記可能性に基づいて、前記識別された文書が真正のものであるか否かを決定する工程と、を含む、請求項1に記載の方法。
請求項16
前記未知の文書を、無線自動識別(RFID)データ、電子パスポートデータ、スマートカードデータ、又は磁気ストリップデータの1つ以上を含む埋め込み電子情報を組み込んだ機密文書として識別及び確認する工程を更に含む、請求項1記載の方法。
請求項17
ユーザーに視覚又は音声形式でフィードバックを提示することを含む、識別及び確認処理の結果を前記ユーザーに提示する工程を更に含む、請求項1記載の方法。
請求項18
未知の文書から1つ以上の画像を捕捉する画像捕捉インターフェースと、前記捕捉画像から属性を抽出するために複数の再帰的処理を参照する複数の文書タイプオブジェクトを、動的文書識別フレームワークに従ってデータ構造内に格納するメモリと、前記データ構造の前記文書タイプオブジェクトを、前記複数の再帰的処理を前記捕捉画像に適用することにより抽出した前記属性に基づいて変更可能な順序で走査し、前記データ構造の走査において前記未知の文書を前記複数の文書タイプオブジェクトの1つとして識別する文書処理エンジンと、を含む、機密文書認証装置。
請求項19
前記画像捕捉インターフェースが、赤外(IR)画像、可視光スペクトル画像、紫外(UV)画像、及び再帰反射画像の1つ以上を受信することによって前記捕捉画像を受信する、請求項18に記載の機密文書認証装置。
請求項20
前記画像捕捉インターフェースが、パスポート、運転免許証、出生証明書、金融書類、商業手形、身分証明書、ソーシャルセキュリティーカードのうちの1つの捕捉画像を受信することによって前記未知の文書の前記捕捉画像を受信する、請求項18に記載の機密文書認証装置。
請求項21
前記メモリが、前記複数の文書タイプオブジェクトを動的文書識別フレームワークに従って木データ構造内に格納することにより前記複数の文書タイプオブジェクトを格納する、請求項18に記載の機密文書認証装置。
請求項22
前記メモリが、複数の文書タイプ及びサブタイプオブジェクトを動的文書識別フレームワークに従って、再帰的方法による処理のための親及び子ノードとして相互結合された状態で前記データ構造内に格納することにより、前記複数の文書タイプオブジェクトを格納する、請求項18に記載の機密文書認証装置。
請求項23
前記文書処理エンジンが、前記データ構造を走査する文書識別モジュールを含む、請求項18に記載の機密文書認証装置。
請求項24
前記メモリが、前記複数の処理の1つ以上を参照する分類器オブジェクトを格納することによって前記複数の文書タイプオブジェクトを格納し、前記文書識別モジュールが、前記分類器オブジェクトによって参照される1つ以上の処理を起動して可能なリファレンス文書タイプオブジェクトの集合を決定することと、前記集合を走査して前記捕捉画像を前記複数の文書タイプオブジェクトの1つとして識別することと、によって前記データ構造を走査する、請求項23に記載の機密文書認証装置。
請求項25
前記メモリが、最小確度値と、前記複数の処理の1つ以上を参照する確認器オブジェクトを格納することによって前記複数の文書タイプオブジェクトを格納し、前記文書識別モジュールが、前記確認器オブジェクトの集合にアクセスし、前記文書識別モジュールが、前記確認器ノードによって参照される前記複数の確認器処理を起動し、前記確認器オブジェクトにより参照される処理を起動することから得られる戻り値の1つ以上から確度値を算出し、かつ前記確度値と前記最小確度値との比較に基づいて、前記可能なリファレンス文書タイプオブジェクトの1つ以上を前記集合から選択的に破棄することによって、前記集合を走査することとする、請求項24に記載の機密文書認証装置。
請求項26
前記メモリが、それぞれ複数の確認器処理の1つ以上を参照する、2つの確認器オブジェクトを格納することによって、前記複数の文書タイプオブジェクトを格納し、前記文書識別モジュールが、前記第1の確認器オブジェクトを走査することで、前記文書識別モジュールが、前記第1の確認器オブジェクトによって参照される前記確認器処理を起動後に受信した結果値に基づいて第1の確度値を算出し、前記第2の確認器オブジェクトを走査することで、前記文書識別モジュールが、前記第2の確認器オブジェクトによって参照される前記確認器処理を起動後に受信した結果値に基づいて第2の確度値を算出し、かつ前記第1及び第2の確度値の比較に基づいて前記捕捉画像を前記リファレンス文書タイプオブジェクトの前記複数の文書タイプの1つとして識別することによって、前記集合を走査する、請求項24に記載の機密文書認証装置。
請求項27
前記メモリが、複数の優先度を更に格納し、前記複数の優先度のそれぞれを前記データ構造内の前記複数の文書タイプオブジェクトの1つに関連付け、前記文書識別モジュールが、前記複数の文書タイプオブジェクトのそれぞれに関連した前記優先度に従って前記データ構造を走査することにより前記データ構造を走査する、請求項24に記載の機密文書認証装置。
請求項28
前記メモリが更に、最近確認された文書タイプオブジェクトの集合を待ち行列データ構造内に格納し、前記文書識別モジュールが、前記データ構造内の、前記最近確認された文書タイプオブジェクトの集合をまず走査することにより前記データ構造を走査する、請求項24に記載の機密文書認証装置。
請求項29
前記文書識別モジュールが、前記複数の処理の固有画像文書マッチング識別処理を起動することにより前記データ構造を走査し、これにより前記処理によって前記文書識別モジュールが、前記捕捉画像の複数の連続領域をセグメント化及び識別し、前記複数の連続領域を分類し、前記複数の連続領域間の関係の集合を確立することによって前記捕捉画像を図式化し、前記複数の連続領域を前記データ構造に格納された前記複数の文書タイプオブジェクトの1つに関連したテンプレートデータと比較し、かつ前記比較に基づき、前記捕捉画像が、現在比較の対象となっている前記複数の文書タイプオブジェクトの1つに属するかを決定する、請求項24に記載の機密文書認証装置。
請求項30
前記文書識別モジュールが、前記複数の処理の固有画像文書マッチング処理データ構造を起動することによって前記データ構造を走査することで、複数のリファレンス文書タイプオブジェクトの固有画像及び固有値を算出し、大きな固有値を有する、前記リファレンス文書タイプオブジェクトの1つ以上を選択し、前記学習段階において前記データ構造中に格納された前記複数の可能なリファレンス文書タイプオブジェクトのそれぞれのリファレンス重み付け係数ベクトルを算出し、前記捕捉画像の重み付け係数ベクトルを算出し、前記画像と文書の重み付け係数ベクトルを比較して距離を算出し、前記距離に基づき、前記未知の文書が現在比較の対象となっている前記複数のリファレンス文書タイプオブジェクトの1つに属するかを決定する、請求項24に記載の機密文書認証装置。
請求項31
プログラマブルプロセッサに、未知の文書の捕捉画像を受信させ、複数の処理を参照する複数の文書タイプオブジェクトを、動的文書識別フレームワークに従ってデータ構造内に格納させ、かつ前記複数の処理の1つ以上を選択的に起動することによって前記データ構造を走査させ、前記捕捉画像に基づいて未知の文書を前記複数の文書タイプオブジェクトの1つとして識別させるための、命令を含む、コンピュータ可読媒体。
类似技术:
公开号 | 公开日 | 专利标题
US10440219B2|2019-10-08|Apparatus and methods for computerized authentication of electronic documents
US10607073B2|2020-03-31|Systems and methods for classifying payment documents during mobile image processing
US9769354B2|2017-09-19|Systems and methods of processing scanned data
US9946865B2|2018-04-17|Document authentication based on expected wear
Piva2013|An overview on image forensics
US9754164B2|2017-09-05|Systems and methods for classifying objects in digital images captured using mobile devices
EP2897082B1|2019-07-31|Methods and systems for improved license plate signature matching
US10242285B2|2019-03-26|Iterative recognition-guided thresholding and data extraction
US10354472B2|2019-07-16|Self-learning system and methods for automatic document recognition, authentication, and information extraction
US20160253359A1|2016-09-01|Efficient image matching for large sets of images
CN102144236B|2013-08-21|用于图像和视频ocr的文本定位
USRE44139E1|2013-04-09|Method and apparatus for decoding mixed code
US8189862B2|2012-05-29|Visible authentication patterns for printed document
JP4557866B2|2010-10-06|混合コード、及び、混合コードの生成方法と装置、記録媒体
JP4515999B2|2010-08-04|混合コードのデコーディング方法及びその装置、記録媒体
US10552848B2|2020-02-04|Method and system for determining whether a barcode is genuine using a deviation from an idealized grid
US7711140B2|2010-05-04|Secure recorded documents
US5845008A|1998-12-01|Image processing device and method for identifying an input image, and copier scanner and printer including same
JP2016540329A|2016-12-22|2次元バーコードおよびそのようなバーコードの認証方法
US5293429A|1994-03-08|System and method for automatically classifying heterogeneous business forms
US8666174B2|2014-03-04|Techniques for shape clustering and assignment of character codes in post optical character recognition processing
US7031519B2|2006-04-18|Orthogonal technology for character recognition
US8744196B2|2014-06-03|Automatic recognition of images
Alkawaz et al.2018|Detection of copy-move image forgery based on discrete cosine transform
US6370271B2|2002-04-09|Image processing apparatus and methods for pattern recognition
同族专利:
公开号 | 公开日
BRPI0819426A2|2015-05-05|
TW200929013A|2009-07-01|
EP2232399A4|2016-03-23|
WO2009075987A3|2009-08-13|
US20090152357A1|2009-06-18|
AU2008335637B2|2012-02-02|
TWI484421B|2015-05-11|
CA2708588A1|2009-06-18|
KR20100101141A|2010-09-16|
EP2232399A2|2010-09-29|
US8540158B2|2013-09-24|
IL206309D0|2010-12-30|
NZ586077A|2012-09-28|
CN101925904A|2010-12-22|
MX2010006496A|2010-09-07|
ZA201004858B|2011-03-30|
AU2008335637A1|2009-06-18|
WO2009075987A2|2009-06-18|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
法律状态:
优先权:
申请号 | 申请日 | 专利标题
[返回顶部]