专利摘要:
複数基準フレーム動き推定(MRFME)において複数の基準フレームを使用する場合の計算量を所望の性能レベルで評価することのできる、ビデオ符号化における動き推定のための効率のよい時間探索範囲予測が提供される。これについては、通常の動き推定またはMRFMEを使用することの利得を求め、MRFMEが選択される場合には、フレームの数を決定することができる。よって、少なくとも性能において閾値利得を提供する場合には、MRFMEの計算量および/または大きい時間探索範囲を利用することができる。逆に、MRFMEの計算量がビデオブロック予測に十分な利益をもたらさない場合には、より小さい時間探索範囲(より少数の基準フレーム)を使用することができ、または、MRFMEより優先して通常の動き編集を選択することができる。
公开号:JP2011510598A
申请号:JP2010544302
申请日:2008-12-29
公开日:2011-03-31
发明作者:アウ,オスカー・チー・リム;グオ,リーウェイ
申请人:ホンコン・テクノロジーズ・グループ・リミテッド;
IPC主号:H04N7-32
专利说明:

[0001] 以下の説明は一般にディジタルビデオ符号化に関し、より詳細には、時間探索範囲の1つまたは複数の基準フレームを使用した動き推定の技法に関する。]
背景技術

[0002] コンピュータおよびネットワーキング技術が、高コストで低性能なデータ処理システムから低コストで高性能な通信、問題解決、および娯楽システムへと発展したことにより、オーディオ信号およびビデオ信号を、コンピュータまたは他の電子機器においてディジタル方式で記憶させ、送信する必要および需要が高まっている。例えば、コンピュータユーザは、パーソナルコンピュータ上で毎日オーディオおよびビデオを再生/記録することができる。この技術を円滑に行わせるために、オーディオ/ビデオ信号を1つまたは複数のディジタル形式に符号化することができる。パーソナルコンピュータを使用して、ビデオカメラ、ディジタルカメラ、オーディオレコーダなどといったオーディオ/ビデオ取込み機器からの信号をディジタル方式で符号化することができる。加えて、または代わりに、これらの機器自体がディジタルメディアに記憶するために信号を符号化することもできる。ディジタル方式で記憶され、符号化された信号は、コンピュータまたは他の電子機器上で再生するために復号することができる。符号器/復号器は、MPEG(Moving Picture Experts Group)形式(MPEG−1、MPEG−2、MPEG−4など)などを含む様々な形式を使用して、ディジタルアーカイブ、編集、および再生を行うことができる。]
[0003] さらに、これらの形式を使用し、コンピュータネットワークを介して機器間でディジタル信号を送信することもできる。例えば、コンピュータと、ディジタル加入者線(DSL)、ケーブル、T1/T3などといった高速ネットワークとを利用して、コンピュータユーザは、世界中のシステム上にあるディジタルビデオコンテンツにアクセスし、および/またはこれをストリーミングすることができる。こうしたストリーミングのための帯域幅は通常、ローカルアクセスの帯域幅ほどの大きさはなく、低コストの処理能力は増加し続けているため、符号器/復号器は、多くの場合、信号を送信するのに必要とされる帯域幅の量を減らすために、符号化/復号ステップにおいてより多くの処理を求めようとする。]
[0004] したがって、動き推定(ME)といった、前の基準フレームに基づく画素または領域の予測を提供して、帯域幅で送信されるべき画素/領域情報の量を低減するための符号化/復号の方法が開発されている。通常この方法では、予測誤り(動き補償残渣など)だけを符号化すればよい。時間探索範囲を複数の前の基準フレームまで拡張する(複数基準フレーム動き推定(MRFME)など)ための、H.264といった規格が公開されている。しかし、MRFMEで利用されるフレーム数が増加するに従って、これの計算量も増加する。]
課題を解決するための手段

[0005] 以下に、本明細書で示すいくつかの態様の基本的な理解を提供するための簡略化した概要を示す。この概要は、包括的な概説ではなく、本明細書で示す様々な態様の主要な/不可欠の要素を識別するためのものでも、その範囲を正確に叙述するためのものでもない。この概要の唯一の目的は、後述するより詳細な説明への前段としていくつかの概念を簡略化した形で提示することである。]
[0006] 単一基準フレーム動き推定(ME)もしくは複数基準フレーム動き推定(MRFME)を使用することの利得を求め、および/またはMRFMEにおけるフレームの数を決定することのできる、ビデオ符号化における可変フレーム動き推定が提供される。この利得が所望の閾値を満たし、またはこれを超える場合、適切なMEまたはMRFMEを利用してビデオブロックを予測することができる。利得の決定または計算は、評価される各基準フレームにわたる動き補償残渣の線形モデルに基づくものとすることができる。これについては、MRFMEによって動きを推定する効率のよい方法を生み出すために、MRFMEを利用することの性能利得とその計算量とを均衡させることができる。]
[0007] 例えば、評価されるべきビデオブロックよりも時間的に前にある第1の基準フレームから開始して、基準フレームの動き補償残渣が、そのビデオブロックと比べて、所与の利得閾値を満たし、またはこれを超える場合、通常のMEではなく、MRFMEを行うことができる。後続の基準フレームの動き補償残渣が、前の基準フレームと比べて、同じ、または別の閾値を満たす場合、次の基準フレームを用いてMRFMEを行うことができ、次のフレームを追加することの利得が、所与の閾値に従い、MRFMEの計算量によって正当化されなくなるまで、以下同様に行うことができる。]
[0008] 前述の目的および関連する目的を達成するために、本明細書では、いくつかの例示的態様を、以下の説明および添付の図面と関連付けて説明する。これらの態様は、実施し得る様々な方途を示すものであり、これらの方途すべてが本発明においてカバーされるべきものである。他の利点および新規の特徴は、以下の詳細な説明を、図面と併せて考察すれば明らかになるはずである。]
図面の簡単な説明

[0009] ビデオを符号化するために動きを推定する例示的システムを示すブロック図である。
1つまたは複数の基準フレームを使用して動きを推定することの利得を評価する例示的システムを示すブロック図である。
ビデオブロックの動きベクトルを計算し、1つまたは複数の基準フレームを使用してビデオブロックの動きを推定することの利得を求める例示的システムを示すブロック図である。
推論を利用して動きを推定し、および/またはビデオを符号化する例示的システムを示すブロック図である。
1つまたは複数の基準フレームを利用することの利得に基づいて動きを推定することを示す例示的流れ図である。
1つまたは複数のビデオブロックの残留エネルギーを比較して時間探索範囲を決定することを示す例示的流れ図である。
動き推定に1つまたは複数の基準フレームを使用することによる計算された利得に基づいて時間探索範囲を決定することを示す例示的流れ図である。
適切な動作環境を示す概略的ブロック図である。
コンピューティング環境の例を示す概略的ブロック図である。]
実施例

[0010] 動き補償残渣の線形モデルに基づく複数基準フレーム動き推定(MRFME)のための効率のよい時間探索範囲予測が提供される。例えば、MRFMEにおいてより多数またはより少数の基準フレームを探索することの利得は、所与の領域、画素、またはフレームの他の部分について現在の残渣を利用することによって推定することができる。時間探索範囲は、推定に基づいて決定することができる。したがって、フレームの所与の部分について、MRFMEにいくつかの前の基準フレームを使用することの、MRFMEのコストおよび計算量に優る利点を、評価することができる。これについては、MRFMEが使用されるときに所与の閾値を上回る利得を有する部分について、MRFMEを利用することができる。MRFMEは(特に基準フレームの数が増加するにつれて)計算集約的となり得るため、MRFMEが利得閾値に従って有利であるときに、MRFMEを通常のMEより優先して使用することができる。]
[0011] 一例では、利得が閾値以上であるときに、MRFMEを通常のMEより優先して利用することができる。しかし、別の例では、所与の部分についてMRFMEで使用される基準フレームの数を、その基準フレームの数についてのMRFMEの利得計算に基づいて調整することができる。フレームの数は、例えば、所与の部分が符号化/復号に際して計算集約度と正確さまたは性能の最適な均衡に達するように調整することができる。さらに利得は、例えば、MRFMEの平均ピーク信号対雑音比(PSNR)(またはMRFMEで利用される基準フレームの数)に対する、通常のMEまたはより短い時間探索範囲(MRFMEで利用されるより少数の基準フレームなど)の平均PSNRにも関連し得る。]
[0012] 次に、本開示の様々な態様を、添付の図面を参照して説明する。図面全体を通じて、類似の番号は類似の要素または対応する要素を指す。しかし、図面および図面に関連する詳細な説明は、特許請求される主題を開示の特定の形だけに限定するためのものではないことを理解されたい。むしろ、その目的は、特許請求される主題の趣旨および範囲内に該当するすべての改変形態、均等物、および代替形態を網羅することである。]
[0013] 次に各図を見ると、図1には、ディジタル方式でビデオを符号化/復号するための動きの推定を円滑に行わせるシステム100が示されている。1つまたは複数の基準フレームを利用してビデオブロックを予測することのできる動き推定コンポーネント102と、少なくとも一部は予測されたブロックに基づいてディジタル形式との間でビデオを符号化/復号するビデオ符号化コンポーネント104が設けられている。ブロックは、例えば、画素や、画素の集合体とすることもでき、実質的にはビデオフレームのどんな部分とすることもできることを理解されたい。例えば、符号化のためのフレームまたはブロックを受け取ると、動き推定コンポーネント102は、1つまたは複数の前のビデオブロックまたはフレームを評価して、予測誤りだけが符号化されればよいように、現在のビデオブロックまたはフレームを予測することができる。ビデオ符号化コンポーネント104は、後に続く復号のために、ブロック/フレームの動き補償残渣である予測誤りを符号化することができる。これは、一例では、少なくとも一部はH.264符号化規格を使用して達成することができる。] 図1
[0014] H.264符号化規格を利用することによって、この規格の諸機能を、本明細書で示す各態様によって効率性を高めながら活用することができる。例えば、ビデオ符号化コンポーネント104は、H.264規格を利用して、動き推定コンポーネント102による動き推定のための可変ブロックサイズを選択することができる。ブロックサイズの選択は、構成設定、あるブロックサイズの他のサイズに優る推定性能利得などに基づいて行うことができる。さらに、H.264規格は、動き推定コンポーネント102がMRFMEを行うのにも使用することができる。加えて、動き推定コンポーネント102は、所与のブロックについて動き推定を求めるために、いくつかの基準フレームを使用してMRFMEを行うことの利得、および/または(1つの基準フレームを用いて)通常のMEを行うことの利得を計算することもできる。前述のように、MRFMEは、利用される基準フレームの数(時間探索範囲など)が増加するに従って計算集約的となる可能性があり、そうした使用されるフレーム数の増加は、動き予測に際してわずかな利益しかもたらさない場合もある。よって、動き推定コンポーネント102は、所与のブロックについて効率のよい動き推定を提供するために、以下MRFGainと呼ぶ利得に基づいて、MRFMEにおける時間探索範囲の計算集約度と、正確さおよび/または性能との均衡を保つことができる。]
[0015] 一例においてMRFGainは、動き推定コンポーネント102により、少なくとも一部は所与のブロックの動き補償残渣に基づいて計算することができる。前述のように、これは、選択されたMEまたはMRFMEに基づく所与のブロックについての予測誤りとすることができる。例えば、ビデオブロックの複数の基準フレームを探索するためのMRFGainが小さい場合、さらに次の前の基準フレームを利用するプロセスは、高い計算量を生じるが、わずかな性能改善しかもたらすことができない。これについては、より小さい時間探索範囲を利用する方が望ましい可能性がある。逆に、ビデオブロックのMRFGainが大きい(または例えばある閾値を超える)場合、時間探索範囲を広げることは、計算量の増加を正当化するに足る、より大きな利益を生ずることができる。この場合には、より大きい時間探索範囲を利用することができる。動き推定コンポーネント102および/またはビデオ符号化コンポーネント104の機能は、様々なコンピュータおよび/または電子部品において実施することができることを理解されたい。]
[0016] 一例において、動き推定コンポーネント102、ビデオ符号化コンポーネント104、および/またはこれらの機能は、ビデオの編集および/または再生に際して利用される機器において実施することができる。そうした機器は、一例では、信号ブロードキャスト技術、記憶技術、(ネットワーキング技術などといった)会話サービス、メディアストリーミングおよび/またはメッセージングサービスなどにおいて、伝送に必要とされる帯域幅を最小化するためにビデオの効率的な符号化/復号を提供するのに利用することができる。よって一例では、より低い帯域幅容量に対応するローカル処理能力により重点を置くことができる。]
[0017] 図2を参照すると、いくつかの基準フレームを用いてMRFMEを利用することの利得を計算するシステム200が示されている。ビデオブロックおよび/またはブロックの動き補償残渣を予測するための動き推定コンポーネント102が設けられている。また、伝送および/または復号のために、ビデオのフレームまたはブロックを(MEの予測誤りなどとして)符号化するためのビデオ符号化コンポーネント104も設けられている。動き推定コンポーネント102は、所与のビデオブロックの動きを推定する際に、基準フレームコンポーネント204からの1つまたは複数の基準フレームを使用することの評価可能な利点を判定することができるMRFGain計算コンポーネント202を含むことができる。例えば、動き推定によって予測されるべきビデオブロックまたはフレームを受け取ると、MRFGain計算コンポーネント202は、そのビデオブロックの効率のよい動き推定を提供するために、MEまたはMRFMEを利用することの利得(および/またはMRFMEで使用すべき基準フレームの数)を求めることができる。MRFGain計算コンポーネント202は、基準フレームコンポーネント204を活用して、いくつかの前の基準フレームを取り出し、および/またはこれらを使用することの効率性を評価することができる。] 図2
[0018] 前述のように、MRFGain計算コンポーネント202は、より短い時間探索範囲とより長い時間探索範囲とのMRFGainを計算することができ、次いで動き推定コンポーネント102がそれを利用して、選択された推定の性能利得およびその計算量を考慮した均衡のとれた動き推定を決定することができる。さらに前述のように、時間探索範囲は、少なくとも一部は、所与のブロックまたはフレームについての動き補償残渣(または予測誤り)の線形モデルに基づいて選択することができる(したがってMRFGainを計算することができる)。]
[0019] 例えば、そのビデオ符号化が求められている現在のフレームまたはブロックをFと仮定すると、前のフレームは、{Ref(1),Ref(2),…Ref(k),…}で表すことができ、kはFと基準フレームRef(k)の間の時間的距離である。よって、F中の画素sが与えられた場合、p(k)で、Ref(k)からのsの予測を表すことができる。したがって、Ref(k)からのsの動き補償残渣r(k)は、r(k)=s−p(k)とすることができる。さらにr(k)は、ゼロ平均および分散σr2(k)を有する確率変数とすることができる。加えてr(k)は、
r(k)=rt(k)+rs(k)
として分解することもでき、式中、rt(k)は、FとRef(k)の間の時間的変化(temporal innovation)とすることができ、rs(k)は、基準フレームRef(k)におけるサブ整数(sub-integer)画素補間誤りとすることができる。よって、







とを、それぞれ、rt(k)とrs(k)の分散として表し、rt(k)とrs(k)が独立であるものと仮定すると、



である。]
[0020] 時間的距離kが増加するに従って、現在のフレーム(Fなど)と基準フレーム(Ref(k)など)の間の時間的変化も増加する。したがって、



はkが増加するに従って直線的に増加すると仮定することができ、



が与えられ、式中、Ctは、kに関する



の増加率である。ビデオフレームおよび/またはブロック内のオブジェクトが、Ref(k)とFの間の非整数画素変位(非整数画素動きなど)を伴って移動するとき、FとRef(k)におけるそのオブジェクトのサンプリング位置は異なり得る。この場合、Ref(k)からの予測画素はサブ整数位置にある可能性があり、これは、整数位置における画素を使用した補間を必要とし、サブ整数補間誤りrs(k)を招く結果になり得る。しかし、この補間誤りは時間的距離kに関連付けられないはずである。よって、



は、k−不変パラメータCsを使用してモデル化することができ、よって



である。したがって、MRFGain計算コンポーネント202によって利用される動き補償残渣の線形モデルは、
σr2(k)=CS+Ct*k
とすることができる。]
[0021] この線形モデルを使用して、MRFGain計算コンポーネント202は、所与のフレームまたはビデオブロックについて、ME、またはMRFMEのための基準フレームコンポーネント204からの1つまたは複数の基準フレームを利用することのMRFGainを、以下のようにして求めることができる。ブロック残留エネルギーを



として定義することができ、これは、ブロックについての平均のr2(k)である。通常は、



が小さいほどより良い予測、したがって、より高い符号化性能を表すことができる。MRFMEにおいて、



である、すなわち、フレームRef(k)より時間的に前のフレームのブロック残留エネルギーが、



より小さい場合、より多くの基準フレームを探索することによりMRFMEの性能を改善することができる。]
[0022] 続いて、それぞれ、ブロックについての平均の
rt2(k)

rS2(k)
である、







を定義することができる。上記線形モデルで仮定したように、
rS(k)

rt(k)
とは独立であるため、



である。MRFGainを求める際に、MRFGain計算コンポーネント202は、kを増加させた場合の







の挙動を調べて、MEまたはMRFMEで利用すべき基準フレームの効率的な数を、以下のように獲得することができる。時間的距離が増加すると、フレーム間の時間的変化も増加する。よって、rt(k+1)はrt(k)より大きな振幅を持つことができ、これにより、



と表すことができる。逆に、現在のフレームF中のオブジェクトは、場合によっては、Ref(k)に関しては非整数画素動きを有し、Ref(k+1)に関しては整数画素動きを有し得る。この場合、r(k)にはサブ整数画素補間誤りが生じる(例えば



など)が、r(k+1)における補間誤りは0である(例えば、



など)。F中のオブジェクトがRef(k+1)に関して整数画素動きを有するものと仮定すると、



である。よって、時間探索範囲をRef(k)からRef(k+1)まで拡大するとき、



であり、



であるものと仮定すると、残留エネルギーΔ(k)の増加は、



とすることができる。]
[0023] この場合、Δt(k)<Δs(k)では、Δ(k)は負になり、これは、基準フレームコンポーネント204からのもう1つの基準フレームRef(k+1)を探索することにより残留エネルギーがより小さくなり、したがって、ビデオ符号化コンポーネント104による符号化性能が改善されることを意味することができる。さらに、Δs(k)が大きく、Δt(k)が小さい場合には、動き推定において次の基準フレームを利用することによって大きな残留エネルギー、よって、大きなMRFGainを達成することができる。]
[0024] この例では、Δs(k)とΔt(k)の値は、前述の線形モデルのパラメータ(CsやCtなど)に関連するものである。パラメータCsは補間誤り分散



を表すことができる。したがって、大きいCsを有するビデオ信号(または信号のブロック)では、rs(k)は大きい振幅を生じさせることもでき、よって、



も大きくなり得る。



の増加率としてのパラメータCtの場合、小さいCtを有するビデオ信号では、







が類似したものになり得、よって、



が小さくなり得る。したがって、大きいCsと小さいCtを有するビデオ信号(またはブロック)では、対応するMRFGainは大きくなり得る。反対に、小さいCsと大きいCtの場合には、MRFGainは小さくなり得る。MRFGain計算コンポーネント202は、MRFMEのために基準フレームコンポーネント204からの次の基準フレームを使用すべきかどうかを、少なくとも一部はMRFGainおよび/または所与のビデオブロックについての所定の閾値に対するMRFGainの関係に基づいて、判定することができる。]
[0025] 一例では、MRFGain計算コンポーネント202によってMRFGainが決定されると、ビデオの各ブロックまたはフレームに以下の時間探索範囲予測を使用することができる。MRFGainには他の範囲予測を利用することもできることを理解されたい。これは、利得計算の使用についての説明を容易にするための一例にすぎない。MRFMEが時間反転的に行われ、Ref(1)が探索されるべき第1の基準フレームであると仮定すると、MRFGain、Gの推定は、Ref(k)によって(k>1とk=1の場合など)変動し得る。例えば、現在の基準フレームがRef(k)(k>1)であり、このフレームに関する時間探索が完了したと仮定すると、次の基準フレームRef(k+1)が探索されるべきかどうか判定するには、CsおよびCtを、利用可能な情報、



および



から推定することができる。統計的に、



は、σr2(k)に収束する。したがって、



を、σr2(k)の推定とすることができる。前述の動き補償残渣の線形モデルに、



および



を代入すると、パラメータCsおよびパラメータCtを容易に獲得することができ、対応するG=Cs/Ctは、



である。]
[0026] しかし、現在の基準フレームがRef(1)(k=1)である場合、



は利用できず、そのため、上記式を使用してCsとCtを計算することができない。この場合には、



とブロック中の残渣の平均値



を評価して、MRFGain、Gを推定することができる。サブ整数画素補間フィルタは低域フィルタ(LF)であるため、基準フレーム内の高周波数(HF)成分を回復することができず、そのため、現在のブロックのHFを補償することができない。その結果補間誤りは、小さいLF成分と大きいHF成分を有し得ることになる。したがって、



が小さく、



が大きい(例えば、残渣が小さいLF成分と大きいHF成分を有するなどの)場合、残渣中の主要な成分は、この場合には大きいCsと小さいCt(例えば、大きいGなど)をもたらすrs(k)とすることができる。したがって、Gは、



を使用して推定することができ、式中、係数γは訓練データから調整される。場合によっては、固定値のγ(γ=6など)を異なるシーケンスに使用することもできる。]
[0027] MRFGainが、MRFMEにおける所与の基準フレーム利用係数に十分であるかどうか判定するために、Gの値を所定の閾値TGと比較することができる。GがTGより大きい場合(G>TG)、より多くの基準フレームを探索することが性能を高めると想定することができ、そのため、MEはRef(k+1)に進むことができる。しかし、G≦TGの場合には、現在のブロックのMRFMEを打ち切ることができ、残りの基準フレームは探索されない。TGが高いほど、より計算が節約され、TGが低いほど、性能低下が少なくなることを理解されたい。MRFGain計算コンポーネント202、または別のコンポーネントは、所望の性能/計算量の均衡を達成するように閾値を適切に調整することができる。]
[0028] 次に図3を見ると、残渣を予測し、動き推定基準フレーム時間探索をしかるべく調整するシステム300が表示されている。ME、または可変基準フレームの利用を伴うMRFMEを活用して、1つもしくは複数のビデオブロックまたは1つもしくは複数のビデオフレームの部分の動きを推定する動き推定コンポーネント102と、動き推定に基づいてビデオブロック(または、予測誤りといったビデオブロックに関連する情報)を符号化することのできるビデオ符号化コンポーネント104が設けられている。加えて、動き推定コンポーネント102は、前述のように、ビデオブロックを推定するために時間探索範囲内で基準フレームコンポーネント204のために1つまたは複数の基準フレームを利用することに、その計算コストに優る利点があるかどうか判定することができるMRFGain計算コンポーネント202と、さらに、またはその代わりに、時間探索範囲を決定するのに使用することもできる動きベクトルコンポーネント302を含むこともできる。] 図3
[0029] 一例によれば、MRFGain計算コンポーネント202は、前述の計算に基づいて、基準フレームコンポーネント204からの基準フレームの1つまたは複数の時間探索範囲のMRFGainを求めることができる。加えて、動きベクトルコンポーネント302は、場合によっては、ビデオブロックに最適な時間探索範囲を決定することもできる。例えば、現在のフレームFに関連する基準フレームRef(k)について、動きベクトルコンポーネント302は、動きベクトルMV(k)を位置決めしようとすることができる。見つかった最善の動きベクトルMV(k)が整数画素動きベクトルである場合、ビデオブロック内のオブジェクトは、Ref(k)とFの間の整数動きを有するものと想定することができる。



にはサブ画素補間誤りが生じないため、残りの基準フレームにおいては、動きベクトルコンポーネント302によって決定された予測より優れた予測を見つけることが難しい可能性がある。よってこの例では、動きベクトルコンポーネント302を利用して時間探索範囲を決定することができる。動き推定コンポーネント102のどのコンポーネントが時間探索範囲を決定するかにかかわらず、ビデオ符号化コンポーネント104は、後に続く記憶、伝送、アクセスなどのための情報を符号化することができる。]
[0030] この例によれば、動きは、以下のように推定することができる。k=1(第1の基準フレームRef(1))について、Ref(k)に関する動き推定を行うことができ、MV(k)、



および



を獲得することができる。続いて、前述の式



を使用して、MRFGain計算コンポーネント202によりGを推定することができる。加えて、動きベクトルコンポーネント302は、ビデオブロックについての基準フレームにおける最善の動きベクトルMV(k)を見つけることができる。G≦TG(TGは閾値利得)であり、またはMV(k)が整数画素動きベクトルである場合、動き推定を打ち切ることができる。MV(k)が整数画素動きベクトルである場合、これを使用して時間探索範囲を決定することができ、そうでなければ、G≦TGであり、時間探索範囲は単に第1の基準フレームだけである。ビデオ符号化コンポーネント104は、この情報を利用して前述のようにビデオブロックを符号化することができる。]
[0031] しかしながら、G>TGであり、またはMV(k)が整数画素動きベクトルでない場合、MRFGain計算コンポーネント202は、k=k+1に設定して次のフレームに進むことができる。Ref(k)に関して動き推定を行うことができ、この前のフレームについてもやはり、MV(k)および



を獲得することができる。続いて、前述の別の式



を使用してGを推定することができる。]
[0032] この場合もやはり、動きベクトルコンポーネント302は、基準フレームにおける最善の動きベクトルMV(k)を見つけることができる。G>TGであり、またはMV(k)が整数画素動きベクトルでない場合、MRFGain計算コンポーネント202は、k=k+1に設定して次のフレームに進み、このステップを繰り返すことができる。G≦TGであり、またはMV(k)が整数画素動きベクトルである場合、現在のブロックのMRFMEを打ち切ることができる。MV(k)が整数画素動きベクトルである場合には、これを使用して時間探索範囲を決定することができ、そうでない場合には、G≦TGであり、時間探索範囲は評価されたフレームの数である。また、探索が所望の効率を達成するためのフレームの最大数を構成することもできることを理解されたい。]
[0033] 次に図4を参照すると、ビデオ符号化のための1つまたは複数の基準フレームを使用したMRFMEの利得の決定を円滑に行わせるシステム400が示されている。備わっているビデオ符号化コンポーネント104による符号化のために、誤りに基づいてビデオブロックを予測することのできる動き推定コンポーネント102が設けられている。動き推定コンポーネント102は、MEまたはMRFMEを利用することの利得を求め、MRFMEの場合に使用すべき基準フレームの数を決定することができるMRFGain計算コンポーネント202と、MRFGain計算コンポーネント202がその計算のための基準フレームを取り出すことのできる基準フレームコンポーネント204とを含むことができる。さらに、動き推定コンポーネント102、動き推定コンポーネント102の構成部分、および/またはビデオ符号化コンポーネント104に推論技術を提供することのできる推論コンポーネント402も示されている。別個のコンポーネントとして図示されているが、推論コンポーネント402、および/またはその諸機能は、動き推定コンポーネント102、動き推定コンポーネント102の構成部分、および/またはビデオ符号化コンポーネント104のうちの1つまたは複数の内部において実施することもできることを理解されたい。] 図4
[0034] 一例では、MRFGain計算コンポーネント202は、前述のように(例えば、基準フレームコンポーネント204を使用して基準フレームを獲得し、利得を求める計算を行うなど)、動き推定のために所与のビデオブロックの時間探索範囲を決定することができる。一例によれば、推論コンポーネント402は、(上記の例でのTGといった)所望の閾値を決定するのに利用することができる。閾値は、ビデオ/ブロックの型、ビデオ/ブロックのサイズ、ビデオソース、符号化形式、符号化アプリケーション、予定復号機器、記憶(格納)形式(フォーマット)または場所、類似のビデオ/ブロックまたは類似の特性を有するビデオ/ブロックについての前の閾値、所望の性能統計、利用可能な処理能力、利用可能な帯域幅などの1つまたは複数の少なくとも一部に基づいて推論することができる。さらに、推論コンポーネント402は、前のフレーム数の一部などに基づいて、MRFMEのための最大基準フレーム数を推論するのに利用することもできる。]
[0035] さらに、推論コンポーネント402は、ビデオ符号化コンポーネント104が、動き推定コンポーネント102からの動き推定を利用して符号化形式を推論するのに活用することもできる。加えて、推論コンポーネント402は、推定のために動き推定コンポーネント102に送るべきブロックサイズを推論するのに使用することもでき、このブロックサイズは、符号化形式/アプリケーション、推測される復号機器またはその機能、記憶形式および場所、利用可能なリソースなどといった、閾値を決定するように使用されるのと類似の要因に基づくものとすることができる。また推論コンポーネント402は、動きベクトルなどに関する場所その他のメトリックを求める際に利用することもできる。]
[0036] 前述の各システム、アーキテクチャなどは、複数のコンポーネント間での対話に関連して説明されている。そのようなシステムおよびコンポーネントは、それらの説明で指定されているコンポーネントもしくはサブコンポーネント、指定のコンポーネントもしくはサブコンポーネントの一部、および/または別のコンポーネントを含むことができることを理解されたい。また、サブコンポーネントは、親コンポーネント内に含まれるのではなく、他のコンポーネントに通信可能な状態で結合されたコンポーネントとして実施することもできる。さらに、集約的機能を提供するために、1つまたは複数のコンポーネントおよび/またはサブコンポーネントが単一のコンポーネントに組み入れられてもよい。システム、コンポーネントおよび/またはサブコンポーネント間の通信は、プッシュおよび/またはプルモデルに従って行うことができる。また各コンポーネントは、当業者には知られているが、簡潔にするために本明細書には具体的に記載されていない1つまたは複数の他のコンポーネントと対話してもよい。]
[0037] さらに、理解されるように、開示のシステムおよび方法の様々な部分は、人工知能、機械学習、あるいはナレッジもしくはルールベースのコンポーネント、サブコンポーネント、プロセス、手段、方法、または機構(サポートベクトルマシン、ニューラルネットワーク、エキスパートシステム、ベイジアン信頼ネットワーク、ファジィ論理、データ融合エンジン、分類器など)を含み、またはこれらで構成されてもよい。そのようなコンポーネントは、特に、例えばコンテキスト情報に基づいて動作を推論するなどにより、いくつかの機構または各コンポーネントによって行われるプロセスを自動化して、システムおよび方法の各部分をより適応的であると共に、効率がよく、インテリジェントなものにすることができる。例を挙げると、そのような機構は、マテリアライズドビュー(materialized view、実体化ビュー)などに関して用いることができるが、これに限定されない。]
[0038] 前述の例示的システムを考察すると、開示の主題に従って実施することができる方法は、図5〜7の流れ図を参照すればよりよく理解されるであろう。説明を簡単にするために、これらの方法は、一連のブロックとして図示され、記述されているが、特許請求される主題は各ブロックの順序によって限定されるものではなく、ブロックの中には、本明細書で図示され、記述されている順序とは異なる順序で行われ、および/または他のブロックと同時に行うことができるものもあることを理解されたい。さらに、以下に示す方法を実施するのに、必ずしも図示されるすべてのブロックが必要とされるとは限らない。] 図5 図6 図7
[0039] 図5に、ME、またはMRFMEをいくつかの基準フレームと共に使用することの利得を求めることに基づくビデオブロックの動き推定の方法500を示す。502で、ビデオブロック推定のために1つまたは複数の基準フレームを受け取ることができる。これらの基準フレームは、推定されるべき現在のビデオブロックと関連する前のフレームとすることができる。504で、MEまたはMRFMEを使用することの利得を求めることができる。これは、例えば前述のように計算することができる。MRFMEの利得は、例えば、複数の基準フレームが使用されるべきであると決定されるなど、性能と計算量の間の所望の均衡を表す閾値を達成するように計算された基準フレームの数に従って求めることができる。506で、決定された形式、すなわちMEまたはMRFMEを使用して、ビデオブロックを推定することができる。MRFMEが使用される場合には、推定において利得閾値を満足させるいくつかのフレームを利用することができる。推定に基づいて、例えば動き補償残渣を求めることができ、508で、予測誤りを符号化することができる。] 図5
[0040] 図6に、1つまたは複数のビデオブロックにおける動きを推定するための時間探索範囲の決定を円滑に行わせる方法600を示す。602で、符号化されるべきビデオブロックからの前のフレームとすることのできる現在の基準フレーム(またはそのブロック)の残留エネルギーレベルを計算することができる。この計算は、(例えば、ブロック内の各画素ごとの)ブロックについての平均の残留エネルギーを表すことができる。ブロック全体の残留エネルギーが低いことは、そのブロックについてよりよい予測を行うことができ、したがって、より高い符号化性能を示すことができることに理解されたい。604で、現在の基準フレームより時間的に前の基準フレームの残留エネルギーレベルを計算することができる。この場合もやはり、これは関連するブロック全体で平均された残留エネルギーとすることができる。] 図6
[0041] ブロックの現在の基準フレームと前の基準フレームとの残留エネルギーを比較することによって、ブロック予測のためにより多くの前の基準フレームを含めるよう時間探索範囲を拡大すべきか否かの性能判断を行うことができる。606で、現在のフレームと(1つまたは複数の)前のフレームの残留エネルギーレベルから評価された利得が、(構成され、推論され、またはその他の方法で事前に決定された)閾値利得より大きい(または、一例では、これと等しい)かどうかが判定される。閾値利得より大きいまたは等しいと判定された場合、608で、次の基準フレームを加えることによって、MRFMEのための時間探索範囲を拡大することができる。この方法では、602に戻って再度開始し、前のフレームの前のフレームの残渣レベルを比較することができ、以下同様に行うことができることを理解されたい。残留エネルギーレベルから評価された利得が閾値より高くない場合、610で、現在の基準フレームを使用してビデオブロックが予測される。この場合もやはり、この方法が引き続き複数の前の基準フレームを追加した場合には、続いて、610で、追加されたすべての前の基準フレームを使用してビデオブロックを予測することができる。]
[0042] 図7に、少なくとも一部は、所与のブロックの利得推定に基づく、効率のよいブロックレベルの時間探索範囲推定の方法700を示す。702で、所与のビデオブロックの第1の基準フレームに関して動き推定を行うことができる。この基準フレームは、例えば、現在のビデオブロックを時間的に1つ前のフレームとすることができる。704で、例えば、前のシミュレーション結果などに基づいて、次の基準フレームを使用した動き推定の利得が求められ、ビデオブロック内の最善の動きベクトルを位置決めすることができる。シミュレーション結果に基づく動き推定の利得は、一例では、前述の各式を使用して求めることができる。706で、利得Gが閾値利得を満たすかどうか(性能/計算量の均衡を達成するために、ブロック予測において次の基準フレームが使用されるべきであることを指示することができる)、および動きベクトルが整数画素動きベクトルであるか否かを判定することができる。Gが閾値を満たさず、または動きベクトルが整数画素動きベクトルである場合、708で、ビデオブロック予測を完了することができる。] 図7
[0043] しかし、Gが閾値を満たし、動きベクトルが整数画素動きベクトルでない場合には、710で、次の基準フレーム(例えば、次の前の基準フレームなど)に関して動き推定を行うことができる。712で、次の前の基準フレームおよび第1の基準フレームを用いた動き推定の利得と、次の前の基準フレームの最善の動きベクトルとを求めることができる。この利得は、前述の各式を使用して求めることができ、この計算は、少なくとも一部は、動き推定において第1のフレームを使用して受け取られた利得に基づくものである。714で、利得Gが前述の閾値利得を満たし、動きベクトルが整数画素動きベクトルでない場合、710に進み、MRFMEにおいて次の基準フレームを利用することができる。しかし、Gが閾値を満たさず、または動きベクトルが整数画素動きベクトルである場合には、708で、基準フレームを使用してビデオブロック予測を行うことができる。これについては、MRFMEによって生じる計算量は、所望の性能利得を生じる場合に限って使用される。]
[0044] 本明細書で使用する場合、「コンポーネント」、「システム」などの用語は、コンピュータ関連のエンティティ、すなわち、ハードウェア、ハードウェアとソフトウェアの組み合わせ、ソフトウェア、または実行中のソフトウェアのいずれかを指すものである。例えば、コンポーネントは、プロセッサ上で実行中のプロセス、プロセッサ、オブジェクト、インスタンス、実行可能ファイル、実行スレッド、プログラム、および/またはコンピュータとすることができるが、これらに限定されない。例を挙げると、コンピュータ上で実行中のアプリケーションもコンピュータ自体もコンポーネントとすることができる。1つまたは複数のコンポーネントが、あるプロセスおよび/または実行スレッドの内部にあってもよく、コンポーネントが1台のコンピュータ上に局在化されてもよく、および/または2台以上のコンピュータ間で分散されてもよい。]
[0045] 「例示的な」という語は、本明細書では、例、具体例または例証として働くことを意味するのに使用される。本明細書で「例示的」として示す態様または設計はいずれも、必ずしも、他の態様または設計に対して好ましく、または有利であると解釈されるべきものとは限らない。さらに、各例はもっぱら、明確にするため、理解を得るために提供されるにすぎず、いかなる方法でも本発明または本発明の関連部分を限定するものではない。その他の、または代替の例を無数に提示することもできるが、簡潔にするために省略されていることを理解されたい。]
[0046] さらに、本発明の全部または一部を、標準的なプログラミングおよび/または工学の技法を使用して、開示の発明を実施するようにコンピュータを制御するためのソフトウェア、ファームウェア、ハードウェア、またはこれらの任意の組み合わせを製造する方法、装置または製造品として実施することもできる。「製造品」という用語は、本明細書で使用する場合、任意のコンピュータ可読機器または媒体からアクセスすることのできるコンピュータプログラムを包含するものである。例えば、コンピュータ可読媒体には、磁気記憶装置(ハードディスク、フロッピー(登録商標)ディスク、磁気ストリップなど)、光ディスク(コンパクトディスク(CD)、ディジタル多用途ディスク(DVD)など)、スマートカード、およびフラッシュメモリデバイス(カード、スティック、キードライブなど)を含むことができるが、これらに限定されない。加えて、搬送波を用いて、電子メールを送受信する際に、またはインターネットやローカルエリアネットワーク(LAN)といったネットワークにアクセスする際に使用されるようなコンピュータ可読電子データを搬送することもできることも理解されたい。当然ながら、特許請求される主題の範囲または趣旨から逸脱することなく、本構成に多くの変更を加えることができることも、当業者は理解し得る。]
[0047] 図8および図9、ならびに以下の考察は、開示の主題の様々な態様のコンテキストを提供する目的で、開示の主題の様々な態様を実施することができる適切な環境の簡単な一般的説明を提供するためのものである。主題は、1台または複数のコンピュータ上で実行されるプログラムのコンピュータ実行可能命令の一般的状況で説明されているが、本発明は、他のプログラムモジュールと組み合わせても実施することができることを当業者は理解することができる。一般に、プログラムモジュールには、個々のタスクを実行し、および/または個々の抽象データ型を実施する、ルーチン、プログラム、コンポーネント、データ構造などが含まれる。さらに、これらのシステム/方法は、シングルプロセッサ、マルチプロセッサまたはマルチコアプロセッサのコンピュータシステム、ミニコンピューティング機器、メインフレームコンピュータ、ならびにパーソナルコンピュータ、ハンドヘルドコンピューティング機器(携帯情報端末(PDA)、電話機、時計など)、マイクロプロセッサベースの、またはプログラマブルな家電または工業電子機器などを含めて、他のコンピュータシステム構成と共に実施されてもよいことを当業者は理解することができる。また、例示の各態様は、タスクが、通信ネットワークを介してリンクされているリモート処理機器によって実行される分散コンピューティング環境において実施されてもよい。しかし、特許請求される主題の、全部ではなくても一部を、独立型コンピュータ上で実施することもできる。分散コンピューティング環境では、プログラムモジュールは、ローカルとリモート両方の記憶装置に位置することができる。] 図8 図9
[0048] 図8を参照すると、本明細書で開示する様々な態様を実施するための例示的環境800は、コンピュータ812(デスクトップ、ラップトップ、サーバ、ハンドヘルド、プログラマブル家電または工業電子機器など)を含む。コンピュータ812は、処理装置814、システムメモリ816およびシステムバス818を含む。システムバス818は、これに限定されるわけではないが、システムメモリ816を含むシステム構成部分を処理装置814に結合する。処理装置814は、様々な利用可能なマイクロプロセッサのいずれかとすることができる。処理装置814としては、デュアルマイクロプロセッサ、マルチコアその他のマルチプロセッサアーキテクチャを用いることができることを理解されたい。] 図8
[0049] システムメモリ816は、揮発性と不揮発性のメモリを含む。基本入出力システム(BIOS)は、始動時などに、コンピュータ812内の要素間で情報を転送するための基本ルーチンを含み、不揮発性メモリに記憶されている。例を挙げると、これに限定されないが、不揮発性メモリには、読取り専用メモリ(ROM)が含まれ得る。揮発性メモリには、ランダムアクセスメモリ(RAM)が含まれ、RAMは、処理を円滑化するための外部キャッシュメモリとして働くことができる。]
[0050] またコンピュータ812は、取り外し可能/取り外し不能、揮発性/不揮発性のコンピュータ記憶媒体も含む。図8には、例えば、大容量記憶824が示されている。大容量記憶824には、磁気または光ディスクドライブ、フロッピー(登録商標)ディスクドライブ、フラッシュメモリ、メモリスティックなどの機器が含まれるが、これらに限定されない。加えて大容量記憶824には、別々の、または他の記憶媒体と組み合わされた記憶媒体も含まれ得る。] 図8
[0051] 図8に、ユーザおよび/または他のコンピュータと、適切な動作環境800に示す基本コンピュータリソースの間の媒介として働く(1つまたは複数の)ソフトウェアアプリケーション828を示す。そのようなソフトウェアアプリケーション828には、システムソフトウェアおよびアプリケーションソフトウェアの一方または両方が含まれる。システムソフトウェアは、コンピュータシステム812のリソースを制御し、割り振るように働く、大容量記憶824に記憶することのできるオペレーティングシステムを含むことができる。アプリケーションソフトウェアは、システムメモリ816と大容量記憶824のどちらかまたは両方に記憶されたプログラムモジュールおよびデータを介して、システムソフトウェアによるリソースの管理を利用する。] 図8
[0052] またコンピュータ812は、通信可能な状態でバス818に結合され、コンピュータ812との対話を円滑化する1つまたは複数のインターフェースコンポーネント826も含む。例を挙げると、インターフェースコンポーネント826は、ポート(シリアル、パラレル、PCMCIA、USB、FireWireなど)や、インターフェースカード(サウンド、ビデオ、ネットワークなど)などとすることができる。インターフェースコンポーネント826は、(有線または無線で)入力を受け取り、出力を提供することができる。例えば入力は、マウス、トラックボール、スタイラス、タッチパッドといったポインティングデバイス、キーボード、マイクロフォン、ジョイスティック、ゲームパッド、衛星パラボラアンテナ、スキャナ、カメラ、その他のコンピュータなどを含む機器から受け取ることができるが、これらに限定されない。また出力は、コンピュータ812により、インターフェースコンポーネント826を介して、1つまたは複数の出力機器に供給することもできる。出力機器には、特に、ディスプレイ(CRT、LCD、プラズマなど)、スピーカ、プリンタ、その他のコンピュータを含むことができる。]
[0053] 図9は、本発明が対話することのできるコンピュータ環境例900の概略的ブロック図である。システム900は、1つまたは複数のクライアント910を含む。クライアント910はハードウェアおよび/またはソフトウェア(スレッド、プロセス、コンピューティングデバイスなど)とすることができる。またシステム900は、1つまたは複数のサーバ930も含む。よって、システム900は、モデルの中でも特に、二層クライアントサーバモデルまたは多層モデル(クライアント、中間層サーバ、データサーバなど)に対応することができる。またサーバ930も、ハードウェアおよび/またはソフトウェア(スレッド、プロセス、コンピューティングデバイスなど)とすることができる。サーバ930は、例えば、本発明の各態様を用いて変換を行うためのスレッドを収容することができる。クライアント910とサーバ930の間の1つの可能な通信は、2つ以上のコンピュータプロセス間で送信されるデータパケットの形のものとすることができる。] 図9
[0054] システム900は、クライアント910とサーバ930の間の通信を円滑化するのに用いることができる通信フレームワーク950を含む。この場合、クライアント910はプログラムアプリケーションコンポーネントに対応させることができ、サーバ930は、前述のように、インターフェースの機能と、任意に、記憶システムの機能を提供することができる。クライアント910は、クライアント910にとってローカルで情報を記憶するのに用いることのできる1つまたは複数のクライアントデータストア960に動作可能な状態で接続されている。同様に、サーバ930も、サーバ930にとってローカルで情報を記憶するのに用いることのできる1つまたは複数のサーバデータストア940に動作可能な状態で接続されている。]
[0055] 例を挙げると、1つまたは複数のクライアント910は、通信フレームワーク950を介して1つまたは複数のサーバ930に、例えば、ビデオなどとすることのできるメディアコンテンツを要求することができる。サーバ930は、1つまたは複数の基準フレームを利用してビデオのブロックを予測することの利得を計算するMEやMRFMEといった、本明細書で示す機能を使用してビデオを符号化し、(誤り予測を含む)符号化コンテンツをサーバデータストア940に記憶することができる。その後、サーバ930は、例えば、通信フレームワーク950などを利用してクライアント910にデータを送信することができる。クライアント910は、H.264といった1つまたは複数の形式に従ってデータを復号し、誤り予測情報を利用してメディアのフレームを復号する。代わりに、またはこれに加えて、クライアント910は、受け取ったコンテンツの一部を、クライアントデータストア960内に記憶することもできる。]
[0056] 以上の説明は、特許請求される主題の態様の例を含むものである。当然ながら、特許請求される主題を説明するために、コンポーネントまたは方法の考えられる限りのあらゆる組み合わせを記述することは不可能であるが、開示の主題の多くの別の組み合わせおよび置換が可能であることを当業者は理解するはずである。したがって、開示の主題は、添付の特許請求の範囲の趣旨および範囲内に該当する、かかるすべての変更、改変および変形を包含するものである。さらに、「含む」、「有する」もしくは「有していいる」という用語またはこれらの変形は、これらが詳細な説明または特許請求の範囲において使用される限りにおいて、「備える」という用語が請求項において移行語として用いられるときに解釈されるのと同様に、含むことが意図されるものである。]
权利要求:

請求項1
ビデオ符号化において動き推定を提供するシステムであって、ビデオブロックに関連する複数の基準フレームを提供する基準フレームコンポーネントと、少なくとも一部は、前記複数の基準フレームのうちの1つまたは複数を利用することの性能利得を、少なくとも一部は前記複数の基準フレームの残留エネルギーに基づいて計算することに基づいて、動き推定(ME)または複数基準フレームME(MRFME)のために現在の時間探索範囲を決定する利得計算コンポーネントとを備えるシステム。
請求項2
少なくとも一部は、MEまたはMRFMEを前記現在の時間探索範囲で利用して予測される前記ビデオブロックに基づいて動き補償残渣を符号化するビデオ符号化コンポーネントをさらに備える、請求項1に記載のシステム。
請求項3
前記ビデオブロックの最善の動きベクトルであり、前記動きベクトルが整数画素動きベクトルである場合に前記現在の時間探索範囲を決定するのに使用される前記動きベクトルを計算する動きベクトルコンポーネントをさらに備える、請求項1に記載のシステム。
請求項4
前記複数の基準フレームの1つまたは複数についての前記残留エネルギーσr2(k)が、kを前記時間探索範囲のサイズとし、Ctを前記ビデオブロックと前記複数の基準フレームのうちの1つとの間の時間的変化の変量の増加率とし、Csをk−不変パラメータとし、少なくとも一部は線形残渣モデルσr2(k)=CS+Ct*kに基づいて計算される、請求項1に記載のシステム。
請求項5
前記性能利得Gは、を使用して計算され、式中、は、第1の基準フレームに対応する平均二乗残渣であり、は、前記ビデオブロック中の残渣の平均値であり、γは構成されたパラメータである、請求項4に記載のシステム。
請求項6
少なくとも一部はシミュレーション結果または前の利得計算に基づいてγの値を推論する推論コンポーネントをさらに備える、請求項5に記載のシステム。
請求項7
前記利得計算コンポーネントはさらに、MRFMEのために、追加の基準フレームを含むより大きい時間探索範囲を利用することの性能利得を計算する、請求項4に記載のシステム。
請求項8
より大きい時間探索範囲を利用することの前記性能利得は、を基準フレームk−1に対応する平均二乗残渣とし、を基準フレームkに対応する平均二乗残渣とし、を使用して計算される、請求項7に記載のシステム。
請求項9
予測ビデオブロック符号化において動きを推定する方法であって、ビデオブロックを予測する際に1つまたは複数の前の基準フレームを使用することの性能の利得を計算するステップと、前記計算された性能利得に基づいて、動き推定において利用すべきいくつかの基準フレームを含む時間探索範囲を決定するステップと、前記ビデオブロックにおける動きを推定するために、前記基準フレームの時間探索範囲を利用して前記ビデオブロックを予測するステップとを含む方法。
請求項10
前記ビデオブロックの最善の動きベクトルを計算するステップであって、前記動きベクトルが整数画素動きベクトルである場合に前記時間探索範囲を決定するのに使用される前記最善の動きベクトルを計算するステップとをさらに備える、請求項9に記載の方法。
請求項11
前記計算するステップは、少なくとも一部は、前記1つまたは複数の前の基準フレームの残留エネルギーを評価することに基づいて前記性能利得を計算するステップを含む、請求項9に記載の方法。
請求項12
kを前記時間探索範囲のサイズとし、Ctを前記ビデオブロックと前記少なくとも1つの前の基準フレームとの間の時間的変化の変量の増加率とし、Csをk−不変パラメータとし、少なくとも一部は線形残渣モデルσr2(k)=CS+Ct*kに基づいて、前記前の基準フレームの少なくとも1つについての前記残留エネルギーσr2(k)を計算することを含む、請求項11に記載の方法。
請求項13
前記計算するステップは、動き推定に複数の基準フレームを使用することの前記性能利得Gを、を使用して計算するステップを含み、式中、は、前記1つまたは複数の前の基準フレームの第1の基準フレームに対応する平均二乗残渣であり、は、前記ビデオブロック中の残渣の平均値であり、γは構成されたパラメータである、請求項12に記載の方法。
請求項14
少なくとも一部はシミュレーション結果または前の利得計算から調整することに基づいてγの値を推論するステップをさらに備える、請求項13に記載の方法。
請求項15
前記計算するステップは、2フレームを超える時間探索範囲を利用することの性能利得を、を基準フレームk−1に対応する平均二乗残渣とし、を基準フレームkに対応する平均二乗残渣とし、を使用して計算するステップを含む、請求項12に記載の方法。
請求項16
前記計算するステップは、前記利得が指定の閾値を満たすことができなくなるまでより大きい時間探索範囲の性能利得を計算するステップを含む、請求項15に記載の方法。
請求項17
所望の符号化サイズから前記閾値を推論するステップをさらに備える、請求項16に記載の方法。
請求項18
予測ビデオブロック符号化において動きを推定するシステムであって、ビデオブロックを予測するのに、単一基準フレーム動き推定(ME)または複数基準フレーム動き推定(MRFME)を利用することの性能利得を計算する手段と、前記計算された性能利得に従い、MEまたはMRFMEを利用して前記ビデオブロックを予測する手段とを備えるシステム。
請求項19
MRFMEにおいていくつかの基準フレームを利用すること、または前記いくつかの基準フレームに加えて1つもしくは複数の追加基準フレームを利用することの性能利得を計算する手段と、前記いくつかのフレームを利用してMRFMEにおいて閾値を超える利得を得る手段とをさらに備える、請求項18に記載のシステム。
請求項20
前記性能利得計算は、少なくとも一部は、1つまたは複数の基準フレームの動き補償残渣の線形モデルに基づくものである、請求項18に記載のシステム。
类似技术:
公开号 | 公开日 | 专利标题
US10645392B2|2020-05-05|Predictive motion vector coding
US10484681B2|2019-11-19|Image prediction encoding device, image prediction decoding device, image prediction encoding method, image prediction decoding method, image prediction encoding program, and image prediction decoding program
US9749653B2|2017-08-29|Motion vector encoding/decoding method and device and image encoding/decoding method and device using same
US9369731B2|2016-06-14|Method and apparatus for estimating motion vector using plurality of motion vector predictors, encoder, decoder, and decoding method
US9621917B2|2017-04-11|Continuous block tracking for temporal prediction in video encoding
US20150003515A1|2015-01-01|Complexity-aware encoding
JP6286718B2|2018-03-07|高効率な次世代ビデオコーディングのためのフレーム階層応答型量子化を使用する、コンテンツ適応ビットレートおよび品質管理
US10123014B2|2018-11-06|Method and apparatus for coding/decoding image
RU2559737C2|2015-08-10|Способ и устройство для кодирования/декодирования вектора движения
TWI656786B|2019-04-11|Sampling adaptive offset device
RU2562379C2|2015-09-10|Иерархия видеоблоков с предсказанием движения
TWI650010B|2019-02-01|Video decoding method, video encoding device, video encoding method and non-transitory computer readable recording medium
EP2805499B1|2020-09-02|Video decoder, video encoder, video decoding method, and video encoding method
US8295634B2|2012-10-23|Method and apparatus for illumination compensation and method and apparatus for encoding and decoding image based on illumination compensation
US9264732B2|2016-02-16|Method and an apparatus for decoding a video
KR101630688B1|2016-06-16|움직임 예측 장치 및 방법과 영상 처리 장치
JP5718363B2|2015-05-13|Video encoding / decoding method and apparatus using large size transform unit
RU2600530C2|2016-10-20|Кодирование и декодирование видео с повышенной устойчивостью к ошибкам
US9083985B2|2015-07-14|Motion image encoding apparatus, motion image decoding apparatus, motion image encoding method, motion image decoding method, motion image encoding program, and motion image decoding program
US8503532B2|2013-08-06|Method and apparatus for inter prediction encoding/decoding an image using sub-pixel motion estimation
TWI622288B|2018-04-21|Video decoding method
US20120236943A1|2012-09-20|Video encoding and decoding method and apparatus using weighted prediction
US9031130B2|2015-05-12|Image prediction/encoding device, image prediction/encoding method, image prediction/encoding program, image prediction/decoding device, image prediction/decoding method, and image prediction decoding program
US8467448B2|2013-06-18|Apparatus and method for fast intra/inter macro-block mode decision for video encoding
CN103647972B|2017-04-12|运动图像解码方法和运动图像编码方法
同族专利:
公开号 | 公开日
US20090190845A1|2009-07-30|
KR20100123841A|2010-11-25|
WO2009094094A1|2009-07-30|
CN101971638A|2011-02-09|
EP2238766A1|2010-10-13|
EP2238766A4|2012-05-30|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
法律状态:
2011-09-21| A621| Written request for application examination|Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110920 |
2012-11-12| A977| Report on retrieval|Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121112 |
2012-12-17| A131| Notification of reasons for refusal|Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121214 |
2013-05-15| A02| Decision of refusal|Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130514 |
优先权:
申请号 | 申请日 | 专利标题
[返回顶部]