专利摘要:
フィルタバンクの構成や出力信号ドメインは異なることもある。異なるフィルタバンクドメイン間の変換が望まれる場合も多い。通常、マッピング行列を用いるが周波数に応じて変化してしまう。このため大量のルックアップテーブルが必要となる。第1のフィルタバンクドメイン(DS)の第1のデータフレームを、第2のフィルタバンクドメイン(DT)の第2のデータフレームに変換する方法は、第1のフィルタバンクドメイン(DS)のサブバンド(mp3(m−1)、mp3(m)、MP3(m+1)を、第2のフィルタバンクドメインに対応するが、歪んだ位相を有する中間ドメイン(Di)のサブバンド(psdo(m−1)、psdo(m)、psdo(m+1))にコード変換する段階と、中間ドメイン(Di)のサブバンド(psdo(m−1)、psdo(m)、psdo(m+1))を、第2のフィルタバンクドメイン(DT)のサブバンド(MDCT(m−1)、MDCT(m)、MDCT(m+1))にコード変換する段階であって、中間ドメイン(Di)のサブバンドに位相補正(SSC、PCp、PC、PCn)を行う段階とを有する。
公开号:JP2011513781A
申请号:JP2010549083
申请日:2009-02-19
公开日:2011-04-28
发明作者:コルドン,スヴェン;ヤクス,ペーター
申请人:トムソン ライセンシングThomson Licensing;
IPC主号:G10L19-00
专利说明:

[0001] 本発明は、異なるフィルタバンクドメインの変換方法と装置とに関する。]
背景技術

[0002] 通常、フィルタバンクは異なるドメイン信号間、例えば時間ドメイン信号と周波数ドメイン信号間の何らかの変換を行うものである。フィルタバンクの構成や出力信号ドメインは異なることもある。多くの場合、異なるフィルタバンクドメイン間の変換が望まれる。]
[0003] 特許文献1は、時間ドメインを用いずに、異なる時間・周波数分析ドメインを有する符号化フォーマット間のコード変換(transcoding)方法または装置であって、リニアマッピングを用いるものを開示している。したがって、コード変換ステップを1回だけ行えばよく、中間的時間ドメイン信号を用いるシステムより計算の複雑性が低い。特許文献1に開示された最も重要な実施形態の1つは、ロスレスオーディオ圧縮のための、MP3ハイブリッドフィルタバンクから整数MDCTドメインへのマッピングである。コーデックの圧縮率に対するコード変換ステップの影響は大きい。このマッピングの簡単なソリューションは、変換元である、MP3ドメインから求めたフィルタ係数を、完全に時間ドメインサンプルにデコードして、MDCT分析フィルタバンクを用いることであろう。特許文献1に記載されたソリューションは、時間ドメインを省略して、MP3フィルタバンクドメインからMDCTドメインに直接マッピングするものである。この方法では、ほぼ対角化されているが周波数によって変化するマッピング行列を用いる。そのため、この単純なアプローチでは大量のルックアップテーブルが必要となる。]
[0004] 修正離散余弦変換(MDCT)はフーリエ変換の一種であり、離散余弦変換(DCT)に基づく。修正離散余弦変換は、連続するフレームに対して行われ、後続のフレームはオーバーラップするので、ラップ(lap)されるという特徴があり、また信号エネルギーを効率よく圧縮できるという点で好都合である。MP3コーデックでは、32バンドの多位相直交フィルタ(PQF)バンクの出力にMDCTを適用する。通常、MDCTフィルタの出力は、典型的なPQFフィルタバンクのエイリアシングを低減するため、エイリアスリダクション(alias reduction)により後処理される。このような、フィルタバンクのMDCTとの組み合わせは、ハイブリッドフィルタバンクまたはサブバンドMDCTと呼ばれる。]
[0005] 解決すべき問題は、効率的に実施できるように、マッピング行列すなわち対応するルックアップテーブルを小さくすることである。]
先行技術

[0006] 欧州特許出願第06120969号]
[0007] 本発明は、単一ステップマッピングを、2つの別々のステップに分解して、中間フィルタバンクドメインを用いて、マッピング行列と、対応するルックアップテーブルのサイズの削減を達成する。このようなマッピングの分解により、マッピングテーブルが簡単になり構成が規則的になり、圧縮が非常に効率的になることが分かった。例えば、マッピングテーブルに必要な記憶スペース量を10分の1以下に減らすことができる。他の利点として、計算の複雑性はあまり増大しない。さらに、重み付け手段、フィルタリング手段、及び加算器によりマッピングを実行する装置を実施することができる。]
[0008] 本発明の一態様によると、第1のフィルタバンクドメインの第1のデータフレームを、第2のフィルタバンクドメインの第2のデータフレームに変換する方法は、前記第1のフィルタバンクドメインのサブバンドを、前記第2のフィルタバンクドメインに対応するが、歪んだ位相を有する中間ドメインのサブバンドにコード変換する段階と、前記中間ドメインの前記サブバンドを、前記第2のフィルタバンクドメインのサブバンドにコード変換する段階であって、
前記中間ドメインの前記サブバンドに位相補正を行う段階とを有する。例えば、前記第1のフィルタバンクドメインはMP3ハイブリッドフィルタバンクのフィルタバンクドメインであり、前記第2のフィルタバンクドメインは整数MDCTフィルタバンクのフィルタバンクドメインである、
通常、時間信号を中間フィルタバンクドメインと第2のフィルタバンクドメインのサブバンドにコード変換するステップは、余弦関数を含む変換として表せる。中間フィルタバンクドメインの歪んだ位相は、余弦関数の周波数に依存する付加位相項に対応する。]
[0009] さらに、本発明の一実施形態では、第1のフィルタバンクドメインのサブバンドを中間フィルタバンクドメインのサブバンドにコード変換する段階は、第1のフィルタバンクドメインのサブバンドから残存エイリアス項を除去する段階を有する。かかる残存エイリアス項は、MP3多位相フィルタバンクなどの第1のフィルタバンクドメインに対応するフィルタバンクにより生じることが多い。一実施形態では、マッピング行列を用い、各マッピング行列は主対角線に沿って別個の、しかし同じ部分行列を有し、他の位置ではゼロを有する。]
[0010] 一実施形態では、前記中間ドメインのサブバンドを前記第2のフィルタバンクドメインのサブバンドにコード変換する段階は、サブバンドグループ符号訂正(ここではサブバンド符号訂正とも呼ぶ)を有する。一グループは1以上のフィルタバンクドメインサブバンドを有する。フィルタバンクドメインサブバンドは「ビン(bin)」とも呼ぶ。サブバンドグループ符号訂正は、ビンのグループを指し、中間ドメイン信号のサブバンドグループの一つおきの符号反転を含み得る。]
[0011] 本発明の他の態様によると、第1のフィルタバンクドメインの第1のデータフレームを、第2のフィルタバンクドメインの第2のデータフレームに変換する装置は、前記第1のフィルタバンクドメインのサブバンドを、前記第2のフィルタバンクドメインに対応するが、歪んだ位相を有する中間ドメインのサブバンドにコード変換する第1のコード変換手段と、前記中間ドメインの前記サブバンドを、前記第2のフィルタバンクドメインのサブバンドにコード変換する第2のコード変換手段とを有し、前記第2のコード変換手段は、前記中間ドメインの前記サブバンドに位相補正を行う位相補正手段を有する。]
[0012] 一実施形態では、前記位相補正はマッピング行列を適用する計算手段(例えば、マイクロプロセッサ、DSP、これらの一部)により行われ、他の実施形態では、前記第2のコード変換手段における位相補正は、重み付けする重み付け手段と、重み付けした中間ドメインのサブバンド係数をフィルタするフィルタ手段とにより行われる。]
[0013] 本発明の有利な実施形態は、従属項、以下の詳細な説明、及び図面に開示した。]
図面の簡単な説明

[0014] 添付した図面を参照して、本発明の実施形態例を説明する。
単一ステップマッピングのアーキテクチャの構成を示す図である。
ロングウィンドウに対する位相補正ステップの実施例を示す図である。
本発明によるアーキテクチャの構成またはフローチャートを示す図である。
一般的な実施形態の構成例を示す図である。
レイテンシを下げる実施例を示す図である。
擬似MDCTマッピング(ロングウィンドウ)を仲介する、MP3用の改良エイリアス補正行列の例を示す図である。
図6の改良エイリアス補正行列の例のタイルを示す図である。
サブバンド符号訂正を示す図である。
歪んだ中間フィルタバンクドメイン内の付加位相項の値を示す図である。
MP3フィルタバンクとオリジナルMDCTと歪んだ擬似MDCTとのカーネル関数(ロングウィンドウ)の比較を示す図である。] 図6
実施例

[0015] 図1は、特許文献1に開示されている単一ステップマッピング手順を示す。MP3係数を有する各フレームmp3(m)は、MDCT係数の連続する3つのフレームMDCT(m−1)、MDCT(m)、MDCT(m+1)に貢献する。逆に、各MDCTフレームは、3つのMP3フレームからの貢献を組み合わせたものである。マッピングは別々の行列Tp、T、Tnにより行われる。その1つ行列Tpは前のMDCTフレームに貢献し、行列Tnは次のMDCTフレームに貢献する。] 図1
[0016] 各ウィンドウタイプに係わる3つの行列Tp、T、Tnがあり、MP3フィルタバンクドメインとMDCTドメインの両方に4つのウィンドウタイプ(ロングウィンドウ、ショートウィンドウ、スタートウィンドウ、ストップウィンドウ)があるので、全部で12通りの行列を格納しなければならない。すべての行列が異なるわけではない。スタートウィンドウとロングウィンドウのTpは同じであり、ストップウィンドウとロングウィンドウのTnも同じである。それでも、例えば45dBより高い十分なマッピング精度を達成するのに必要なルックアップテーブルを格納するには、約175キロバイトのメモリ量が必要である。留意すべき点として、ウィンドウタイプとブロック長は時間的に変化してもよいし、入力ドメインと出力ドメインとで同じである必要はない。ここで、「フレーム」とは、MP3の用語では「グラニュール(granule)」とも呼んでいる。しかし、以下の説明では、より一般的な用語である「フレーム」を用いる。]
[0017] 以下に示すように、フルマッピング行列には一定の対称性があるので、上記の単一ステップマッピングは一連のサブテップ(sequence of multiple sub-steps)に分解できる。この分解は、以下に導入する、位相が歪んだ擬似MDCTに基づく。]
[0018] 一般的に、フィルタバンクドメインはカーネル関数と余弦関数として表せる。MP3ハイブリッドフィルタバンクとMDCTとのカーネル関数を(または一般的に2つのフィルタバンクドメインを)詳細に比較してみると、「擬似MDCT」の定義に行き着く。これは、通常のMDCTと同じカーネル関数を有するが、余弦関数の引数に周波数に依存する位相項が加わる。この擬似MDCTを、MP3から目的(元)のMDCTフィルタバンクドメインへの2ステップのコード変換アプローチにおける中間ドメインとして用いる。]
[0019] 元のMDCTの定義は次の通りである、]
[0020] ここで、「n」は時間のインデックスであり、「i」は周波数のインデックスであり、「M」はMDCTの長さを示し、すなわち、変換によってM個の周波数ビン(サブバンド)が作られ、時間ドメインの分析ウィンドウw(n)の長さは2Mである。カーネル関数c(n,i)は、MDCTの時間ドメインエイリアス補正(TDAC)特性のためのものである。]
[0021] ウィンドウ関数w(n)は、mp3コーデックで用いられる適応的ウィンドウスイッチング手順(adaptive window switching procedure)による「ロング」、「スタート」、「ショート」、「ストップ」の4通りのうちの1つである。ロングウィンドウの場合、



ここで、MDCTの定義における余弦関数項c(n,i)の定義を修正して、余弦関数の引数に、周波数に依存する位相項φiを加える:



MDCTカーネル関数をMP3ハイブリッドフィルタバンクのカーネル関数と比較すると、次のような、区分的にリニアな位相歪み関数(piecewise linear phase warping function)が得られる。これは、インデックスi=1,...,Mが同じ対応するカーネル関数間の相互相関をほぼ最大化するものである。]
[0022] 付加する位相項φiを図9に示す。この位相項はすべてのウィンドウの形に対して同じである。] 図9
[0023] 余弦関数の引数にφiを加えたので、擬似MDCTは完全な再構成特性は有していない。擬似MDCTはTDAC特性を失っているので、真のMDCTではなくなっている。新しいカーネル関数を分析・合成フィルタバンクペアとして適用する場合、時間ドメインのエイリアシングエラーが生じる。しかし、信号対エイリアス比は約50dBに過ぎない。ほとんどのアプリケーションでは、このコード変換精度で十分である。]
[0024] 修正を例示するため、図10は、MP3フィルタバンクと、元の位相のMDCTと、歪んだ位相のMDCTとの最初の54個のカーネル関数(18ビンそれぞれに3サブバンド)を示している。MDCTの位相を修正することにより、その微細構造がMP3フィルタバンクの微細構造と非常に一致することが分かる。さらに、MP3フィルタバンクのサブバンド符号変更を反映している。これについては以下に詳しく説明する。] 図10
[0025] 図3は、本発明の一態様による、少なくともMP3からMDCTへのマッピングに適したフローチャートの一例の構成を示す。しかし、この原理は他のフィルタバンクドメイン間のマッピングにも適用できる。原理的に、マッピングの分解は主要な2つのステップにより実現される。第1に、MP3復号した周波数ビンを(中間ドメインとして機能する)擬似MDCTドメインにコード変換し、次に、位相補正を行って擬似MDCTドメインから目標のMDCTドメインにコード変換する。この2つの主要ステップは、より細かいサブステップで行ってもよいし、具体的に効率的な実装をしてもよい。] 図3
[0026] 図1に示した単一ステップ手順と比較して、多ステップアプローチは複雑そうに見えるし、実際に必要となるアルゴリズム演算は少し多い。しかし、各ステップの数学的演算の構成は、単一ステップ行列より複雑ではない。これにより必要なルックアップテーブルのサイズ(及び必要なメモリ空間)を大幅に小さくできる。各サブステップの詳細は以下に説明する。] 図1
[0027] 擬似MDCTドメインは完全な再構成分析合成フィルタバンクに関するものではなく、2ステップマッピングはこの不完全なフィルタバンクドメイン間のコード変換に該当するので、全体的なマッピング精度はこの中間表現の信号対エイリアス比(signal-to-alias ratio)による制約を受ける。そのため、(行列のクリッピングや量子化をしない)2ステップアプローチにより到達可能な最高マッピング精度は約50−60dBであり、これはほとんどのアプリケーションにとって十分である。]
[0028] 以下、改良エイリアス補正(Enhanced Alias Compensation)(EAC)を説明する。このステップの目的は、(MP3多位相フィルタバンクに由来する)残存エイリアス項を、MP3周波数ビンから除くことである。このように、このステップは、上記の通り、MP3フィルタバンクドメイン(変換元フィルタバンクドメイン)から歪んだ擬似MDCT(中間フィルタバンクドメインとして機能するワープした目標フィルタバンクドメイン)へのマッピング手順である。]
[0029] マッピング行列EACp、EAC、EACnは、MP3合成行列を擬似MDCTフィルタバンクの分析行列とかけて求められる。前のフレームと次のフレームに、貢献(contributions)に加えて、時間シフトを加える。]
[0030] その結果得られる全体行列(full matrices)を、一例としてロングウィンドウの場合について、図6に示した。図から分かるように、ほとんどの変換係数はゼロであり、計算はまったく必要ない。具体的に、前のフレームへの貢献行列EACpと、次のフレームへの貢献行列EACnについて、さらに、全体行列(full matrices)は実質的に「タイル」すなわち部分行列(sub-matrices)により構成されていることが分かる。タイルすなわち部分行列は主対角線に沿って31回繰り返されている。] 図6
[0031] 図7に、各改善エイリアス補正行列EACp、EAC、EACnに対して1つずつ、3つの基本的なタイルを、4つのウィンドウタイプtp1、tp2、tp3、tp4すべてについて示した。タイルは、原理的に、MP3ハイブリッドフィルタバンクに対するある種の複雑なエイリアス補正を表している。] 図7
[0032] 上記の例では、tp1は「ロング」に対応し、tp2は「スタート」に対応し、tp3は「ストップ」に対応し、tp4は「ショート」に対応する。上記の部分行列のサイズは、この例では、「ロング」、「スタート」、「ストップ」に対しては18行×18列であり、「ショート」に対しては18行×36列である(しかし、EACnとEACpの場合には、列は一行おきにゼロなので、係数の数は同じであることに留意せよ)。他のフィルタバンクドメインの場合には、大きさは異なり得る。]
[0033] 以下、記憶と計算を効率的にする可能性を説明する。図10に示した12枚のタイルには都合のよい類似性がある。最も重要なものは次の通りである:
第1に、EAC(tp1)タイルは、主対角線上と逆対角線上(anti-diagonal)にのみ、非ゼロの係数を有する。それゆえ、このタイルの記憶と計算にはほとんど手間がかからない。] 図10
[0034] 第2に、タイルEAC(tp2)とEAC(tp3)は、タイルEAC(tp1)全体に低レベルの係数を加えて構成されている。それゆえ、EAC(tp2)及びEAC(tp3)と、EAC(tp1)との間の差のみを記憶して、メモリを節約できる。残りの低レベル係数の記憶の精度は非常に低くてもよいので、係数ごとのビット数とそれに必要なメモリエリアは小さくなる。]
[0035] 一実施形態では、真ん中の列のEACタイル(すなわち部分行列)に、対角線上に1を、すなわち単位行列を加えて、図6の行列で用いる実際のEACタイルを求める。すなわち、対角線上の値は正のオフセット「1」を有し、記憶すべき値はより小さくなる。さらに、ショートウィンドウの場合には、不均一なアスペクト比の効果が見られる。] 図6
[0036] 第3に、EACp(tp2)はEACp(tp1)と等しく、EACn(tp3)はEACn(tp1)と等しい。]
[0037] 第4に、和と差を用いて非常に効率的に記憶と計算ができるという意味において、貢献行列EACp(tp1)とEACn(tp1)とは類似している。すなわち、差EACp(tp1)−EACn(tp1)はEAC(tp1)タイルと同様の、対角行列プラス逆対角行列よりなる構成を有する。EACp(tp1)とEACn(tp1)とを同時に(jointly)記憶し、計算することにより、効率的な記憶と計算が可能である。]
[0038] 第5に、タイルEACp(tp4)とEACn(tp4)は、一部の列がゼロかゼロに近いという意味でスパース(sparse)である。これらの列は記憶も計算もする必要がない。]
[0039] このように、好都合にも、先行技術のマッピング行列の周波数依存性は、改善エイリアス補正行列EAC、EACp、EACn内の18サブバンド(すなわち周波数ビン)ごとに繰り返されるタイル内の小さな変化に変換されている。マッピングにはこれ以上の周波数依存性は残らない。]
[0040] 以下、サブバンド符号訂正(SSC)を説明する。これは、中間ドメインDiから目標フィルタバンクドメインDTへの第2の変換ステップの一サブステップとして用いる。ここで、サブバンド符号訂正とは、フィルタバンクドメインサブバンド(「ビン」)のグループを指す。例えば、図8と図9において、一様な符号訂正を適用したサブバンドは、18フィルタバンクドメインサブバンド、すなわちビンを含む。図3に示すように、サブバンド符号訂正(sub-band sign correction)では、入力として、擬似MDCT等の中間ドメインのサブバンド計数psdo(m−1)、psdo(m)、psdo(m+1)を受け取る。] 図3 図8 図9
[0041] 式4、5の位相修正項φiは、MP3多位相フィルタバンクが一つおきに逆符号になっており、すなわち、18ビンごとに、項φiはπだけジャンプする。これはMP3フィルタバンクの同様のビヘイビア(behaviour)を反映している。このように、サブバンド符号訂正は変換元フィルタバンクの特徴に合わせることである。]
[0042] 擬似MDCTから整数MDCTへのマッピングの場合、第1のステップは、サブバンド符号訂正(SSC)を適用してサブバンドの交替する符号の訂正(correction)を含む。擬似MDCT値は、図8に示したSSC関数と乗算される。] 図8
[0043] 歪んだ擬似MDCTの付加位相項を補正するために、元のMDCTと比較して、さらに別のマッピングステップが必要である。利用する各ウィンドウタイプ(例えば、ロング、スタート、ショート、ストップの場合、tp1−tp4)に対して、及び各トランジション(transition)(ロングからロング、ショートからショート)に対して、個別に位相補正(phase correction)が必要である。例えば、マッピング行列を用いて位相補正が可能である。一実施形態では、これらのマッピング行列の具体的な構成に応じて、周波数ドメインビンに重み付けしてフィルタするアプローチを用いることができる。これは以下に説明する。]
[0044] 適用可能な12個の位相補正行列のすべてに、そのほとんどの部分に大きな冗長性がある。最初に、MP3からMDCTへのマッピング例では、次のトランジション行列は同一である:
PCp(long)=PCp(start)、
PCn(long)=PCn(stop)、
PCn(start)=PCn(short)、
PCp(stop)=PCp(short)。
この特性により、行列の記憶について冗長性削除を用いられるので、位相補正行列のうち異なるものの数が8になる。]
[0045] さらに、前のフレーム(例えば、PCp(long))に対する貢献と、次のフレーム(例えば、PCn(long))に対する貢献に適用する行列は非常に類似している。これらは、一つおきの係数の符号が異なるだけである。このように、一実施形態では、これらの2つの行列は、2つの部分行列とそれに続く「バタフライ」演算として実現される。これは、図2に示したように、加算器S1と減算器(すなわち加算器及び符号反転器)S2を用いた、2つの値の同時加算と減算として知られている。] 図2
[0046] 第3に、ほとんどの行列は、周波数に依存しない重み付け演算Wと、周波数ビンに適用される付加的畳み込みフィルタとに分解できる。この分解には、周波数ビンごとに1つの重み付けファクタ(factor)と、一定のフィルタインパルス応答のみを記憶すればよいという利点がある。このように、一実施形態では、上記の部分行列は、重み付け演算Wと2つの畳み込みフィルタH1、H2として実現できる。この畳み込みは、周波数ドメインに適用され、時間ドメインにおける乗算に対応する。この畳み込みの理論的基礎は、従来のMP3合成、時間遅れ、MDCT分析のシーケンスに適用できる時間ドメインのウィンドウ化(windowing)である。]
[0047] 上記の実施形態は、図2に示したように、ハードウェアの使用と演算の複雑性に関して、非常に効率的である。特に、ロングウィンドウの場合、上記の冗長化によりシステムアーキテクチャが非常に効率的になる。位相補正ステップPCp(long)とPCn(long)を、周波数ビンごとに重み付けファクタを適用して、その後2つのフィルタH1、H2でフィルタすることにより、同時に(jointly)計算される。これら2つのフィルタは、H1が奇数位置だけに非ゼロ係数を有し、H2が偶数位置だけに非ゼロ係数を有するという意味で、スパース(sparse)である。フィルタ出力を加算すると、前のMDCTフレームへの位相補正貢献(phase correction contribution)となり、減算すると、次のMDCTフレームへの貢献となる。] 図2
[0048] 例えばPC(start)、PC(stop)、PC(long)間の位相補正マッピング行列における具体的な類似性を利用することにより、さらに効率的にすることができる。しかし、原理的には上記と同様である。]
[0049] 以下、2つの実施例を説明する。]
[0050] 図4は、上記の2ステージマッピング手順の簡単な実施形態を示している。各フレームサイクルの始めに、
state.pseudo1<=state.pseudo2、
state.pseudo2<=state.pseudo3、
state.pseudo3<=0
とバッファをシフトする。
同様に、
Bout<=state.out1、
state.out1<=state.out2、
state.out2<=0。
MP3周波数ビンの各入力フレームは、行列EACp、EAC、EACnとの乗算を用いてマッピングされ、その結果はstate.pseudo1、state.pseudo2、state.pseudo3に加算される。次に、サブバンド符号訂正(SSC)と位相補正(PC)をバッファstate.pseudo1に適用する。] 図4
[0051] その結果得られる3つの貢献PCp*SSC、PC*SSC、PCn*SSCを、3つのバッファBout、state.out1、state.out2にそれぞれ加算される。バッファBoutは出力準備ができた状態である。]
[0052] 上記の実施形態では、出力ベクトルは、入力フレームに対して2フレームサイクルのレイテンシ(latency)を有する。図4に示した構成は、複雑でない実施形態が所望であれば、関心があるだろう。EACpとEACnの貢献を同時に計算でき、PCpとPCnの貢献も同時に計算できるからである。] 図4
[0053] しかし、レイテンシが小さい実施形態が望ましい場合もある。レイテンシが1フレームサイクルだけの代替的実施形態を図5に示した。この実施形態では、PCp−SSC−EACp(変換元ドメインバッファからEACp、SSC、PCpを経由して目標ドメインバッファBoutまでの経路に対応する)が実質的にゼロであるという事実を利用する。そのため、PCp−SSCの出力ベクトルに対する貢献は、バッファstate.pseudo2からすでに計算できているが、このバッファは現在の入力MP3ベクトルのEACpを経由した貢献を含んでいない。] 図5
[0054] このアプローチは、記憶する1ベクトルを節約できるので、レイテンシが1フレームしか発生しないという利点がある。一方、この代替的実施形態は、PCpとPCnを同時に計算(jointly computing)することによる位相補正行列の対称性をもはや利用できない。]
[0055] 上記の2ステップアプローチの利点は、すべてのルックアップテーブルのサイズが、先行技術として知られているアーキテクチャよりも非常に小さいことである。上記のMP3から整数MDCTへのマッピングの例では、ルックアップテーブルは、12664バイトまで合計され、これは従来の直接マッピングアルゴリズムで用いられる174348バイトと対照的である。]
[0056] いうまでもなく、本発明を例示によって説明した。本発明の範囲から逸脱することなく細かい点で修正を加えることは可能である。]
[0057] 明細書、特許請求の範囲、及び図面に開示した各特徴は、独立に設けることもできるし、適切に組み合わせて設けることもできる。必要に応じて、ハードウェア、ソフトウェア、またはこれらの組み合わせで本発明の特徴を実現することができる。接続は場合に応じて無線接続でも有線接続でもよく、必ずしも直接的または専用の接続でなくてもよい。特許請求の範囲に示す参照符号は例示であり、請求項の範囲を限定するものではない。]
权利要求:

請求項1
第1のフィルタバンクドメインの第1のデータフレームを、第2のフィルタバンクドメインの第2のデータフレームに変換する方法であって、前記第1のフィルタバンクドメインのサブバンドを、前記第2のフィルタバンクドメインに対応するが、歪んだ位相を有する中間ドメインのサブバンドにコード変換する段階と、前記中間ドメインの前記サブバンドを、前記第2のフィルタバンクドメインのサブバンドにコード変換する段階であって、前記中間ドメインの前記サブバンドに位相補正を行う段階とを有する方法。
請求項2
第2のデータフレームは少なくとも3つの連続した第1のデータフレームよりなり、少なくとも3つの連続した第2のデータフレームの符号化に第1のデータフレームを用いる、請求項1に記載の方法。
請求項3
少なくとも前記第2のドメインと前記中間ドメインとを、余弦関数を含む変換により時間ドメイン信号から生成でき、前記中間フィルタバンクドメインの前記歪んだ位相は前記余弦関数の周波数に依存した付加的位相項に対応する、請求項1または2に記載の方法。
請求項4
前記第1のフィルタバンクドメインのサブバンドを前記中間ドメインのサブバンドにコード変換する段階は、前記第1のフィルタバンクドメインの前記サブバンドから残存エイリアス項を除去する段階を有する、請求項1ないし3いずれか一項に記載の方法。
請求項5
マッピング行列を用いる、各マッピング行列は主対角線に沿って別個の、しかし同じ部分行列を有し、他の位置ではゼロを有する、請求項3または4に記載の方法。
請求項6
前記中間ドメインのサブバンドを前記第2のフィルタバンクドメインのサブバンドにコード変換する段階は、サブバンド符号訂正を有する、請求項1ないし5いずれか一項に記載の方法。
請求項7
前記サブバンド符号訂正はサブバンドの符号の一つおきの反転を有する、請求項6に記載の方法。
請求項8
前記中間ドメインのサブバンドを前記第2のフィルタバンクドメインのサブバンドにコード変換する段階は、前記中間ドメインの付加的位相項の補償に適している、請求項1ないし7いずれか一項に記載の方法。
請求項9
前記フィルタバンクドメインは変換時間ウィンドウを用い、前記時間ウィンドウに対して、複数の異なるウィンドウ形状が予め定められ、前記第1と第2のデータフレームは異なるウィンドウ形状を用い、各ウィンドウ形状に対して、及び前記中間フィルタバンクドメインと前記第2のフィルタバンクドメインのウィンドウ形状間のトランジションに対して、それぞれの位相補正を行う、請求項1ないし8いずれか一項に記載の方法。
請求項10
前記中間ドメインのサブバンド係数を重み付けてフィルタして、前記位相補正を行う、請求項1ないし9いずれか一項に記載の方法。
請求項11
前記重み付けは周波数に依存し、異なる周波数サブバンドの重みは異なり、前記フィルタは畳み込みフィルタである、請求項10に記載の方法。
請求項12
前記フィルタには2つのフィルタを用い、一方のフィルタは奇数位置のみに非ゼロ係数を有し、他方のフィルタは偶数位置にのみ非ゼロ係数を有するという意味で前記2つのフィルタはスパースである、請求項10に記載の方法。
請求項13
前記2つのフィルタの出力の加算により前記第2のドメインの前のフレームへの位相補正貢献が得られ、前記出力の減算により前記第2のドメインの次のフレームへの貢献が得られる、請求項10に記載の方法。
請求項14
前記フレームはオーディオ信号フレームであり、前記第1のフィルタバンクドメインはMP3ハイブリッドフィルタバンクのフィルタバンクドメインであり、前記第2のフィルタバンクドメインはMDCTフィルタバンクのフィルタバンクドメインである、請求項1ないし13いずれか一項に記載の方法。
請求項15
第1のフィルタバンクドメインの第1のデータフレームを、第2のフィルタバンクドメインの第2のデータフレームに変換する装置であって、前記第1のフィルタバンクドメインのサブバンドを、前記第2のフィルタバンクドメインに対応するが、歪んだ位相を有する中間ドメインのサブバンドにコード変換する第1のコード変換手段と、前記中間ドメインの前記サブバンドを、前記第2のフィルタバンクドメインのサブバンドにコード変換する第2のコード変換手段とを有し、前記第2のコード変換手段は、前記中間ドメインの前記サブバンドに位相補正を行う位相補正手段を有する装置。
請求項16
マッピング行列を適用する計算手段により前記位相補正を行う、請求項15に記載の装置。
請求項17
前記中間ドメインのサブバンド係数を重み付けてフィルタする重み付け手段により、前記第2のコード変換手段における前記位相補正を行う、請求項15または16に記載の装置。
請求項18
前記フィルタ手段は、前記第2のフィルタバンクドメインの前と後のフレームに関する2つのマッピング行列に対応する2つの位相補正サブステップを同時に行う、請求項17に記載の装置。
类似技术:
公开号 | 公开日 | 专利标题
JP6437990B2|2018-12-12|MDCT-based complex prediction stereo coding
US20170208412A1|2017-07-20|Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
US10685659B2|2020-06-16|Audio entropy encoder/decoder for coding contexts with different frequency resolutions and transform lengths
JP6472863B2|2019-02-20|Method for parametric multi-channel encoding
JP5859504B2|2016-02-10|合成フィルターバンク、フィルタリング方法及びコンピュータプログラム
Chung et al.2001|A novel SVD-and VQ-based image hiding scheme
US20150237358A1|2015-08-20|Method and device for interpolating images by using a smoothing interpolation filter
CA3026267C|2019-04-16|Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters
US6275619B1|2001-08-14|System and method for performing wavelet and inverse wavelet transformations of digital data using semi-orthogonal wavelets
US8311815B2|2012-11-13|Method, apparatus, and program for encoding digital signal, and method, apparatus, and program for decoding digital signal
US8495115B2|2013-07-23|Apparatus and method for low complexity combinatorial coding of signals
US7791508B2|2010-09-07|Enhanced control for compression and decompression of sampled signals
US5341442A|1994-08-23|Method and apparatus for compression data by generating base image data from luminance and chrominance components and detail image data from luminance component
EP1353513B1|2006-06-14|Rounding control for multi-stage interpolation
US8886346B2|2014-11-11|Oversampling in a combined transposer filter bank
US7116831B2|2006-10-03|Chrominance motion vector rounding
US7110459B2|2006-09-19|Approximate bicubic filter
KR102013568B1|2019-08-23|고 주파수 재구성 또는 파라메트릭 스테레오를 위한 복소 지수 변조 필터 뱅크
JP5036900B2|2012-09-26|効率的な損失なしデータ圧縮のための可逆重ね合わせ演算子
US5508949A|1996-04-16|Fast subband filtering in digital signal coding
ES2378393T3|2012-04-12|Utilización selectiva de múltiples modelos para codificación y descodificación adaptativa
CA2653692C|2013-07-30|Reduction of errors during computation of inverse discrete cosine transform
KR101126813B1|2012-03-23|Audio Transform Coding Using Pitch Correction
KR100957711B1|2010-05-12|오디오 서브밴드 값을 생성하는 장치 및 방법과 시간 영역 오디오 샘플을 생성하는 장치 및 방법
US5845243A|1998-12-01|Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of audio information
同族专利:
公开号 | 公开日
KR101589709B1|2016-01-28|
CA2717226A1|2009-09-11|
WO2009109468A1|2009-09-11|
EP2250642A1|2010-11-17|
AU2009221366A1|2009-09-11|
JP5490731B2|2014-05-14|
EP2250642B1|2015-10-21|
EP2099027A1|2009-09-09|
KR20100134635A|2010-12-23|
AU2009221366B2|2011-09-29|
BRPI0907840A2|2015-07-21|
CN101960515A|2011-01-26|
US8620671B2|2013-12-31|
CN101960515B|2012-07-18|
US20110004478A1|2011-01-06|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
法律状态:
2012-01-28| A621| Written request for application examination|Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120127 |
2012-11-14| A131| Notification of reasons for refusal|Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121113 |
2013-02-13| A521| Written amendment|Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130212 |
2013-09-04| A02| Decision of refusal|Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130903 |
2014-01-07| A521| Written amendment|Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140106 |
2014-01-16| A911| Transfer of reconsideration by examiner before appeal (zenchi)|Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20140115 |
2014-01-31| TRDD| Decision of grant or rejection written|
2014-02-13| A01| Written decision to grant a patent or to grant a registration (utility model)|Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140212 |
2014-03-06| A61| First payment of annual fees (during grant procedure)|Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140226 |
2014-03-07| R150| Certificate of patent or registration of utility model|Ref document number: 5490731 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
2017-03-07| LAPS| Cancellation because of no payment of annual fees|
优先权:
申请号 | 申请日 | 专利标题
[返回顶部]