专利摘要:
本発明は、音響記録を示す信号の雑音抑圧のためのデジタルフィルタ構成を設計する方法及びフィルタ設計装置に関する。方法は、デジタルフィルタ構成の目標周波数応答を決定するステップを有する。方法は、フィルタ構成においてハイパスフィルタと雑音抑圧フィルタとの組合せを含むことを特徴とする。ハイパスフィルタと雑音抑圧フィルタとの組合せは、決定された目標周波数応答に基づいて選択される。
公开号:JP2011509008A
申请号:JP2010539356
申请日:2007-12-20
公开日:2011-03-17
发明作者:アンデシュ エリクソン,;ペル オーグレン,
申请人:テレフオンアクチーボラゲット エル エム エリクソン(パブル);
IPC主号:H03H17-02
专利说明:

[0001] 本発明は、デジタルフィルタ設計の分野に関する。特に、本発明は、音響記録を示す信号における雑音抑圧のためのデジタルフィルタの設計の分野に関する。]
背景技術

[0002] 自然環境において雑音はいたる所に存在するため、実世界の音声記録は、一般に、種々の発信元からの雑音を含む。音声記録の音声品質を向上させるため、音声記録の雑音レベルを下げる種々の方法が開発されている。多くの場合、そのような方法において、時間領域雑音抑圧フィルタは、目標周波数応答から算出されて音声記録に適用される。スペクトルサブトラクションは、音響記録において雑音を抑圧するのに使用されることが多い方法である。"Low-distortion spectral subtraction for speech enhancement", Peter Handel, Conference Proceedings of Eurospeech, pp. 1549-1553, ISSN 1018-4074, 1995 には、雑音を抑圧するスペクトルサブトラクション方法の種々の態様が説明されている。]
先行技術

[0003] "Low-distortion spectral subtraction for speech enhancement", Peter Handel, Conference Proceedings of Eurospeech, pp. 1549-1553, ISSN 1018-4074, 1995]
発明が解決しようとする課題

[0004] フィルタリングされる音声記録の品質は、使用される時間領域雑音抑圧フィルタを伸長することにより向上しうる。しかし、時間領域雑音抑圧フィルタが長いほど、より多くの計算が必要である。これは、電話等のリアルタイムアプリケーションにおいて特に問題である。リアルタイムアプリケーションにおいて、超高速でフィルタリングされる必要があるため、計算を必要とするフィルタは高度な処理能力を必要とする。高速なプロセッサほど高価であり、かつ一般にエネルギーを消費する。従って、計算能力に関する要求に影響を及ぼさないように音声記録において雑音抑圧の品質を向上させる必要がある。]
[0005] 本発明が関連する問題は、音響記録において低周波数での雑音減衰の時間に依存するばらつきの回避方法に関する問題である。]
課題を解決するための手段

[0006] この問題は、音響記録を示す信号の雑音抑圧のためのデジタルフィルタ構成を設計する方法により解決される。この方法は、前記デジタルフィルタ構成の目標周波数応答を決定するステップを有する。この方法は、ハイパスフィルタと雑音抑圧フィルタとの組合せをフィルタ構成に含めるステップを更に有する。前記ハイパスフィルタと雑音抑圧フィルタとの組合せは、前記決定された目標周波数応答に基づいて選択される。]
[0007] また、上記問題は、音響記録を示す信号の雑音抑圧のためのデジタルフィルタ構成を設計するデジタルフィルタ設計装置により解決される。デジタルフィルタ設計装置は、目標周波数応答に基づいて雑音抑圧フィルタを選択する雑音抑圧フィルタ設計装置と、雑音抑圧フィルタとカスケードに適用されるハイパスフィルタを選択するハイパスフィルタ設計装置とを含む。]
[0008] さらに、上記問題は、デジタルフィルタ装置及びデジタルフィルタ装置を設計するコンピュータプログラムによっても解決される。]
[0009] 本発明によれば、制限された計算能力で低周波数雑音が効率的に抑圧されるため、低周波数での雑音抑圧のばらつきが回避されるか又は減少する。]
図面の簡単な説明

[0010] 本発明については、以下の添付の図面ならびに下記の説明を参照することにより、その更なる目的および利点とともに、最もよく理解されるであろう。]
[0011] 従来技術に係る雑音抑圧フィルタ設計装置を示す概略図である。
音響記録を示す信号に音声が存在する時点の目標周波数応答及び従来の雑音抑圧フィルタを使用してこの時点に対して取得される実現された周波数応答を示すグラフである。
音響記録を示す信号に音声が存在しない時点の目標周波数応答及び従来の雑音抑圧フィルタを使用してこの時点に対して取得される実現された周波数応答を示すグラフである。
本発明におけるフィルタ装置を設計する方法を概略的に示すフローチャートである。
フィルタ装置に含まれるハイパスフィルタを選択する方法を概略的に示すフローチャートである。
本発明のフィルタ設計装置の一実施形態を概略的に示す図である。
本発明のフィルタ設計装置の別の実施形態を概略的に示す図である。
本発明のフィルタ設計装置の更に別の実施形態を概略的に示す図である。
図2aの例を示すグラフと、本発明に係るフィルタ装置の周波数応答のグラフである。
本発明に係るデジタルフィルタ設計装置を内蔵するユーザ装置を示す概略図である。] 図2a
実施例

[0012] 雑音重畳音声信号y(t)は、所望の音声成分s(t)と雑音成分n(t)を有し、以下のように表される。]
[0013] y(t)=s(t)+n(t) (1)]
[0014] 多くの場合、推定される音声成分^s(t)が音声成分s(t)に可能な限り類似するよう、雑音成分n(t)を抑圧し音声成分の推定値^s(t)を形成することが望まれる。これを実行する1つの方法は、なるべく多くの音声成分s(t)を保持しておき、なるべく多くの雑音成分n(t)を除去するように設計される時間領域雑音抑圧フィルタh(z)で雑音信号y(t)をフィルタリングすることである。]
[0015] 雑音抑圧フィルタh(z)は、通常、目標周波数応答H(ω)から算出される。ここで、H(ω)は、一般に、y(t)が雑音のみを含む周波数ωの場合にH(ω)はゼロに近接し、y(t)が音声のみを含む周波数ωの場合にH(ω)=1であり、かつy(t)が雑音重畳音声を含む周波数ωの場合に0<H(ω)<1であるように設計される実数値関数である。]
[0016] 雑音信号の音声成分を判定する際、線形変換F[・]が雑音信号のサンプルのフレームに適用されることが多い。以下の関係を仮定することにより、雑音抑圧フィルタh(z)は目標周波数応答H(ω)の逆線形変換F-1[・]として取得される。]
[0017] ]
[0018] ただし、F[・]は高速フーリエ変換(FFT)等の線形変換を示す。従って、音声成分推定値^s(t)は以下のように得られる。]
[0019] ]
[0020] 従って、式(3)から音声成分推定値^s(t)を求めるために、目標周波数応答H(ω)が決定される必要がある。上述のように、y(t)が雑音重畳音声を含む周波数ωの場合、0<H(ω)<1である。そのような周波数の場合、特定の周波数においてH(ω)に対して選択される特定の値は、その周波数において雑音重畳音声信号y(t)の信号対雑音比(SNR)に依存して選択されることが多い。]
[0021] 目標周波数応答H(ω)は種々の方法を使用して推定される。一般的な方法はスペクトルサブトラクションである(スペクトルサブトラクションによりH(ω)を取得する方法に関する説明は、例えば"Low-distortion spectral subtraction for speech enhancement", Peter Handel, Conference Proceedings of Eurospeech, pp. 1549-1553, ISSN 1018-4074, 1995 を参照されたい。特定の周波数における雑音重畳音声信号y(t)のSNRは経時変動するため、目標周波数応答H(ω)は、一般にある期間にわたり更新される。すなわち、目標周波数応答H(ω)は、一般にデータのフレーム毎に更新される。従って、目標周波数応答H(ω)は、一般にフレーム間で変動するため、H(kn, ω)≠(H(kn+1, ω)である。ただし、knはフレーム番号nのフレームのタイミングを示す。あるいは、目標周波数応答H(ω)、及びその目標周波数応答から決定されるフィルタ構成は、異なる時間間隔で更新されてもよい。従って、目標周波数応答及びフィルタ構成は経時変動する。しかし、説明を簡略化するため、H(ω)とh(z)との時間依存関係は以下の式では明示的に示されない。]
[0022] 図1は、受信しサンプリングされた雑音重畳音声信号y(t)に基づいて適切な雑音抑圧フィルタhNS(z)を生成するように構成され、従来技術に従って動作するフィルタ設計装置100を示す。フィルタ設計装置100は、サンプリングされた雑音重畳音声信号y(t)を受信しサンプリングされた雑音重畳音声信号y(t)の線形変換Y(ω)を生成するように構成される線形変換器105を含む。図1のフィルタ設計装置100は、サンプリングされた信号y(t)の線形変換Y(ω)を受信し、線形変換Y(ω)に基づいて目標周波数応答H(ω)を決定するように構成される目標応答決定器110を更に含む。フィルタ設計装置100は、目標周波数応答H(ω)を受信し、目標周波数応答H(ω)の逆線形変換を生成するように構成される逆線形変換器115を含む雑音抑圧フィルタ設計装置112を更に含む。一般に、逆線形変換器115の出力は、雑音抑圧フィルタhNS(z)を取得するために、例えば米国特許第7,251,271号公報において説明されるように雑音抑圧フィルタ設計装置112において更に処理される。フィルタhNS(z)の長さは、本明細書においては更に詳細に説明しないそのような更なる処理に依存して決定される。雑音抑圧フィルタ設計装置112の出力は、雑音抑圧フィルタhNS(z)を示す信号である。] 図1
[0023] 音声アプリケーションにおいて雑音を抑圧する場合、目標周波数応答H(ω)は、雑音のみが存在する低周波数と、音声が雑音と共に存在する周波数との間で急峻な遷移を含むことが多い。これを図2に示す。図2において、目標周波数応答H(ω)は2つの異なる時刻において実線で記される。図2aは、音声が存在する時点kmを示す。一方、図2bは、音声が存在せずかつ信号y(t)が雑音成分n(t)のみを含む時点knを示す。示されるように、低周波数において非常に所望される抑圧と図2aのより高くかつ音声を含む周波数においてあまり所望されない抑圧との間の遷移は、非常に急峻である。周波数応答におけるそのような急峻な遷移は、実現される雑音抑圧フィルタhNS(z)に多くの係数を含むことにより取得される。] 図2a 図2b
[0024] しかし、実現される雑音抑圧フィルタhNS(z)に多くの係数を含むことにより、雑音抑圧フィルタを実現する際に必要な計算の数が増加する。多くのアプリケーションにおいて、これは計算能力が制限されるために実現不可能であり、例えばリアルタイムアプリケーションの場合に多く当てはまる。一般的な実現される雑音抑圧フィルタhNS(z)の実現された周波数応答Hrealised(ω)は、図2a及び図2bに点線で示される。音声及び雑音の双方が存在する時間kmの場合、実現された周波数応答Hrealised(ω)は、低周波数における目標周波数応答H(ω)の不適切な近似値である。その一方で、雑音のみが存在しかつ目標周波数応答H(ω)における遷移がそれほど極端ではない時間knの場合、実現された周波数応答Hrealised(ω)は目標周波数応答H(ω)の適切な近似値を提供する。それぞれ図2a及び図2bの点線で示される時間kmにおけるHrealised(ω)、Hrealised(km, ω)と、時間knにおけるHrealised(ω)、Hrealised(kn, ω)とを比較することにより、従来技術の解決策における実現雑音抑圧フィルタhNS(z)が十分な数の係数を含まない場合に低周波数における雑音レベルが時間と共にかなり変動することを示す。そのような雑音抑圧の時間に依存するばらつきは、一般に雑音ポンピングと呼ばれ、音声成分推定値^s(t)においてシャドウボイスと呼ばれる。] 図2a 図2b
[0025] 従って、リアルタイムアプリケーションの場合又は計算能力が制限される他のアプリケーションにおいて、雑音重畳音声信号y(t)の適切なフィルタリングを取得する別の方法を見つけるのが望ましい。]
[0026] 本発明によれば、目標周波数応答は、ハイパスフィルタと雑音抑圧フィルタとの組合せによって得られる。雑音抑圧フィルタhNS(z)に加えてハイパスフィルタを、雑音重畳音声信号y(t)に適用することにより、雑音抑圧フィルタhNS(z)の低周波数における雑音抑圧に対する要求はそれほど厳密ではなくなり、より少ない数の係数を含む雑音抑圧フィルタを、目標周波数応答H(ω)に十分に近接する周波数応答を取得するために使用することができる。]
[0027] 従って、本発明に係る総合時間領域フィルタ構成htotal(z)は以下のように取得される。]
[0028] ]
[0029] ただし、hHP(z)はハイパスフィルタ、hNS(z)は雑音抑圧フィルタである。]
[0030] 本発明に従って、ハイパスフィルタ及び雑音抑圧フィルタを含むフィルタ装置を設計する方法を示す概略的なフローチャートを、図3に示す。ステップ300において、以下において目標総合周波数応答Htotal(ω)と呼ばれるフィルタ構成の目標周波数応答H(ω)が決定される。ステップ305において、ハイパスフィルタ又は雑音抑圧フィルタのいずれか一方が決定される。ステップ310において、まだ決定されていないフィルタ、すなわちステップ305において決定されなかったハイパスフィルタ及び雑音抑圧フィルタのうちの一方に対して目標周波数応答が決定される。まだ決定されていないフィルタの目標周波数応答は、残留目標周波数応答、すなわちステップ305において決定されたフィルタにより取得されない目標総合周波数応答Htotal(ω)の一部として決定されるのが有利であるため、ハイパスフィルタと雑音抑圧フィルタとの組合せから取得される実現された総合周波数応答は目標総合周波数応答Htotal(ω)に可能な限り近接する。] 図3
[0031] HNS(ω)HHP(ω)=Htotal(ω) (5)]
[0032] 次に、ステップ315に進み、まだ決定されていないフィルタが決定される。]
[0033] ステップ305において、すなわち雑音抑圧フィルタhNS(z)を決定する前にハイパスフィルタhHP(z)が決定される場合、ハイパスフィルタは目標総合周波数応答Htotal(ω)に基づいて選択されるのが有利である。しかし、本発明のいくつかの実施形態において、所定のハイパスフィルタは、目標総合周波数応答Htotal(ω)に依存せずに使用されてもよい(そのような場合、ハイパスフィルタhHP(z)はステップ300の前に決定される。)。]
[0034] 上述のように、ハイパスフィルタhHP(z)が最初に決定されかつ雑音抑圧フィルタがステップ315において決定される場合、選択されるハイパスフィルタの周波数応答HHP(ω)は式(5)に基づいて考慮されるのが好ましい。しかし、本発明のいくつかの実現例においては、目標総合周波数応答を雑音抑圧フィルタの目標周波数応答として使用すること、すなわち、HNS(ω)=Htotal(ω)とすることで十分であろう。]
[0035] 雑音抑圧フィルタがステップ315において決定される場合、雑音抑圧フィルタhNS(z)は逆線形変換F-1[・]をHNS(ω)に適用することにより決定される。雑音抑圧フィルタがステップ305において決定される場合、雑音フィルタhNS(z)は逆線形変換F-1[・]をHtotal(ω)に適用することにより決定される。]
[0036] ハイパスフィルタhHP(z)及び雑音抑圧フィルタhNS(z)が図3に示すフィルタ設計方法に基づいて決定された場合、ハイパスフィルタhHP(z)及び雑音抑圧フィルタhNS(z)は、カスケードに雑音重畳音声信号y(t)に適用される。最初にハイパスフィルタhHP(z)が適用され、その後雑音抑圧フィルタhNS(z)が適用されるか又はその逆の順番で適用される。] 図3
[0037] ハイパスフィルタhHP(z)及び雑音抑圧フィルタhNS(z)を含むフィルタ構成の決定は、一般に、フィルタ構成を雑音重畳音声信号y(t)の変動に合わせて調整するためにある期間にわたり更新される。フィルタ構成を更新する任意のパターンが使用されてもよいが、本発明の多くの実現例において、フィルタ構成は雑音重畳音声のフレームが信号を伝送する度に更新される。]
[0038] ハイパスフィルタ及び雑音抑圧フィルタは、Htotal(ω)に基づいて反復して決定される。例えば、フィルタのうちの1つの第1の近似値が仮定される場合、他のフィルタの第1の近似値は、第1のフィルタのこの第1の近似値に依存してステップ305において決定される。ステップ310において、第1のフィルタの目標周波数応答が決定される。ステップ315において、第1のフィルタの第2の近似値は、ステップ315において取得される目標周波数応答に基づいて決定される。更なるステップが図3に示すステップに追加されてもよい。更なるステップにおいて、第2のフィルタの目標周波数応答は第1のフィルタの第2の近似値に基づいて決定される。第2のフィルタの第2の近似値は、更なるステップ等において決定される目標周波数応答に基づいて決定されてもよい。反復数は、使用可能な計算能力及び音響記録の再生の時間要求に基づいて選択されてもよい。] 図3
[0039] ハイパスフィルタhHP(z)を選択するステップの一実施形態を図4に更に示す。図4の方法は、ハイパスフィルタhHP(z)が決定されるこれらのステップに依存して、ステップ305又は315の可能な実現例であると考えられる。説明を簡単にするために、図4に示す本発明の実施形態において、ハイパスフィルタhHP(z)は、雑音抑圧フィルタhNS(z)を決定する前に目標総合周波数応答Htotal(ω)に依存して決定される。しかし、図3に関連して分かるように、雑音抑圧フィルタhNS(z)はハイパスフィルタhHP(z)の前に代わりに決定されてもよい。] 図3 図4
[0040] ステップ405において、ハイパスフィルタhHP(z)に対するカットオフ周波数fcが選択される。カットオフ周波数fcは、通常、Htotal(ω)の高い値と低い値との間で遷移が起こる周波数として選択され、任意の適切な方法を使用して選択される。例えばカットオフ周波数fcは、以下のように決定される。]
[0041] ]
[0042] ただし、周波数fmaxは、周波数間隔fL≦f≦fH内において目標総合周波数応答Htotal(ω)が最大値をとる周波数である(周波数間隔fL≦f≦fHは、一般に雑音重畳音声信号の周波数間隔である)。]
[0043] ステップ410において、ハイパスフィルタhHP(z)の目標阻止域ゲインAHPdesiredが決定される。ハイパスフィルタhHP(z)の目標阻止域ゲインAHPdesiredは、例えば以下のように取得される。]
[0044] ]
[0045] ただし、f1及びf3は、音声が殆ど存在しない2つの適切な低周波数として選択されている。図7に示す例において(以下を参照)、f1は63Hzに設定され、f3は94Hzに設定された。この特定の例において、サンプリング周波数は16kHzであり、長さ512のFFTが使用された。従って、f1=63Hz及びf3=94Hzは、それぞれ、第3の周波数ビン及び第4の周波数ビンに対応する。] 図7
[0046] Htotalstopbandを規定する他の方法、例えばHtotalstopband=Htotal(f0)等が使用されてもよい。式中、f0は、完全な阻止域減衰が適用されるべき周波数として選択される。]
[0047] 目標周波数応答H(ω)に依存しない所定の値は、上記の式(7)において、雑音抑圧フィルタの阻止域応答HNSstopbandの推定値として使用されてもよい。]
[0048] しかし、雑音抑圧のより良い結果を取得するために、雑音抑圧フィルタにより提供される阻止域応答HNSstopbandの値は、ハイパスフィルタhHP(z)が選択される度に推定される。HNSstopbandは、例えば異なるHtotal(ω)に対して取得される種々の雑音抑圧フィルタhNS(z)を分析することにより取得される。そのような分析は、ハイパスフィルタhHP(z)を決定する前に実行されているのが好ましい。そのような分析の結果は、テーブルに格納されているか又は雑音抑圧フィルタ及びハイパスフィルタが決定されるのに従う周知のHtotal(ω)からHNSstopbandの推定値を推定する式として格納されているのが好ましい。従って、式(7)のためにHNSstopbandの値を推定することは、テーブルをチェックすること又は所定の式を介して値を計算することを含む。]
[0049] あるいは、雑音抑圧フィルタの阻止域応答の値、HNSstopbandは、ステップ305〜315を少なくとも1回反復することにより推定されてもよい。最初にステップ315に進むと、HNSstopbandの値は推定される値(例えば、所定の値)を与えられる。雑音抑圧フィルタがこのHNSstopbandの推定値に基づいてステップ315において決定されていると、再びステップ305に進み、ステップ315において決定される雑音抑圧フィルタにより取得される阻止域応答は、ステップ305の雑音抑圧フィルタの阻止域応答HNSstopbandの推定値として使用される。あるいは、ステップ305の前に図3のステップ310が実行されてもよいため、ステップ305に進む際にHNSstopbandの値が既に取得されている。ハイパスフィルタの周波数応答を取るHNS(ω)の値を考慮して、ステップ305が実行された後で再びステップ310に進んでもよい。ハイパスフィルタ及び雑音抑圧フィルタを決定する反復手順は、例えば、ハイパスフィルタがフレーム毎に更新される必要がない状況又は音響記録のフィルタリングが記録の再生の前に実行される状況において適切である。] 図3
[0050] ステップ415において、ハイパスフィルタhHP(z)は、規定されたカットオフ周波数fc及び目標阻止域ゲインAHPdesiredに依存して決定される。]
[0051] 無限インパルス応答(IIR)フィルタに対して要求される係数の数が、一般に、同様の特徴の有限インパルス応答(FIR)フィルタに対して要求される係数の数よりも少ないため、採用されるハイパスフィルタはIIRフィルタであるのが有利である。本発明において使用されるのが有利である従来技術のハイパスフィルタの種類の一例は、1次バタワースフィルタである。バタワースフィルタが通過帯域において平坦な周波数応答を有するように設計されることにより、通過帯域に存在する考えられる音声成分s(t)の歪みが最小となるため、これらのフィルタは本発明の目的のために有利である。1次バタワースフィルタは、通過帯域から阻止域への十分に急峻な遷移を提供し、容易に計算できる。しかし、他の種類のハイパスフィルタ、例えば高次のバタワースフィルタ又はチェビシェフフィルタ等を代わりに採用してもよい。2つ以上のハイパスフィルタの組合せを更に採用してもよい。]
[0052] ステップ415において、採用されるハイパスフィルタの種類のフィルタ係数は、カットオフ周波数fcの値に基づいて従来の方法で決定される。低周波数減衰が所望のハイパスフィルタhHP(z)と比較して制限されないため、これらの係数により規定される時間領域フィルタは以下においてHHPunlimitedと呼ばれる。]
[0053] 目標阻止域ゲインを示す時間領域フィルタを取得するために、ハイパスフィルタhHP(z)は、hHP(z)の阻止域ゲインが目標阻止域ゲインAHPdesiredに可能な限り近接するように、以下のように決定される。]
[0054] ]
[0055] αは値が0〜1の間の係数である。αの値は、例えば以下の式を最小にするαの値として与えられる。]
[0056] ]
[0057] ただし、|HHP(f2)|、は、周波数f2において式(10)に従うhHP(z)の周波数応答HHP(ω)の値である。f2は、ハイパスフィルタhHP(z)の阻止域への周波数として選択されるのが好ましい。例えばf2は、先に示された周波数f1及びf3により規定される周波数間隔の中間にある周波数として選択される。]
[0058] 図4において説明する適切なハイパスフィルタを決定する方法は多種多様である。例えば、フィルタ構成を更新すると、ある瞬間において任意のハイパスフィルタhHP(z)を使用せずに雑音抑圧フィルタhNS(z)を利用して目標総合周波数応答Htotal(ω)の近接近似値を取得するための計算がより容易である可能性があるため、フィルタ構成が更新される場合においてハイパスフィルタhHP(z)を含むのが適切であるか否かに関するチェックが導入される。例えば、雑音重畳音声信号y(t)に音声成分s(t)が存在しない場合、ハイパスフィルタhHP(z)及び雑音抑圧フィルタhNS(z)の双方を適用するよりも雑音抑圧フィルタhNS(z)のみを適用するほうが計算が容易であろう。そのようなチェックは、例えば目標総合周波数応答Htotal(ω)において強く所望される減衰とあまり所望されない減衰との間の遷移の急峻さに基づいてもよい。すなわち、急峻な遷移が所望される場合、一般にハイパスフィルタhHP(z)を適用するのが適切である。あるいは、そのような解析は、雑音重畳音声信号y(t)が音声成分s(t)を含むかをチェックすることを含む。例えば、特定の時点において音声成分が存在しない場合、任意のハイパスフィルタhHP(z)を使用せずにこの時点に対するフィルタ構成を実現するのが有利である。] 図4
[0059] ハイパスフィルタを適用するのが有効かを決定する別の方法は、式(6)又は任意の他の方法により取得されるカットオフ周波数fcが周波数間隔fcmin≦f≦fcmax内に有るかをチェックすることである。この周波数間隔はハイパスフィルタ周波数間隔と呼ばれる。ハイパスフィルタ周波数間隔は、カットオフ周波数がハイパスフィルタ周波数間隔内にある場合にハイパスフィルタhHP(z)が雑音重畳音声信号y(t)に適用されるように選択される。]
[0060] ハイパスフィルタが有効かを決定する更に別の方法は、ステップ410において取得される目標ハイパス阻止域ゲインAHPdesired又は係数αを解析することである。ハイパスフィルタの目標阻止域ゲインAHPdesired又はαの解析は、例えばAHPdesired(α)がAHPdesiredに対して−3dB及びαに対して0.5等の特定の閾値を上回る(あるいは、αが下回る)かに関してチェックすることを含む。阻止域の目標ゲインAHPdesiredが閾値を上回る場合(又はαがα閾値を下回る場合)、目標ゲインは雑音抑圧フィルタhNS(z)により効率的に取得されるのに十分なほど低いと結論付けられるだろう。]
[0061] ハイパスフィルタがフィルタ構成の特定の場合に含まれるべきかを解析する上述の方法は、任意の組合せで使用されるか、あるいは1つの方法のみが独自に実現される(又は方法は実現されない)。そのような解析においてハイパスフィルタがフィルタ構成に含まれるべきではないことが分かる場合、ハイパスフィルタは例えばhHP(z)=1に設定されるか、あるいはフィルタ構成のハイパスフィルタ成分hHP(z)は容易に省略される。]
[0062] ハイパスフィルタを選択する図4に示す方法は、y(t)の全ての時間フレームに対して使用される一定のハイパスフィルタを決定するのに使用されるか、あるいは例えば新しい時間フレーム毎に時々繰り返される。] 図4
[0063] 図5において、本発明に従って動作するフィルタ設計装置500が概略的に示される。フィルタ設計装置500は、フィルタリングされる雑音重畳音声信号y(t)を受信する入力部505、ハイパスフィルタhHP(z)を示す信号を出力する出力部510及び雑音抑圧フィルタhNS(z)を示す信号を出力する出力部515を有する。入力部505は、サンプル雑音重畳音声信号y(t)を受信しかつサンプル雑音重畳音声信号y(t)の線形変換Y(ω)を生成するように構成される線形変換器105に接続される。フィルタ設計装置500は、サンプル信号y(t)の線形変換Y(ω)を示す信号を受信しかつ線形変換Y(ω)に基づいて目標総合周波数応答Htotal(ω)を決定するように構成される目標応答決定器110を更に含む。] 図5
[0064] 本発明のフィルタ設計装置500は、ハイパスフィルタ設計装置520と、雑音抑圧フィルタ設計装置112(図1を参照)とを更に含む。ハイパスフィルタ設計装置520は、雑音成分n(t)の低周波数部分を抑圧するためにハイパスフィルタhHP5(z)を設計するように構成される。図5のフィルタ設計装置500は、互いに関係なくハイパスフィルタhHP(z)及び雑音抑圧フィルタhNS(z)を設計するように構成される。図6に対して分かるように、フィルタ設計装置500により設計されるフィルタ装置は、ハイパスフィルタhHP(z)を設計する際に雑音抑圧フィルタhNS(z)に関する情報を使用することにより及び/又は雑音抑圧フィルタhNS(z)を設計する際にハイパスフィルタhHP(z)に関する情報を使用することにより、更に改善されうる。] 図1 図5
[0065] ハイパスフィルタ設計装置520は、例えば図4のフローチャートにより示される方法に従って動作するように構成される。目標総合周波数応答は、ハイパスフィルタhHP(z)を設計する際に考慮される。] 図4
[0066] フィルタ設計装置520及び112のうちの一方又は双方がフィルタ設計において考慮される他のフィルタ設計装置のフィルタ設計の結果を使用する本発明の実現例において、フィルタ設計装置500は残留周波数応答決定装置を含むのが有利である。残留周波数応答決定装置は、フィルタ設計装置520又は112のうちの一方がフィルタを生成すると、まだ提供されていない目標総合フィルタ応答Htotal(ω)の部分を決定するように構成される。図6a及び図6bにおいて、本発明の本態様の実施形態が示される。] 図6a 図6b
[0067] 図6aはフィルタ設計装置500の一実施形態を示す。図6aにおいて、ハイパスフィルタ設計装置520は雑音抑圧フィルタ設計装置112を開始する前に開始される。本実施形態において、フィルタ設計装置500は、雑音抑圧フィルタhNS(z)により提供されるべき目標総合周波数応答Htotal(ω)の部分を決定するように構成される残留周波数応答決定装置600を更に含む。この部分は目標雑音抑圧周波数応答、HNS(ω)と呼ばれる。図6aの残留周波数応答決定装置600は、目標応答決定器110及びハイパスフィルタ設計装置520から情報を受信するように構成される。残留周波数応答決定装置600は、所望の雑音抑圧フィルタ周波数応答、HNS(ω)を示す信号を雑音抑圧フィルタ設計装置112に搬送するように更に構成される。] 図6a
[0068] 図6aのハイパスフィルタ設計装置520は、目標総合周波数応答Htotal(ω)を示す信号を受信し、かつこのHtotal(ω)信号に応答してハイパスフィルタhHP(z)を生成するように構成される。しかし、ハイパスフィルタ設計装置520は、周波数応答部分信号605aを残留周波数応答決定装置600に搬送するように更に構成される。周波数応答部分信号605aは、ハイパスフィルタhHP(z)により提供される総合周波数応答Htotal(ω)の一部分を示す。周波数応答部分信号605aは、ハイパスフィルタhHP(z)に関する情報又はハイパスフィルタの実現された周波数応答、AHPrealised(ω)に関する情報を含むのが有利である。] 図6a
[0069] 図6bに本発明の別の実施形態を示す。図6bにおいて、雑音抑圧フィルタ設計装置112はハイパスフィルタ設計装置520を開始する前に開始される。本実施形態において、残留周波数応答決定装置600は、ハイパスフィルタhHP(z)により提供されるべき目標総合周波数応答、Htotal(ω)の部分を決定するように構成される。この部分は目標ハイパス周波数応答、HHP(ω)と呼ばれる。図6bの残留周波数応答決定装置600は、目標応答決定器110及び雑音抑圧フィルタ設計装置112から情報を受信するように構成される。図6bの残留周波数応答決定装置600は、所望のハイパスフィルタ周波数応答、HHP(ω)を示す信号をハイパスフィルタ設計装置520に搬送するように更に構成される。] 図6b
[0070] 図6bの実施形態において、雑音抑圧フィルタ設計装置112は、周波数応答部分信号605bを残留周波数応答決定装置600に搬送するように構成される。周波数応答部分信号605bは、雑音抑圧フィルタhNS(z)により提供される総合周波数応答Htotal(ω)の部分を示す。周波数応答部分信号605bは、雑音抑圧フィルタ設計装置112により決定される雑音抑圧フィルタhNS(z)に関する情報又は雑音抑圧フィルタの実現された周波数応答、HNSrealisedに関する情報を含むのが有利である。] 図6b
[0071] 図6a及び図6bの残留目標周波数応答装置600は、目標総合周波数応答Htotal(ω)及び周波数応答部分信号605a又は605bに基づいて残留目標周波数応答HNS(ω)又はHHP(ω)を決定するように構成される。周波数応答部分信号605が既に決定されたフィルタ(どちらのフィルタが既に決定されたかに依存して、ハイパスフィルタ又は雑音抑圧フィルタ)により取得される周波数応答に関する情報を搬送する場合、残留目標周波数応答HNS(ω)又はHHP(ω)は式(5)により取得される。周波数応答部分信号605a及び605bが既に決定された実際の時間領域フィルタ、hHP(z)又はhNS(z)に関する情報を搬送する本発明の本実施形態の実現例において、線形変換F[・]は、既に決定されたフィルタの周波数応答を取得するためにフィルタ応答部分信号605に適用されるのが好ましく、残留目標周波数応答は式(5)に従って決定される。] 図6a 図6b
[0072] 図5、図6aに示すフィルタ設計装置500の種々の実施形態において、ハイパスフィルタ設計装置520は、直接的に又は間接的に(例えば、選択される雑音抑圧フィルタの周波数応答を示す信号を介して)目標総合周波数応答Htotal(ω)を示す信号を受信するように構成される。しかし、同一のハイパスフィルタhHP(z)が雑音重畳音声信号y(t)の全ての場合に適用される本発明の実現例において、ハイパスフィルタ設計装置520は目標周波数応答Htotal(ω)を示す任意の情報を必要とせず、目標応答決定器110とハイパスフィルタ設計装置520との間又はハイパスフィルタ設計装置520と雑音抑圧フィルタ設計装置112との間に接続は必要ない。] 図5 図6a
[0073] フィルタ応答部分信号605a又は605bが決定されるフィルタhHP(z)又はhHP(z)に関する情報を搬送する際、フィルタ応答部分信号605a又は605bは、それぞれハイパスフィルタ設計装置又は雑音抑圧フィルタ設計装置から出力されるフィルタ信号からタップされてもよい。あるいは、フィルタ応答部分信号605は別個の出力部から信号を伝送されてもよい。]
[0074] ハイパスフィルタhHP(z)及び雑音抑圧フィルタhNP(z)がフィルタ設計装置500により決定されている場合、フィルタは、それぞれ出力部510及び515を介して出力されてもよく、カスケードに雑音重畳音声信号y(t)に適用されてもよい。]
[0075] 図4に対して上述されたように、フィルタ設計装置500は、ハイパスフィルタを適用するのが効果的かを判断するように構成されるハイパスフィルタ効果評価装置(不図示)を含んでもよい。フィルタ設計装置500は、例えばバッファ等の他の成分を更に含んでもよい。] 図4
[0076] フィルタ設計装置500は、適切なコンピュータソフトウェア及び/又はハードウェアにより実現されるのが有利である。フィルタ設計装置500は、音声を伝送するユーザ装置、例えば移動電話、固定電話、携帯用無線電話機等で実現されるのが有利である。フィルタ設計装置は、音響信号が処理される他の種類のユーザ装置、例えばカムコーダ、ディクタフォン等で更に実現されてもよい。図8において、本発明に係るフィルタ設計装置を含むユーザ装置800が示される。ユーザ装置800は、音響信号を記録する際に、かつ/あるいは異なる時間において及び/又は異なるユーザ装置により記録された音響信号を再生する際に、本発明に従って雑音抑圧を実行するように構成される。フィルタ設計装置500は、他のデバイス、例えば通信ネットワークのノードにおいて更に実現される。] 図8
[0077] 本発明により、更に高い周波数において性能を維持したまま、低周波数において効率的に雑音を低減できる。人間の耳は低周波数に対して非常に敏感であるため、低周波数の雑音が効率的に抑圧される場合、行なわれた改良は有用である。本発明は、特に、雑音重畳音声記録に適用可能である。音声は最低周波数において周波数成分を殆ど含まないため、これらの低周波数における雑音は、所望の音声信号に外乱を与えることなく抑圧される。しかし、本発明は、他の種類の音響記録において雑音抑圧のために適用されるのが更に有利である。雑音が抑圧される信号y(t)は、上記においては雑音重畳音声信号と呼ばれるものであったが、任意の種類の雑音重畳音響記録であってもよい。]
[0078] ハイパスフィルタhHP(z)と雑音抑圧フィルタhNS(z)とを結合して使用することにより、雑音抑圧フィルタhNS(z)の周波数応答hNS(ω)における急峻な遷移の必要性が従来の雑音抑圧フィルタと比較して大幅に減少する。そのため、数が非常に減少したフィルタ係数を有する雑音抑圧フィルタhNS(z)は、より長い従来の雑音抑圧フィルタで取得されるのと同一の結果を取得する間使用される。ハイパスフィルタhHP(z)は、同様の総合周波数応答が得られる従来の雑音抑圧フィルタと本発明の構成の雑音抑圧フィルタの係数との数の差よりはるかに少ないフィルタ係数を有するIIRフィルタを利用して実現される。従って、同様の雑音抑圧の結果を取得するのに必要なフィルタ係数の総数が減少することにより、雑音抑圧を実現するために必要な計算能力は減少する。あるいは、同一の計算能力により取得される雑音抑圧は非常に向上する。これを図7に示す。図7において、本発明は図2aに示す例に適用されている。目標周波数応答を実線の曲線で示し、従来の雑音抑圧フィルタにより実現される周波数応答を点線の曲線で示し、本発明に係るフィルタ装置を利用して実現される周波数応答を破線の曲線で示す。従来の雑音抑圧フィルタで使用されるフィルタ係数の数は、本発明に係るフィルタ装置の雑音抑圧フィルタhNS(z)で使用されるフィルタ係数の数と同一である。図7のグラフから分かるように、本発明のフィルタ装置を用いて取得される雑音抑圧は、低周波数における従来の雑音抑圧フィルタの雑音抑圧よりずっと適切である。更に高い周波数において、本発明の構成の目標周波数応答のエミュレーションは、従来の雑音抑圧フィルタの構成のエミュレーションと比較して同等に適切であるか又はより適切である。] 図2a 図7
[0079] 所望の雑音抑圧を実現するために必要な計算能力が本発明により大幅に減少するため、本発明は電話等のリアルタイム・アプリケーションにおいて特に有利である。しかし、本発明は、音響記録が格納され後で処理されるアプリケーションにも同様に適用可能である。]
[0080] 本発明は、説明のためだけに提示された添付の図面及び上述の詳細な説明において開示された実施形態に限定されるものではなく、多くの異なる方法で実現されることは当業者には理解されよう。本発明は、以下の特許請求の範囲によって規定される。]
权利要求:

請求項1
音響記録を示す信号(y(t))の雑音抑圧のためのデジタルフィルタ構成を設計する方法であって、前記デジタルフィルタ構成の目標周波数応答(Htotal(ω))を決定するステップ(300)と、ハイパスフィルタ(hHP(z))と雑音抑圧フィルタ(hNS(z))との組合せを、前記フィルタ構成に含めるステップと、を有し、前記ハイパスフィルタと前記雑音抑圧フィルタとの組合せは、前記決定された目標周波数応答に基づいて選択されることを特徴とする方法。
請求項2
前記ハイパスフィルタは、前記目標周波数応答に基づいて選択されることを特徴とする請求項1に記載の方法。
請求項3
前記雑音抑圧フィルタを選択する前に前記ハイパスフィルタを選択するステップと、残留目標周波数応答の推定値を決定するステップ(310)と、前記残留目標周波数応答の推定値に基づいて前記雑音抑圧フィルタを選択するステップと、を更に有することを特徴とする請求項1又は2に記載の方法。
請求項4
前記ハイパスフィルタを選択するときに、前記ハイパスフィルタの阻止域の前記雑音抑圧フィルタの前記応答の推定が考慮されることを特徴とする請求項1乃至3のいずれか1項に記載の方法。
請求項5
前記ハイパスフィルタを選択する前に前記雑音抑圧フィルタを選択するステップと、前記目標周波数応答の推定値を決定するステップ(310)と、前記残留目標周波数応答の推定値に基づいて前記ハイパスフィルタを選択するステップと、を更に有することを特徴とする請求項1又は2に記載の方法。
請求項6
前記目標周波数応答及び前記フィルタ構成を定期的に更新するステップを更に有することを特徴とする請求項1乃至5のいずれか1項に記載の方法。
請求項7
前記目標周波数応答の特定の場合において、前記フィルタ構成に前記ハイパスフィルタを使用することが有効かどうかを検査するステップと、前記ハイパスフィルタを使用することが有効でない場合、前記特定の場合についてはハイパスフィルタが含まれないように前記フィルタ構成を実現するステップと、を更に有することを特徴とする請求項6に記載の方法。
請求項8
音響記録を示す信号(y(t))の雑音抑圧のためのデジタルフィルタ構成を設計するためのデジタルフィルタ設計装置(500)であって、第1の目標周波数応答(Htotal(ω);HNS(ω))に基づいて雑音抑圧フィルタを選択する雑音抑圧フィルタ設計装置(112)と、前記雑音抑圧フィルタ(hNS(z))とカスケードに、前記信号に適用されるハイパスフィルタ(hHP(z))を選択するハイパスフィルタ設計装置(520)と、を有することを特徴とするデジタルフィルタ設計装置。
請求項9
前記ハイパスフィルタ設計装置は、第2の目標周波数応答(Htotal(ω);HHP(ω))に基づいてハイパスフィルタを選択するように構成されることを特徴とする請求項8に記載のデジタルフィルタ設計装置。
請求項10
前記信号の特定の場合の雑音抑圧のためにハイパスフィルタを選択するか否かを決定する手段を更に有することを特徴とする請求項8又は9記載のデジタルフィルタ設計装置。
請求項11
前記ハイパスフィルタ設計装置及び前記雑音抑圧フィルタ設計装置に接続される残留周波数応答決定装置(600)を更に有し、前記ハイパスフィルタ設計装置は、選択されたハイパスフィルタにより提供される前記目標周波数応答を示すフィルタ応答部分信号(605a)を送出し、前記残留周波数応答決定装置(600)は、前記フィルタ応答部分信号を受信し、前記受信したフィルタ応答部分信号に基づいて残留目標周波数応答を決定し、前記目標周波数応答を示す信号を前記雑音抑圧フィルタ設計装置に伝送することを特徴とする請求項8乃至10のいずれか1項に記載のデジタルフィルタ設計装置。
請求項12
前記ハイパスフィルタ設計装置及び前記雑音抑圧フィルタ設計装置に接続される残留周波数応答決定装置(600)を更に有し、前記雑音抑圧フィルタ設計装置は、選択された雑音抑圧フィルタにより提供される前記目標周波数応答の部分を示すフィルタ応答部分信号(605b)を送出し、前記残留周波数応答決定装置(600)は、前記雑音抑圧フィルタ設計装置から前記フィルタ応答部分信号を受信し、前記受信したフィルタ応答部分信号に基づいて残留目標周波数応答を決定し、前記目標周波数応答を示す信号を前記ハイパスフィルタ設計装置に伝送することを特徴とする請求項8乃至11のいずれか1項に記載のデジタルフィルタ設計装置。
請求項13
請求項8乃至12のいずれか1項に記載の前記デジタルフィルタ設計装置を有するユーザ装置(400)。
請求項14
音響記録を示す信号の雑音抑圧のためのデジタルフィルタ装置であって、前記信号を受信する入力部と、フィルタリングされた信号を出力する出力部と、時間領域において前記受信した信号をフィルタリングする雑音抑圧フィルタと、前記雑音抑圧フィルタとカスケードに配置される適応ハイパスフィルタと、を有することを特徴とするデジタルフィルタ装置。
請求項15
前記デジタルフィルタ装置の目標周波数応答に応じて前記ハイパスフィルタの特性が調整されることを特徴とする請求項14に記載のフィルタ装置。
請求項16
前記ハイパスフィルタの前記周波数応答に応じて前記雑音抑圧フィルタの特性が調整されることを特徴とする請求項14又は15に記載のフィルタ装置。
請求項17
前記ハイパスフィルタは1次バタワースフィルタであることを特徴とする請求項14乃至16のいずれか1項に記載のフィルタ装置。
請求項18
音響記録を示す信号(y(t))の雑音抑圧のためのデジタルフィルタ構成を設計するためのコンピュータプログラムであって、受信した前記信号に基づいて、前記デジタルフィルタ構成の目標周波数応答(Htotal(z, ω))を決定するためのコンピュータプログラムコード部分と、前記フィルタ構成を、ハイパスフィルタ(hHP(z))と雑音抑圧フィルタ(hNS(z))との組合せとして設計するためのコンピュータプログラムコード部分と、を含み、前記ハイパスフィルタと前記雑音抑圧フィルタとの前記組合せは、前記決定された目標周波数応答に基づいて選択されることを特徴とするコンピュータプログラム。
类似技术:
公开号 | 公开日 | 专利标题
US9361901B2|2016-06-07|Integrated speech intelligibility enhancement system and acoustic echo canceller
US9431023B2|2016-08-30|Monaural noise suppression based on computational auditory scene analysis
US8995681B2|2015-03-31|Audio processing apparatus with noise reduction and method of controlling the audio processing apparatus
JP4161628B2|2008-10-08|エコー抑圧方法及び装置
US5432859A|1995-07-11|Noise-reduction system
US8315380B2|2012-11-20|Echo suppression method and apparatus thereof
JP5068653B2|2012-11-07|雑音のある音声信号を処理する方法および該方法を実行する装置
JP3454206B2|2003-10-06|雑音抑圧装置及び雑音抑圧方法
CN1145931C|2004-04-14|降低语音信号中的噪声的方法和采用该方法的系统和电话机
KR101163411B1|2012-07-12|지각 모델을 사용한 스피치 개선
DE69531710T2|2004-07-15|Verfahren und Vorrichtung zur Verminderung von Rauschen bei Sprachsignalen
KR101185820B1|2012-10-02|에코 소거
CN106664473B|2020-02-14|信息处理装置、信息处理方法和程序
RU2121719C1|1998-11-10|Способ и устройство ослабления шума в речевом сигнале
TWI458331B|2014-10-21|Apparatus and method for calculating control information of an echo suppression filter, and apparatus and method for calculating a delay value
JP5718251B2|2015-05-13|分解されたオーディオ信号の再構成のためのシステムおよび方法
KR101141033B1|2012-05-03|스피치 개선을 위한 노이즈 분산 추정기
JP4973873B2|2012-07-11|残響抑圧の方法、装置及び残響抑圧用プログラム
JP6490641B2|2019-03-27|ラウドネスに基づくオーディ信号補償
US6717991B1|2004-04-06|System and method for dual microphone signal noise reduction using spectral subtraction
KR100600313B1|2006-07-14|다중경로 다채널 혼합신호의 주파수 영역 블라인드 분리를 위한 방법 및 그 장치
EP1806739B1|2012-08-15|Noise suppressor
KR101052445B1|2011-07-28|잡음 억압을 위한 방법과 장치, 및 컴퓨터 프로그램
US6549586B2|2003-04-15|System and method for dual microphone signal noise reduction using spectral subtraction
US7620172B2|2009-11-17|Method and system for eliminating noises and echo in voice signals
同族专利:
公开号 | 公开日
WO2009082302A1|2009-07-02|
EP2232704A4|2010-12-01|
CN101904098B|2014-10-22|
EP2232704A1|2010-09-29|
US20110137646A1|2011-06-09|
CN101904098A|2010-12-01|
JP5140162B2|2013-02-06|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
法律状态:
2012-08-13| A131| Notification of reasons for refusal|Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120810 |
2012-10-10| A521| Written amendment|Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121009 |
2012-10-29| TRDD| Decision of grant or rejection written|
2012-11-05| A01| Written decision to grant a patent or to grant a registration (utility model)|Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121102 |
2012-11-08| A01| Written decision to grant a patent or to grant a registration (utility model)|Free format text: JAPANESE INTERMEDIATE CODE: A01 |
2012-11-22| R150| Certificate of patent or registration of utility model|Ref document number: 5140162 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
2012-11-22| A61| First payment of annual fees (during grant procedure)|Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121116 |
2012-11-26| FPAY| Renewal fee payment (event date is renewal date of database)|Free format text: PAYMENT UNTIL: 20151122 Year of fee payment: 3 |
2015-11-17| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2016-11-15| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2017-11-14| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2018-11-13| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2019-11-19| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2020-11-22| LAPS| Cancellation because of no payment of annual fees|
优先权:
申请号 | 申请日 | 专利标题
[返回顶部]