专利摘要:

公开号:WO1981002489A1
申请号:PCT/JP1981/000031
申请日:1981-02-17
公开日:1981-09-03
发明作者:K Umemura;H Sato;K Nakata;T Sampei;K Indo;K Murakami
申请人:Nippon Telegraph & Telephone;Hitachi Ltd;K Umemura;H Sato;K Nakata;T Sampei;K Indo;K Murakami;
IPC主号:G10L19-00
专利说明:
[0001] 明 細 書 .
[0002] 音 声 合 成 装 置
[0003] 技 術 分 野
[0004] 本発明は音声合成装置に関するもので、 詳し くは音声
[0005] 信号の周波数スぺク ト ル包絡をあらわすパラメ ー タ信号
[0006] と, 音声信号の周期をあらわす情報に基ずいて音声を合
[0007] 成する音声合成装置に関するものである。
[0008] 背 景 技 術
[0009] 祙式市場の市況、, 天気予報、, 各種展示会の案内等の情
[0010] 報を音声で提供する情報サー ビス通信網においては、 各
[0011] 種の情報をデジタル信号で伝送し、 これ等通信網の端末
[0012] につながれる端末機において伝送された情報を音声に変' 換して提供できるよ うに音声合成装置を使用することが
[0013] 望まれている。 また学習器, 自動販売機 , 会場案内のた
[0014] めの案内放送装置等発声する音声の単語の数が少ないも
[0015] 'のにおいては、 従来の磁気記録テ―ブに代えて半導体メ
[0016] モ リ一を使用する音声合成装置が使用されつつある。
[0017] 音声信号をデジタル信号に変換して記憶させ、 記憶さ
[0018] れたデジタル信号を組合せて音声を合成するデジタ ル音
[0019] 声合成装置は、 連続する音声信号を一定時間間隔 とに
[0020] 切り出し、 切り出した音声波形からこの ½声の特徵パラ
[0021] メ ータを抽出し、 これをデジタル信号に変換して記憶さ
[0022] せ、 音声を合成する場合には記億された音声の特徵パラ
[0023] メ ータを組合せて合成するものであって、 合成音の音声
[0024] 単位を単語以下の単音節にすることができるので記憶装
[0025] .: I
[0026] -vi--o 置の記憶容量を増加させることなく多くの語を合成する ことができる。 また機械的に可動する部分を持たないた め摩耗等による故障が発生せず、 維持管理が容易になる。
[0027] 従つて音声合成装置としては音声の特徵パラメ 一タに 基ずいて音声を合成する方法を使用することが維持管理 、を容易にし、 記憶装置を小容量にすることができるので 好ましい。
[0028] 音声のスぺク ト ル分布の変化は人間の舌や唇などの調 音器管の運動に基ずく ものであるため、 その変化は緩や かであり、 10〜 5 τ^ の短時間区間に着目するとほぼ定 常的と見なすことができる。 そこでこの定常区間から音 声のスぺク トルの特徵を正確に抽出することによ り音声 の分析することができ、 また抽出した情報に基ずいて音 声を合成することができる。 音'声を分析し合成する場合、 音声のスぺク トル分布の変化が定常的と見なすことがで -き る短時間区間の音声スぺク トルカ ら、 このスぺク トル の包絡を表わすパ ラ メ ータ と-, 音声信号の提幅を表わす パラメ ータ , 声帯の基本振動周波数に相当するピッチ情 報及び有声音か無声音かを判別する判別情報を抽出すれ ばよい。 、
[0029] 音声信号から上述の特徵パ ラ メ ータを抽出し、 これに 基ずいて音声を合成する音声分析合成方式の 1 つとして、 線形予測係数の一種である偏自己相関係数(: Partial AIL to -Corre ation Coefザ icients 後 P A R C 0 R 数と称す) を用いる 型の分析合成方法がある。 この装置は音声信号の特徵パラメ ータ を 係
[0030] 数で表わすもので、 音声信号の周波数スぺク ト ルの変化
[0031] が緩やかで定常的と見られる短時間区間の音声信号を例
[0032] えば ^の標本化周期で標本化し、 時系列に表われる.:
[0033] 標本値のう ち接近する 2時点の標本値をこの 2時点の間
[0034] に存在する標本値を用いて最小 2乗予測し、 予測した値
[0035] と実際の 2時点の標本値とをそれぞれ比較してその差を
[0036] 求め、 それぞれの差の値の相関( P C O Ji係数 ) を求
[0037] めるものである。 そして音声合成装置では白色雑音及び
[0038] パルスを発生する信号発生器を音源となし、 この音源の
[0039] 出力信号の振幅を前述の C O A係数で制御して出力
[0040] 信号に相関を与え、 周波数スぺク ト ル包絡を再現して音
[0041] 声を合成するものである。
[0042] この 型の音声分析合成方法は、 音声を分析
[0043] して得られる P i C O 係数, ピッチ情報 , 振幅情報及
[0044] -び有声, 無声の判別情報を全て 2進数で表わすデジタル
[0045] 信号で取扱う ことができ、 これ等の情報は半導体メ モリ —に記憶させることができる。 また 2進数で表わされた
[0046] 情報を電話回線を利用して伝送することもできる。
[0047] 音声を分析して音声の特徵パラメ ータを抽出する場合、 上述のよ うに音声を短時間間隔に区切つ' ' 分析を行な う。
[0048] この短時間区間は一般に分析フ レ ームあるいは単にフ レ ーム と呼ばれ、 この 1 フ レームから C 0 _R係数, ピ
[0049] ツチ情報 , 振幅情報及び有声無声の判別情報が抽出され
[0050] る。 そして 1 フ レーム当 りの情報は例えば 96ビッ 卜の情
[0051] G, r. l 報量で転送される。 この情報量は 1 フ レームの時間を 20 ms ec とすると 4 δΟΟビッ ト 秒の情報量となり、 1 フ レ
[0052] 一ムの時間を 10TOj ec とすると 9000 ビッ ト Z秒の情報量
[0053] となる。
[0054] 音声を分析して得た音声パラメ ータに基ずいて音声を
[0055] 合成する音声合成装置は、 合成する際に用いられる情報
[0056] 量によって合成音声の質が決定される。 例えば音声分析
[0057] によつ て得られた音声パラメ ータを 4800 ビッ ト /秒の情
[0058] 報量で伝送する場合と、 9000 ビッ ト Z秒の情報量で伝送
[0059] する場合とでは、 明らかに 90D0 ビッ ト Z秒の情報量で伝
[0060] 送する方が音質は良い。 しかし、 たとえばディ ジタル電
[0061] 話などでは、 回線が比敦的空いている場合は音質の良い
[0062] 9600 ビッ ト Z秒でも、 回線が混んでくる 'と音質を多少犠
[0063] 牲にしてでも 4800 ビッ ト/秒を使う方が回線の利用効率
[0064] が上がる。 また音声情報を半導体メ モ リ等の記憶装置に
[0065] 記憶-させる場合には、 音質を優先するか、 記憶容量を優
[0066] 先するかによつ て使用する情報量が違つ て く.る。
[0067] 従来の音声合成装置は処理できる単位時間当 りの情報
[0068] 量が固定されており、 異なった情報量で表わされた音声
[0069] 情報を処理することができない。 例えば 9600 ビッ ト /秒
[0070] の情報量を扱う音声合成装置では 4800 ッ、、ト Z秒の情報
[0071] 量で表わされる音声情報を処理することができない。 従
[0072] つて電話回線の混み具合によつて伝送する情報量を変え
[0073] るという ことができず、 また記憶装置を用いる場合も音
[0074] 質を優先するか、 音声の容量を優先するか応用先に応じ
[0075] 0]·.' Ι
[0076] . '·,'·,';:-〇 " て音声合成装置を選択しなければならなかった。
[0077] 本発明の目的は単位時間当りの情報量が異なる複数の 方式の音声パラメ ータに基ずいて音声を合成することが できる音声合成装置を得るものである。
[0078] 発 明 の 開 示
[0079] 本発明は、 自然音声よ り一定時間間隔ごとに波形を切 り出し、 切り出されたそれぞれの波形から抽出された
[0080] 個の偏自己相関係数をもとに一定時間間隔でフィルタ を 変化させて音声を合成し出力する音声合成装置において、 1 時間間隔内に配分される 個の偏自己相関係数を含む 音声パラ メ ータの量子化ビッ トを変えずに、 偏自己相関 係数を抽出する際の波形の切り 出し間隔と合成の際の合 成間隔を同時に可変することによつて単位時間あたりの 合成のために使用する情報量を可変し、 単位時間当り-の 情報量が異なる複数の方式の音声パラメ—タに基ずいて、
[0081] -..それぞれの音声を合成できるよ うにしたものである。
[0082] '図面の簡単な説明
[0083] 第 1 図は本発明の音声合成装置の一実施例を示すブ口 ック図、
[0084] 第 2 図は音声パラ メ ータ の入力タイ ミ ングを示すタイ ム線図、
[0085] 第 5図は本発明の音声合成装置の入力同期信号を発生 するカ ウ ンタの一実施例を示すプロ ック図である。
[0086] 発明を実施するための最良の形態
[0087] 第 1 図は本発明の音声合成装置の一実施例を示すブロ
[0088] 0:: 1 ック図で、 1 は音声パラメ 一タが記憶される記憶装置、
[0089] 2は記憶装置 1 から出力すべき音声パラメ ータのァ' ド レ
[0090] スを指定し、 音声合成の開始及び終了、 音声パラメ 一タ
[0091] の転送レー トの指定等を行なう制御装置である。 記憶装
[0092] 置 1 は例えば半導体メ モ リ で構成され、 これに記憶され
[0093] る音声パラメ ータは音声の振幅を表わす振幅情報、 声帯 の基本振動周波数に相当するピッチ情報、 10個の偏自己
[0094] 相関係数が記憶される。'記憶装置 1 に記憶される情報は
[0095] 1 フ レーム当り振幅情報 7 .ビッ ト、 ピッチ情報 7 ビッ ト、
[0096] 10個の偏自己相関係数が 82ビッ ト合計 90ビッ トの情報量
[0097] で記億されている。 制御装置 2は例えばマイ ク ロ コ ン ビ
[0098] ュ —タで構成され、 '會己憶装置 1 に記億されている音声パ
[0099] ラメータを記憶装置 1 から順次出力させるために、 出力
[0100] ' すべき音声パラメ ータのア ド レ ス指定、 音声合成の開始
[0101] 及び終了等の制御信号を出力し、 この制御信号は記憶装
[0102] 量 1 供給される。 記憶装置 1 は制御装置 2の制御信号
[0103] に従つ て記憶された音声パラメ ータを振幅 , ピッ チ , 偏
[0104] 自己相関係数の順にシ リ アルに読み出し、 これをイ ンタ
[0105] フユ ー ス論理部 5 へ供給する。 イ ンタフユ ース論理部 3
[0106] は制御装置 2から出力される制御指令信号を受信し、 こ
[0107] の制洶指令信号に従つて記憶装置 1 か <洪裣される音声
[0108] パラメ 一タから振幅情報, ピツチ情報, 偏自己相関係数
[0109] を分 ¾ し、 ピ ッチ情報から有声音か無声音かを判別して
[0110] 有声音の場合にはパルス発生器を駆動し、 無声音の場合
[0111] には籍音発生器を駆動する。 そしてさらに有声音の場合
[0112] 0:'/ΓΡΙ一 にはピッチ惰報に基ずいてパルス発生器のパルス の周期 を変える。 イ ンタ フ ース論理部 3はさらに振幅情報に 基ずいてパルス発生器あるいは雑音発生器の出力信号の 振幅を制御し、 これを音源信号として偏自己相関係数と 共にデジタルフィルタ 4 に供給する。 デジタルフ ィ ルタ 4 は 1 0段の格子型フィルタで構成され、 1 個の格子型フ ィ ル タは 2個の乗算器と , 1 個の減算器, 1個の加算器, 1 個の遅延回路及び 1 個の損失回路を備えている。 そし てイ ンタフ- ース論理部 3から供給された "1 0個の倡自己 相関係、数はデジタルフィ ルタ 4の 1 0段の格子型フィ ルタ にそれぞれ供給され、 デジタルフィルタ 4 で音源信号と 偏自己相関係数が乗算され、 デジタル音声符号が合成さ れる.。 デジタルフィルタ 4 で合成されたデジタル音声持 号はデジタルアナログ変換器 5に供給され、 デジタルァ ナログ変換器 5でデジタル音声符号はアナ口グ信号に変 -換される。 そしてこのアナログ信号はスピーカ όに供給 されて再生される。
[0113] 記憶装置 1 に記憶される音声パ 7 メ ータは 1 フ レーム 当り 90ビッ ト で構成され、 1 フ レームの時間は 2 Om e c に選ばれている。 従って. 1 秒間の音声を合成する場合、 イ ンタ フユ 一ス論理部 3 は 480 0 ビッ トの情燕を転送する。 合成音の質を向上させるためには単位時間当りの情報量 を多くすればよ く、 1 フ レーム当りの情報量 96ビッ トは 変えずに 1 フ レームの時間を 1 O TTi e c に選ぶと、 1 秒当 り 90 00 ビッ トの情報量となり合成音の質を向上させるこ とができる。 即ち 1 フ レーム当りのビッ ト数を変えずに フ レーム周期を変えるだけで、 単位時間当 りの音声パラ メ一タの転送量を変えることができる。
[0114] 第 2図は第 1 図に示す音声合成装置の音声パラメ —タ の入力タ イ ミ ングを示すタ イ ムチ ャー トであり、 第 2図 は 1 フ レームを J ec とした場合、 第 2図 J5は 1 フ レームを l OTO ec とした場合である。 いずれも 1 フ レー ム当りの情報量は%ビッ ト であるが、 第 2図 Sに示すよ' うにフ レ ーム周期を にすると 1 秒間に転送する情報 量は 2倍となる。 従って電話回線の混雑の度合、 必要と する合成音の質に応じて音声分析, 音声合成の 1 フ レー ムの時間を 20τπ·$· β にする力、、 10ms ec にする力 還折す ればよい。 また音声合成装置も入力または記憶された音 声パラメ 一タ の フ レーム周期に合せて音声パラメ ータの 取り込み周期が切換えられるよ うにすれば、 9<500ビッ ト 秒-の情報量と '4800 ビッ ト Z秒の情報量を切換えに処理 することができる。
[0115] 記憶装置 1 には 1 フ レーム当り 90 ビッ ト で 1 フ レーム の時間力 2OTO 0c の場合の音声パラメ 一タ と、 1 フ レ ー ム当り 90 ビッ トで 1 フ レ ームの時間が 1 Q s e c の場合の 音声パラメ—タがそれぞれ一緒に記憶さ か、 あるい はいずれか一方の音声パラメ 一タが選択されて記憶され ている。 また電話回籙等を通して他から音声パラメ ータ が耘送されて釆る場合には、 記憶装置 1 にはその時時に 使 ¾される転送量、 即ち 4800 ビッ ト Z秒あるいは 9000 ビッ トノ秒の情報量で表わされた音声パラメ —タが記憶
[0116] される。
[0117] イ ン タ フニ ース論理部 3は記憶装置 1 から供給される
[0118] 音声パラメータの単位時間当りの転送量に応じて、 情報
[0119] を取り込むタィ ミ ングを変えなければならない。 イ ン タ
[0120] フユ ース論理部 5は記憶装置 1 から音声パラメ 一タを1.2
[0121] ms e c で取り込み、 この取り込み動作は第 2図に示すタ
[0122] ィ ムチ ヤ 一トにお、、て 1 フ レームの最後の 2.5OTJ e c の時
[0123] 間のう ちに次のフ レームの音声パラメ 一タを取り込む。
[0124] 従っ て 1 OTO e c ある、、 2 O7n e c ごとに音声 'ラメ 一タ
[0125] を取り込むための同期信号を発生する必要がある。 カウ
[0126] ンタ部 17は、 このイ ンタ フ - ース論理部 5 が情報を取り
[0127] 込むために必要 入力タイ ミ ング信号を発生しており、
[0128] その入カタィ ミ ング信号は力 ゥンタ部 "17の出力端子 "10か
[0129] らイ ン タ フエ ース論理部 5 に供給されている。 カ ウ ンタ
[0130] --.部 17の出力信号である入力タイ ミ ング信号の周期はスィ
[0131] ツチ部12で切換えられ、 音声パラ メ 一タの単位時間当り
[0132] の耘送量の違に応じて変化させられる。 スィ ッ チ部12
[0133] 切換スィ ツチ 20を備え、 その可動接点21はカウ ン タ部17
[0134] に接読され、 2個の固定接点2223のう ち一方の固定接
[0135] 点22は外部の電源 eeに接銃され、 他方、の, 定接点 25は
[0136] カウ ンタ部 7に接続されている。 そして可動接点 2"!を一
[0137] 方の固定接点22に接続するとカウ ンタ部17からは 10"weC ごとに入力タイ ミ ング信号が出力され、 900Q ビッ 卜 Z秒
[0138] の情報量に対処する。 また可動接点21を他方の固定接点 ο:.ί ι . 25に接続するとカウンタ部 17からは 2 o J e c ごとに入力 タィ ミ ング信号が出力され 4S00 ビッ ト Z秒の情報量に対 処する。
[0139] このよ うに音声パラ メ ータのビッ ト配分は全く変化な く、 フ レーム周期を変えることだけで音声パラ メ ータの' 転送量が切換えられたことになる。 音声パラメ 一タが入 力された後の動作は音声パラメ 一タの値とは独立に、 常 に音声合成動作を行なっており、 音声パラ メ ータが入力 されると、 ディ ジタルフ ィ ルタ 4 の入力が新しい値とな り、 次々 とディ ジタル音声符号を合成していく。 ディ ジ タル音声符号はディ ジタルアナ口グ変換器 5によ りアナ ログ音声信号に変換される。 このアナログ信号でスピ一 力を駆動し、 合成音声が出力される。 .
[0140] 第 5図は本発明の音声合成装置の力ゥンタ部の一実施 例を示すブロ ック図である。 第 3図において 7は 8段構
[0141] '- -成の-第 1 のバイ ナ リ カウ ンタで例えば 8個のフ リ ッ ブフ
[0142] 口 ッブ回路で構成されている。 第 1 のフ リ ップフロ ップ 回路 71の一方の出力端子 はいずれにも接続されず、 他 ' 方の出力端子 Qは第 2のフ リ ップフロ ップ回路 72の入力 端子 に接続され、 さらに第 1 の N D回路 9 と第 2の
[0143] V >回路 の入力端子に接続されてい ¾ また第 2 の フ リ ッ プフ ロ ッ プ回路72も同様にその他方の出力端子 Q 力' 第 3 の フ リ ッブフロ ップ回路ァ5の入力端子/ πに接続 され、 さらに第 1 及び第 2 の N Ζ)回路 9 , 1 0のそれぞ れの入力端子に接続されている。 第 3のフ リ ップフ ロ ッ
[0144] OMPI ブ回路 75及び第 5 のフ リ ッブフ ロ ッブ回路 75も同様な接 続がなされている。 第 4のフ リ ップフロ ッブ回路74はそ の一方の出力端子 Qが第 1 の 回路 9の入力端子に 接続され、 他方の出力端子 が第 2 の N 回路 10の入 力端子に接続されている。 第 ό のフ リ ッ ブフ 口 ッブ回路 70の一方の出力端子 Qは第 2 の A N D回路 10の入力端子 に接続され、 他方の出力端子 Qは第 1 の N i)回路 9 の 入力端子に接続されている。 また第 7のフ リ ップフロ ッ ブ回路 の一方の出力端子 Qは第 1 及び第 2の 回 路 9 , "10のそれぞれの入力端子に接続され、 さらに第 δ のフ リ ップフロ ッブ回路ァ8の一方の出力端子 Qは第 1 の ^ V i)回路の入力端子に接続され、 他方の出力端子 は 第.2 の 回路 0の入力端牛に接続されている。 第 1 の iV )回路 9の出力端子は第 1 から第 8のフ リ ップフ α ッブ回路 71— 78のそれぞれのリセ ッ ト端子 に接続さ れている。 また第 1 のフ リ ッブフ口 ップ回路71の入力端 子 は第 1 のク α ックパルス発生器 8に接続されている c
[0145] 11は 3段構成の第 2のバイナ リカウンタで 5個のフ リ ッブフロ ッブ回路 111一 "M5で構成され、 第 1 段目のフ リ ップフロ ッブ回路 111 の入力端子 は^ f iV D回路 9、の出 力端子に接銃され、 一方の出力端子 Qは'、第 の V 回 路 15の入力铠子に接続され、 他方の出力端子 は第 2段 目のフ リ ップフ ロ ップ回路 1 2の入力端子に接続されて いる。 また第 2段目のフ リ ッ プフ ロ ッ プ回路 "2 も同様 にその一方の出力端子 Qが第 5 の A N D回路の入力端子 に接続され、 他方の出力端子 は第 5段目のフ リ ップフ ロ ッブ回路 113 の人力端子/ に接続されている。 第 5段 目のフ リ ッブフ口 ジ ブ回路 113の一方の出力端子 Qは切 換スィ ツチ 20の他方の固定接点 25に接続さ 'れている。 第
[0146] 1 の A Ν Ζ>回路 9の出力端子はさらに S フ リ ッブフ口 ッ プ回路 のセッ ト入力端子 5に接続され、 フ リ ツ ブフ σ ッブ回路 15のリセッ ト入力端子 は第 2の N D回路
[0147] 10の出力端子に接続されている。 フ リ ップフロ ップ回路
[0148] 15の出力端 ίは第 5の V D回路15の入力端子に接続さ れ、 第 3の ^ N 回路15の他の入力端子はィンタ フ - 一
[0149] ス論理部 3の内部に設けられた第 2のクロ ックパルス発
[0150] 生器 4に接続され、 またフ リ ップフロ ッブ回路15の出力 端子は出力端子 1όに接続されている。
[0151] このような回路において、 まず音声パラメ ータの転送
[0152] 量が 4S00 ビッ ト/秒の場合について説明する。 この場合
[0153] にはスイ ッチ 20の可動接点 21は他方の固定接点 23に接続 されている。 そして第 1 のカウンタ 7はク ロ ックパルス 発生器 8のク ロ ックパルスを順次力ゥン ト し、 200個の ク 口 ックパルスをカウ ン トすると i)回路 9 の入力端 ' 子に接続されている 8個のフ リ ッブフ口 ッブ回路 71— 78 の出力端子は全てハイ レベルとなっ て 1 ^力する。 こ の結杲 »回路 9の出力はハイ レベルとなっ て 1 を出- 力しカウ ンタ 7をリ セ ッ 卜する。 即ち N 回路 9は力
[0154] ゥンタ 7 力 ノ、 'ノレス発生器 8 のク ロ ック パノレスを 200個力 ゥ ン トするごとに 1 出力を出す。 これは時間間隔にして
[0155] ΟΜ Ι_ 2.5 mi ec ごとに ^ N )回路 9から 1 出力が出力されるこ
[0156] とになる。 第 2のカウ ンタ Mは N »回路 9の出力を力
[0157] ゥ ン ト し、 N D回路 9 の出力を 8個カ ウ ン トすると 5
[0158] 個のフ リ ッブフ口 ッブ 111一 U 5の Q出力端子はハイ レベ ルとなって 1 を出力する。 即ち 2.5 7^ ec ごとに出力され
[0159] る N D回路 9 の出力を 8個カウ ン ト して 20r^ec にな
[0160] ると第 5 の 回路にハイ レベルの信号を供給する。
[0161] ま†:R S フ リ ッ ブフ 口 ッ ブ回路 のセッ ト入力端子には
[0162] D回路 9 の出力信号が供給されており、 フ リ ツ ブフ
[0163] ロ ッブ回路15は 回路 9 の出力信号でセ ッ ト状態と
[0164] なり、 その出力端子はハイ レベルとなって 1 の出力信号
[0165] を出力する。 また第 5の V D回路15の入力端子にはク
[0166] 口 ックパノレス発生器 14のクロ ック パルスが供給されてい
[0167] る。 従って第 3の ^ 回路 15の 5個の入力端子が全て
[0168] ハイ レベルになる時点は力 ゥンタ 11の第 5段目のフ リ ッ
[0169] ブフロ ッブ回路 113の出力端子 Qがハイ レベルとなつた
[0170] 時、 即ちカ ウンタ部 17が動作を開始してから 20 ^e e 後
[0171] となる。 カ ウンタ 11 の 5 個のフ リ ッ ブフ ロ ッ ブ 111— 115
[0172] は 8個のパルスをカ ウン トすると リセ ッ トきれて再び 1
[0173] 力 らパルスをカ ウ ン トするため、 第 5の V D回路の全
[0174] ての入力端子がハイ レベルとなるのは 2 a7 e c ごと とな
[0175] り、 この時 N D回路 "15出力端子 10からハイ レベル即ち
[0176] 1 の出力が出力される。 出力端子 1<Sに現われた信号は第
[0177] 1 図のイ ン タ フ - —ス論理部 3 に供給され、 イ ン タ フ ユ —ス論理部 3は出力端子 1όに 1 出力が現われている期間
[0178] 〇M I <:',, ' に記憶装置 1 から音声パラメ一タを取り込む。
[0179] 第 2 の A N D回路 10の全ての入力端子は、 第 1 のカウ
[0180] ン タ 7力 ノ ノレス勞生器 8のク 口 ッ ク ノ ノレスを 9ό個カウ ン
[0181] ト した時、 即ちカ ウンタ 7がカウ ン トを開始してから1 -2
[0182] msec 経過した時にハイ レベルとなり、 その出力端子に
[0183] 1 の信号を出力する。 そして v i)回路 10のハイ レベル
[0184] の出力は S フ リ ップフ 口ッブ回路 13のリセッ ト入力端
[0185] 子 に供給されフ リ ッブフ口 ップ回路15をリセ ッ ト状態
[0186] にする。 従つ てフ リ ップフ 口 ッブ回路 15は N X»回路 9
[0187] の出力でセ ッ ト状態になつてから 1.2mj e c 経過後にリ セ
[0188] ッ ト状態になり、 その出力は口 一 レベルの 0出力となる, これによ り ^ V 回路 15の出力は 0 となり、 イ ンタフ- • —ス論理部 5の情報取り込み動作は終了する。 従っ てィ
[0189] ンタ フユ 一ス論理部 5 A N D回路 15の出力がハイ レべ
[0190] ソレとなって 、る 1.2 1 β e の期曰 3に のノ ソレス信号
[0191] -を 9ό-個取り込み、 これを音声パラメ ータを取り込む同期
[0192] 信号とする。
[0193] 次に音声パラメ 一タの'転送量が 9600 ビッ ト Z秒の場合
[0194] について説明する。 この場合には切換スィ ッ チ 20の可動
[0195] 接点21は一方の固定接点 22に接続される。 固定接点22
[0196] ヽ、
[0197] は電源よ り正電圧が供給されており、 こ )電圧はスイ ツ
[0198] チ 20を通して _D回路15の入力端子に供給される。 従 つ て A N D回路 15の全ての入力端子がハイ レベル となる
[0199] 時は力ゥ ンタ 11の第 1 及び第 2のフ リ ッブフ口 ッブ 111 ,
[0200] 112 の出力端子 Qがそれぞれハイ レベルとなって 1 信号
[0201] VII〇 が出力された時となる。 即ち 回路 9の出力信号を
[0202] 2. m s e c おきに数えて第 4番目 と第 8番目の期間に Λ
[0203] D回路 15の出力端子 に 1 の信号が出力される。 出力端
[0204] 子 1 όがハイ レベルになる時間間隔は 1 0 e e となり、 ィ
[0205] ン タ フ ユ 一ス論理部 S は 1 Q m s e c間隔で 1 フ レ ーム当り
[0206] 96 ビッ ト の音声パラメ ータを取り込む。
[0207] このよ う に 1 フ レーム分の音声パラメ ータを 90 ビッ ト
[0208] にし、 1 フ レームを 20 ミ リ秒とすると 1 秒間の音声を合
[0209] 成するための音声パラメ 一タの転 量は 4800 ビッ ト/秒
[0210] であるが、 この "I フ レームの周期を の 10 ミ リ秒に切
[0211] 換えると 1 フ レームの情報量は同じ 90ビッ ト であつても、
[0212] 1秒間に 9600 ビッ トの音声パラメ 一タを転送することが
[0213] できる。 即ち音声パラメ —タのビッ ト配分は'全く変化な
[0214] く、 フ レーム周期を変えることだけで音声パラメ ー タ の
[0215] 転送量を切換えることができる。
[0216] - 産業上の利用可能性
[0217] 本発明の音声合成装置は電話回線を利用して天気予報
[0218] 等の情報を連続して音声で提供する案内装置、 学習問題
[0219] を音声で出題する学習器等に利用できる。
[0220] c- · Ι ,
权利要求:
Claims
請 求 の 範 囲
自然音声よ り一定時間間隔ごとに波形を切り出し、 切り出されたそれぞれの波形から抽出された 個の偏 自己相関係数をもとに一定時間間隔でフィルタを変化 させて音声を合成し出力する音声合成装置において、 個の偏自己相関係数を含む音声パラメ ータの量子化 ビッ ト配分を変えずに、 偏自己相関係数を抽出する際 の波形の切り出し間隔と合成の際の間隔を同時に可変 することに'よつて単位時間あたりの合成のために使用 する情報量を可変することを特徵とする音声合成装置, 前記合成の時間間隔と音声パラメ ータを取り込む時 間間隔を独立に指定する力ゥ ン タを傭えたことを特徵 とする特許請求の範囲第 1項に記載された音声'合成装
类似技术:
公开号 | 公开日 | 专利标题
US8005555B2|2011-08-23|Audio signal processing apparatus
US7119268B2|2006-10-10|Portable telephony apparatus with music tone generator
US6678652B2|2004-01-13|Audio signal processing apparatus
US4624012A|1986-11-18|Method and apparatus for converting voice characteristics of synthesized speech
US5809472A|1998-09-15|Digital audio data transmission system based on the information content of an audio signal
CN100349228C|2007-11-14|在存储媒体上记录或者重放的方法和装置
US4020282A|1977-04-26|High density data processing system
US6349277B1|2002-02-19|Method and system for analyzing voices
CA1127765A|1982-07-13|Speech analyzer comprising circuits forcalculating autocorrelation coefficientsforwardly and backwardly
US4916996A|1990-04-17|Musical tone generating apparatus with reduced data storage requirements
US4720861A|1988-01-19|Digital speech coding circuit
Atal1983|Efficient coding of LPC parameters by temporal decomposition
KR100564057B1|2007-03-21|엔코딩시스템및방법,디코딩시스템및방법,엔코딩데이타기록장치및방법과,엔코딩데이타전송장치및방법
KR100472904B1|2005-03-08|음악 부분을 자동으로 선별해 저장하는 디지털 음악 재생장치 및 그 방법
CA1138580A|1982-12-28|Digital intercept recorder/announcer system
US4473904A|1984-09-25|Speech information transmission method and system
US4121058A|1978-10-17|Voice processor
US5245667A|1993-09-14|Method and structure for synchronizing multiple, independently generated digital audio signals
US4809271A|1989-02-28|Voice and data multiplexer system
CA1181857A|1985-01-29|Silence editing speech processor
US5915237A|1999-06-22|Representing speech using MIDI
US6839446B2|2005-01-04|Hearing aid with sound replay capability
EP0205200A1|1986-12-17|Verfahren zur Übertragung von Audio-Information und Zusatzinformation in digitaler Form
US6734351B2|2004-05-11|Apparatus and method for sampling and storing audio information and apparatus for outputting audio information
CA1295421C|1992-02-04|Amplitude enhanced sampled clipped speech encoder and decoder
同族专利:
公开号 | 公开日
EP0045813A1|1982-02-17|
JPS5913758B2|1984-03-31|
EP0045813B1|1985-07-03|
JPS56117294A|1981-09-14|
EP0045813A4|1982-07-13|
US4491958A|1985-01-01|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
法律状态:
1981-09-03| AK| Designated states|Designated state(s): US |
1981-09-03| AL| Designated countries for regional patents|Designated state(s): DE FR GB NL |
1981-09-17| WWE| Wipo information: entry into national phase|Ref document number: 1981900494 Country of ref document: EP |
1982-02-17| WWP| Wipo information: published in national office|Ref document number: 1981900494 Country of ref document: EP |
1985-07-03| WWG| Wipo information: grant in national office|Ref document number: 1981900494 Country of ref document: EP |
优先权:
申请号 | 申请日 | 专利标题
JP80/20597||1980-02-22||
JP2059780A|JPS5913758B2|1980-02-22|1980-02-22||DE8181900494T| DE3171171D1|1980-02-22|1981-02-17|Speech synthesis unit|
[返回顶部]