专利摘要:

公开号:WO1989011759A1
申请号:PCT/EP1989/000568
申请日:1989-05-24
公开日:1989-11-30
发明作者:Gerhard Dickopp;Detlef Krahé;Thomas Vaupel
申请人:Telefunken Fernseh Und Rundfunk Gmbh;
IPC主号:H04B1-00
专利说明:
[0001] Verfahren zur Übertragung eines Audiosignals
[0002] Bei der Übertragung eines Audiosignals, z.B. bei der Rund¬ funkübertragung, Kabelübertragung, Satellitenübertragung und bei Aufzeichnungsgeräten ist es bekannt, das analoge Audiosi¬ gnal in ein digitales Audiosignal mit einer bestimmten Auflö¬ sung umzuwandeln, in dieser Form zu übertragen und bei der Wiedergabe wieder in ein analoges Signal umzusetzen. Durch die digitale Übertragung wird insbesondere bei der Wiederga¬ be ein größerer Störabstand erreicht.
[0003] Die für die Übertragung eines solchen Signals erforderliche Bandbreite ist im wesentlichen bestimmt durch die Zahl der zu übertragenden Abtastwerte pro Zeiteinheit sowie durch die Auflösung.
[0004] In der Praxis besteht die Forderung, die für die Übertragung notwendige Bandbreite möglichst klein zu halten, um mit ei¬ nem schmalbandigen Kanal auszukommen oder über einen vorhan¬ denen Kanal möglichst viele Audiosignale gleichzeitig über¬ tragen zu können. Die erforderliche Bandbreite läßt sich an sich verringern durch eine Reduzierung der Abtastwerte oder der Anzahl der Bits pro Abtastwert.
[0005] Diese Maßnahme hat aber in der Regel eine Verschlechterung bei der Wiedergabe zur Folge. Bei einem bekannten Verfahren (DE OS 35 06 912.0) wird zur Verbesserung der Wiedergabequa¬ lität das digitale Audiosignal in zeitlich aufeinanderfolgen¬ den Abschnitten in ein Kurzzeitspektrum transformiert, wel¬ ches jeweils für die Zeitabschnitte, z.B. 20 ms, die Spek¬ tralkomponenten des Signals darstellt. In dem Kurzzeitsprekt- rum lassen sich auf Grund psyocho-akιif.tischer Gesetzmäßigkei¬ ten im allgemeinen Komponenten, die vom Hörer nicht wahrge¬ nommen werden, also im nachrichtentechnischen Sinn irrele¬ vant sind, besser auffinden, als im Zeitbereich. Diese Kompo¬ nenten werden bei der Übertragung wenn ger gewichtet oder ganz weggelassen. Durch diese Maßnahme kann bei der Übertra¬ gung ein beträchtlicher Teil der sonst notwendigen Daten ent¬ fallen, so daß die mittlere Bitrat-= beträchtlich verringert werden kann.
[0006] Es hat sich gezeigt, daß bei Amplitudenschwankungen inner¬ halb eines solchen Abschnittes, insbe.sondere bei erst im Ver¬ laufe eines Blocks aus der Ruhe einsetzenden Signalen, nach der Übertragung diese Signale mit Störungen überlagert wer¬ den. Die Ursache für die Wahrnehmbarkeit liegt darin darin, daß die Störungen auch vor dem Einsetzen der Signale auftre¬ ten und damit ungenügend verdeckt werden.
[0007] Diese Störungen können z.B. durch Quantisierungsrauschen ent¬ stehen, das sich dem Kurzzeitspektrum überlagert und bei dem nach dem Rücktransformation auch Rauschanteile innerhalb des gesamten Blocks im Zeitbereich auftreten. Zur. Verringerung dieser Störungen wird jeder Block in Unter- blö fce aufgeteilt und die Amplitudensprünge der Signale von einem Unterblock zu einem benachbarten Unterblock detekti- ert. Bei Amplitudensprüngen von mehr als 20 dB werden die Signale im vorangegangenen Block komprimiert und nach der Rücktransformation expandiert.
[0008] Hierbei können folgende Schwierigkeiten auftretenr a) Die Erkennung realer Sprünge ist unsicher. bj) Als Sprünge werden nur solche Energieänderungen in vorher bestimmten Unterblöcken bewertet, die ein bestimmtes Maß überschreite . c;) Es- kann aufgrund von Unsicherheiten in der vorgenommenen Eήergiedetektion zu unbeabsichtigten Signalüberhöhungen im angehobenen Signalabschnitt kommen.
[0009] Der Erfindung liegt die Aufgabe zugrtinde, das eingangs ge¬ nannte Verfahren dahingehend zu verbessern, daß bei Signal¬ veränderungen innerhalb eines Blockes, wie sie in ihrer Viel¬ falt bei natürlichen Audiosignalen üblich sind, der Störab¬ stand nach der Übertragung verbessert wird.
[0010] Diese Aufgabe wird durch die Merkmale des Anspruchs 1 ge¬ löst.
[0011] Im Prinzip werden in jedem Unterblock der Blöcke, auf die das Audiosignal durch das Zeitfenster aufgeteilt wird, eine Signalkompression vorgenommen. Diese wird nicht mehr davon abhängig gemacht, daß reale Sprünge der Schwellwerte über¬ schritten werden. Dadurch lassen sich die Auswirkungen und Störungen während der nachfolgenden Signalverarbeitung, gleich welchen Ursprungs sie sind, vermindern. Durch komple¬ mentäre Expansion der Signale in den Blöcken nach der Über¬ tragung werden die ursprünglichen Signalverhältnisse wieder¬ hergestellt, wobei der Störabstand σ^σenüber schwachen Signa¬ len verbessert wird.
[0012] Nachfolgend wird die Erfindung an Hand der Zeichnung erläu¬ tert. Darin zeigen: Fig. 1 den zeitlichen Ablauf des erfindungsgemäßen
[0013] Verfahrens, Fig. 2 eine Fensterung des Signals zur Erzielung der aufeinanderfolgenden Blöcke, Fig. 3a-d die Darstellung eines im Verlaufe eines
[0014] Blocks einsetzenden Signal s im Original sowie nach der Rücktransformation, Fig. 4 die Aufteilung in Unterblöcke, Fig. 5 eine Fensterfunktion, mit der die Blöcke überlagert werden, Fig. 6 den Energieverlauf innerhalb eines Blockes mit und ohne Kompression,
[0015] Fig. 7 eine Darstellung des nicht angehobenen und des angehobenen Signals bei einem Signalsprung bei nicht überlappenden Fenstern zur Energieberech¬ nung der Unterblöcke,
[0016] Fig. 8 eine Darstellung ähnlich Fig. 7, jedoch mit 50% überlappenden Fenstern zur Energieberechnung der Unterblöcke,
[0017] Fig. 9-11 Blockschaltbilder zur Durchführung einer Signalkompression oder -expansion,
[0018] Fig. 12 eine Übertragungsfunktion eines adaptiven Filters
[0019] Fig. 13 ein Blockschaltbild mit Verfahrensschritten für die Senderseite,
[0020] Fig. 14 ein Blockschaltbild mit Verfahrensschritten für die Empfängerseite,
[0021] Fig. 15 eine grafische Darstellung der Anhebungsfaktoren der Unterblöcke eines Blockes,
[0022] Fig. 16 eine grafische Darstellung ähnlich Fig. 15, bei der jedoch die Anhebungsfaktoren nach einem Si¬ gnalsprung zu 1 gesetzt sind,
[0023] Fig. 18 ein Schaltbeispiel für ein senderseitiges adaptives Filter und
[0024] Fig. 19 ein Schaltbeispiel für ein empfängerseitiges adaptives Filter.
[0025] In Fig. 1 wird das Analogsignal a (t), das ein Audiosignal wie.z.B. Sprache oder Musik darstellt, durch den bei 1 darge¬ stellten Verfahrensschritt in ein entsprechendes digitales Signal umgewandelt. In dem bei 2 gezeigten zweckmäßigen, aber nicht zwingend notwendigen Verf hrensschritt wird das Signal einer Preemphase unterworfen, wobei vorzugsweise die höherfrequenten Spektralanteile des Audiosignals gegenüber den tieferfrequenten Anteilen angehoben werden. Durch diese Maßnahme soll der Effekt ausgeglichen werden, daß Signale mit niedrigen Frequenzen von Signalen mit hohen Frequenzen schlecht verdeckt werden. Um eine Verd^ckung dennoch zu er¬ zielen, muß die Anhebung umso stärker erfolgen, je weiter die Nutzfrequenz entfernt liegt.
[0026] In dem bei 3 dargestellten Verfahrensschritt erfolgt eine Fensterung des Signals, wodurch zeitlich aufeinanderfolgende Blσ-cke mit Signalabschnittenentstehen. Die Dauer dieser Blök- ke beträgt vorzugsweise 20 ms. Die Signale eines Blockes kön¬ nen später getrennt für sich weiterverarbeitet werden.
[0027] Bei 4 werden die Blöcke durch Wichtung mit einer Fensterfunk¬ tion in Unterblöcke unterteilt. Zweckmäßig ist eine Auftei¬ lung in 10-20 Unterblöcke.
[0028] Im nachfolgenden, mit 5 bezeichneten Verfahrensschritt wer¬ den die Signale innerhalb der jeweil gen Unterblöcke kon¬ stant verstärkt oder geschwächt, wobe , wie noch weiter un- ten ausgeführt wird, mehrere Verfahrensschritte durchgeführt werden.
[0029] Zur Bestimmung der Verstärkungsfaktoren oder Schwächungsfak¬ toren werden die mittleren Leistungen aus den Unterblöcken entsprechenden Signalabschnitten als Detektionsabschnitten abgeleitet. Für die mittleren Leistungen in den Detektionsab¬ schnitten werden dann Maßzahlen (Energie : Abschnittsdauer) gebildet. Diese Maßzahlen werden für die Detektionsabschnit- te eines Blockes auf die Maßzahl des Detektionsabschnittes mit der größten Maßzahl bezogen. Aus den Maßzahlen werden dann die Verstärkungsfaktoren bestimmt, wobei proportionale oder auch quantisierte Verstärkungsfaktoren mit unterschied¬ lichen Quantisierungfaktoren gewählt werden können.
[0030] Zweckmäßig ist es, für kleine Verstärkungsfaktoren kleinere Quantisierungsstufenhöhen zu wählen als für größere. Der ma¬ ximale Verstärkungsfaktor wird vorzugsweise auf einen Wert von 40 dB begrenzt. Nach Durchführung dieser Maßnahme wird in allen Unterblöcken etwa der gleiche Störabstand bezüglich der Nutzenergie und der durch die Kodierung entstehenden Störenergie erreicht.
[0031] Im mit 6 bezeichneten Verfahrensschritt wird anschließend das Signal des Blockes durch eine Transformation in ein Fre¬ quenzspektrum umgesetzt. Bei 7 erfolgt eine Kodierung nach psyocho akustischen Gesichtspunkten. Das bedeutet, daß Spek¬ tralkomponenten die bei der Wiedergabe insbesondere auf Grund von Verdeckungseffekten ohnehin nicht wahrgenommen wer¬ den, bei der Kodierung geringer gewichtet oder weggelassen werden. Mit 8 ist der Verfahrensseh tt der Übertragung oder Speicherung dargestellt, wonach die vorbeschriebenen Verfah¬ rensschritte im wesentlichen wieder in umgekehrter Reihenfol¬ ge rückgängig gemacht werden.
[0032] So erfolgt bei 9 zunächst eine Dekodierung, durch die das übertragene oder gespeicherte Signal wieder in ein Frequenz¬ spektrum zurückgewandelt wird. Durch den mit 10 bezeichneten Verfahrensschritt wird das Kurzzei p°ktrum wieder in den Zeitbereich überführt. Bei 11 werden auf Grund der übermit¬ telten Verstärkungsfaktoren die in den Blöcken und Unterblök¬ ken vorhandenen Signale komplementär entzerrt. Bei 12 werden die Unterblöcke zu Blöcke zusammengefügt und bei 13 werden aus den Blöcken wieder ein zusammenhängende digitale Signale gebildet. Nach Durchführung einer Deemphase bei 14, die zu der Preemphase bei 2 komplementär gerichtet ist, wird eine Digital/Analog-Wandlung bei 15 durchgeführt, nach der schließlich das Analogsignal b (t) abgegriffen werden kann. Das Analogsignal b (t) ist nicht identisch mit dem Analogsi¬ gnal a (t), weil bei der Kodierung Spektralkomponenten unter¬ schiedlich gewichtet oder unter drückt werden. Der Unter¬ schied zwischen den Analogsignalen b (t) und a (t) ist aber so, daß er bei der Wiedergabe vom Hörer nicht bemerkt wird. In Fig. 2 a,b,c ist die Fensterung des Signals a' darge¬ stellt, als deren Folge zeitlich aufeinanderfolgende Blöcke 17, 18 und 19 entstehen. Dies kann dadurch geschehen, daß das Signal a' mit einer Amplitudenkennlinie 16 multipliziert wird. Die Kennlinie hat bei einer bevorzugten Ausführungs¬ form am Anfang einen über eine viertel Periode sinusförmi¬ gen, danach einen konstanten Wert und am Ende einen kosinus- förmigen Verlauf. Der stetige Verlauf an den Enden soll ver¬ meiden, daß bei der späteren Transformation ein sehr breites Frequenzspektrum entstehen würde. Außerdem werden die Fen¬ ster so gelegt, daß eine Überlappung der Blöcke stattfindet. Im folgenden wird jedoch aus Gründen der besseren Darstel¬ lung von rechteckigen Amplitudenverläufen ausgegangen.
[0033] Die Fenster besitzen eine zeitliche Dauer von 20 ms. Diese Zeit hat sich als zweckmäßig erwiesen, um einerseits ein aus¬ reichend fein aufgelöstes Kurzzeitspektrum zu erhalten, das bei der späteren Kodierung genügend Spektrallinien enthält, um eine wirksame Datenreduktion vornehmen zu können, und um andererseits bei Änderungen des Signals die Verstärkung rela¬ tiv schnell auf den jeweils veränderten Zustand einzustellen und damit den psycho-akustisehen Vor- und Nachverdeckungsef- fekt auszunutzen.
[0034] In der Praxis sind jedoch Fälle möglich, bei denen ein Si¬ gnal aus der Ruhe plötzlich einsetzt und dieser Einsatz in¬ nerhalb eines Blockes, z.B. in dessen zweiter Hälfte statt¬ findet. Dieser Fall ist in Fig. 3a dargestellt. Das transfor¬ mierte Signal zeigt Fig. 3b. Durch Quantisierungsfehler bei der Kodierung überlagert sich dem in Fig. 3b dargestellten Spektrum ein Störspektrum, so daß das in Fig. 3c dargestell¬ te Spektrum entsteht. Nach Rücktransformation beeinflußt die¬ ses Störspektrum den Signalverlauf nicht erst ab dem Einsatz des Signals sondern bereits zu Beginn des Blockes wie Fig. 3d zeigt. Da der Vorverdeckungse ekt geringer als der Nachverdeckungseffekt ist, kann diese Störung hörbar werden. Durch entsprechende Kompression innerhalb des Blockes vor der Transformation und Übertragung und Expansion nach der Übertragung und Rücktransformation kann der Störabstand er¬ heblich verbessert werden.
[0035] Zu diesem Zweck wird, wie in Fig. 4 dargestellt ist, jeder Block 16, 17... in Unterblöcke unterteilt. Diese Unterblöcke 19, 20, 21... haben außer an den Blockrändern gleiche zeitli¬ che Ausdehnungen derart, daß sie sich jeweils zur Hälfte überlappen. An den Blockrändern besteht eine Überlappung mit Unterblöcken 18 der halben zeitlichen Ausdehnung. In diesen sich überlappenden rechteckigen Unterblöcken werden die mitt¬ leren Signalleistungen bestimmt (Energie im Zeitabschnitt dividiert durch die Ausdehnung des Ze tabschnitts).
[0036] In einem nachfolgenden Schritt werden, wie in Fig. 5 gezeigt ist, die zunächst rechteckigen Unterblöcke 19, 20, 21... mit 2 cos -Fensterfunktionen 22 bewertet. Die Zeitabschnitte an den Blockrändern, die nur die halbe zeitliche Ausdehnung der übrigen Unterblöcke besitzen, werden mit einem cos -Halbfen¬ ster 23 gewichtet. Die sich überlappenden Gewichtsfunktionen ergänzen sich zu jedem Zeitpunkt des Signalblocks zu 1.
[0037] In Fig. 6 ist gezeigt, wie die Signale in den Unterblöcken 19, 20, 21 entsprechend den detektierten mittleren Leistun¬ gen, dargestellt durch die durchgezogenen Linien, so ver¬ stärkt, bzw. geschwächt werden, daß die mittleren Leistungen in den Unterblöcken 19, 20, 21... etwa gleich werden, darge¬ stellt durch die gestrichelt gezeichneten Linien. Zwecks übersichtlicher Darstellung sind die Blöcke hier nicht ge¬ strichelt gezeichnet. Durch die Verstärkung und Schwächung der Signale wird das Verhältnis zwischen der Blocknutzener¬ gie und der durch die Kodierung entstehenden Blockstörener¬ gie nicht verändert. Andererseits wird durch diese Maßnahme erreicht, daß nun in allen Unterblöcken der gleiche Störab¬ stand besteht. Bezüglich des Störabstandes wird also dassel¬ be erreicht, wie wenn man von vorn herein durch Fensterung Blöcke gewählt hätte, die der Größe der Unterblöcke entspre¬ chen würde. Die vorher erwähnten Nachteile kürzerer Blöcke werden jedoch vermieden.
[0038] Die sich überlappenden Unterblöcke werden zweckmäßig aus psy- cho-akustischen Gründen auf eine zeitliche Ausdehnung von ca. 2-4 ms bemessen. Bei Blöcken mit ca. 1000 Abtastwerten bei einer Abtastfrequenz von 44, 1 kHz entspricht dies der Bildung von ca. 10-20 Unterblöcken. Weiterhin ist es zweckmä¬ ßig aus psycho-akustischen Gründen die Signalverstärkung auf einen Maximalwert von z.B. 40 dB zu begrenzen.
[0039] Es reicht aus, die Verstärkungsfaktoren zu quantisieren, wo¬ bei die Quantisierung relativ grob durchgeführt werden kann, um die für die Quantisierungsstufen notwendigen zusätzlichen Daten zu begrenzen. Die Quantisierung kann so vorgenommen werden, daß für kleinere Verstärkungsfaktoren kleinere Quan¬ tisierungsstufenhöhen gewählt werden als für größere. Dabei wird die Quantisierung so bemessen, daß die mittlere Lei¬ stung im angehobenen Unterblock die im Unterblock mit der höchsten detektierten mittleren Leistung, also dem Bezugs¬ block, nicht übersteigt. Auf diese Weise ist es möglich, so gar einen Gewinn im Verhältnis der Blocknutzenergie zur Blockstörenergie zu erzielen. In diesem Fall ist der Störab¬ stand allen Unterblöcken aber nicht mehr identisch, sondern nur noch annähernd gleich.
[0040] Wenn nur die Unterblöcke, in denen die Kompression des Si¬ gnals stattfindet, durch überlappende Fensterfunktionen ge¬ wichtet sind, nicht aber die Unterblöcke, die zur Ermittlung der mittleren Signalleistungen zur Berechnung der Verstär¬ kungsfaktoren dienen, können sich bei bestimmten Signalsprün¬ gen überhöhte Verstärkungsfaktoren ergeben. Dieser Fall ist in Fig. 7 für einen idealen Rechtecksprung dargestellt. Der nicht angehobene Signalverlauf ist mit 26, der angehobene Signalverlauf mit 27 bezeichnet. Die kleinen Buchstaben an bis a„ stehen für die Anhebungsfaktoren oder auch als Verstärkungsfaktoren bezeichnet. Die Überhöhung tritt dann auf, wenn die Sprungflanke und die Unterblockgren¬ ze nicht übereinstimmen.
[0041] Um die Überhöhung klein zu halten, wird gemäß einer Weiter¬ bildung die Ermittlung der mittleren Signalleistungen eben¬ falls in Blöcken mit 50% Überlappung vorgenommen, hier aller¬ dings mit Rechteckfenstern. Sie entsprechen direkt den Unter- blocken, in denen die Signale verstärkt werden. Das Ergebnis die.ser Maßnahme ist in Fig. 8 für den gleichen Signalsprung dargestellt. Mit 26 ist wieder die nicht angehobene Signal¬ verlauf, 28 diesmal der angehobene veränderte Signalverlauf bezeichnet.
[0042] Wendet man das bis hierhin erläuterte Verfahren auf das kom¬ plette Audiosignal an, so sind die Verstärkungsfaktoren nur für die energiereichen Spektralanteile richtig, da diese im wesentlichen die Faktoren bestimmen. In Audiosignalen sind fast immer die Spektralanteile bis ca. 3 kHz die energie¬ reichsten.
[0043] Besitzt das Verfahren für die energiereichen Spektralanteile bis ca. 3 kHz die größte Darstellungsgenauigkeit, so können Signalsprünge bei höheren Frequenzen mit geringeren Energie¬ anteilen zu größeren Ungenauigkeiten bei der Codierung füh¬ ren, was zu eventuell höhrbaren Störungen führt.
[0044] Gemäß einer ersten Alternative kann das Signal vor der Über¬ tragung und Codierung einer Preemphase und nach der Übertra¬ gung und Decodierung einer Deemphase unterworfen werden.
[0045] Fig. 9 bis 11 zeigen Blockschaltbilder zur Durchführung ei¬ ner Kompression bzw. Expansion zusammen mit einer Preemphase bzw. Deemphase. Die Schaltungen enthalten jeweils einen steu¬ erbaren Verstärker 24 und ein Filter 25.
[0046] In Fig. 9 ist nur der steuerbare Verstärker 24 im Signalweg angeordnet. Das Filter 25 befindet sich im Steuersignalweg. Wird diese Schaltung durch inverse Steuerung zur komplementä¬ ren Expansion verwendet, so kann das F lter 25 entfallen.
[0047] In Fig. 10 ist das Filter 25 dem steuerbaren Verstärker 24 vorgeschaltet. Diese Ausgestaltung benötigt auch bei der Ex¬ pansion ein Filter.
[0048] In Fig. 11 ist das Filter 25 ebenfalls dem steuerbaren Ver¬ stärker 24 vorgeschaltet und zusätzlich selbst steuerbar aus¬ gebildet. Die Grenzfrequenz kann dabei so verschoben werden, daß praktisch immer eine Verdeckung erzielbar ist. Bei der Expansion sind das steuerbare Filter 25 sowie der steuerbare Verstärker 24 invers anzusteuern.
[0049] Eine weitere Alternative besteht darin, statt einer festen Pre- und Deemphase eine frequenzselektive Signalanhebung vor¬ zunehmen, wobei ein adaptives Filter verwendet wird. Die Übertragungsfunktion eines derartigen adaptiven Filters für verschiedene Verstärkungen ist in Fig. 12 dargestellt. Das Filter betont dabei nur die mittleren Frequenzen und läßt die unteren sowie die oberen Frequenzen Linberücksichtigt.
[0050] Die Figuren 13 und 14 zeigen Blockschaltbilder mit Verfah¬ rensschritten zur Durchführung des Verfahrens einschließlich der adaptiven Filterung und zwar Fig. 13 für die Senderseite und Fig. 14 für die Empfängerseite.
[0051] Senderseitig wird das Eingangssignal zunächst mittels eines festen Bandpaßfilters 29 auf die Signalanteile reduziert, die für die Ermittlung der Filterkoeffizienten relevant sind. Dieses Bandpaßfilter 29 sollte in seiner Charakteri¬ stik dem adaptiven Filter, wie sie in Fig. 12 dargestellt ist, vergleichbar sein. Das Ausgangssignal dieses Bandpasses 12 wird bei 30 z.B. in Blöcke mit vorzugsweise 1024 Abtast¬ werten eingeteilt, wobei sich die Blöcke jeweils um 6,25 % überlappen. Die so entstehenden Blöcke entsprechen in ihrer zeitlichen Lage den Blöcken, die später dem adaptiven Filter zugeführt werden. Alternativ kann die feste Bandpaßfilterung auch nach einer entsprechenden Blockbildung für einen einzel¬ nen Block durchgeführt werden. Alle nachfolgenden Bearbei¬ tungsschritte ändern sich dadurch nicht.
[0052] Die gefilterten Signalblöcke werden mit sich zu 50 % überlap¬ penden Rechteckfenstern in 31 in z.B. 9 Unterblöcke einge¬ teilt. Die mittlere Signalleistung aus diesen Blöcken wird ermittelt und das Maximum dieser Signalleistungen wird als Bezugsgröße definiert. Anschließend werden in 32 die Anhe¬ bungsfaktoren für jeden Unterblock berechnet, die sich auf diese BezLigsgröße beziehen. Mathematisch lassen sich die Anhebungsfaktoren f. = P / -• • • Dabei ist f. der Faktor des i-ten Blocks, P^ SιegBezugsαröße und P^die mittlere Leistung des i-ten Blocks.
[0053] Die Faktoren f. sollen an den in Fig. 15 mit einem Kreuz ge¬ kennzeichneten Stützstellen gelten und werden dem Empfänger mitgeteilt. Für die vollständige adaptive Filterung müssen in 33 die vorliegenden 9 Werte auf 1024 extra poliert wer¬ den, indem zwischen den Stützstellen die Faktoren f. weich ineinander überblendet werden. Der entsprechende Faitorver- lauf für alle 1024 Abtastwerte eines Blocks ist für ein Bei¬ spiel in Fig. 15 durch die ausgezogene Linie dargestellt, wenn alle Faktoren unverändert bleiben. Unter Berücksichtigung psychoakustischer Kriterien können die Faktoren jedoch nach einem Signalsprung zu 1 gesetzt wer¬ den, da die Nachverdeckung besser als die Vorverdeckung wirkt. Dieser Fall ist in Fig. 16 wiedergegeben. Die Über¬ blendung geschieht im vorliegenden Fall mittels Kosinusqua¬ dratfunktionen.
[0054] Aus den dargestellten Faktorverläufen können in 34 die Fil¬ terkoeffizienten a1 bis a„ für ein adaptives Filter 35, wie es als Beispiel in Fig. 17 dargestellt ist, zu jedem Abtast¬ wert berechnet werden. Es entsteht ein adaptives Filter, des¬ sen Stoßantwort sich beim Einlesen eines jeden Abtastwertes ändert. Dieses Filter wird so bemessen, daß es etwa zwischen den. in Fig. 12 dargestellten Betragsfunktion variiert werden kann. Die Übertragungsfunktion für den Faktor 1 ist dort mit H . gekennzeichnet und die Übertragungsfunktion für den ma¬ ximal zulässigen Faktor von vorzugsweise 10000 ist mit H gekennzeichnet. Das so errechnete adaptive Filter wird auf den in 36 erhaltenen ungefilterten Block angewendet, der aus dem kontinuierlichen Signal entnommen und bereits mit dem Analysefenster bewertet wurde. Es werden somit nur die Si¬ gnalanteile im mittleren Frequenzbereich angehoben, tieffre- quente sowie hochfrequente Signalanteile bleiben weitgehend unverändert. Der so gefilterte Block wird dem Codierer 37 zugeführt.
[0055] Die Faktoren f. können beispielsweise logarithmisch quanti- siert und mit jeweils 5 Bit übertragen werden. Im Empfänger werden hieraus nach entsprechender Extrapolation in 38 an¬ schließend in 39 wieder die 1024 Faktoren die die Filterkoef¬ fizienten b.. bis b„ für ein inverses Filter 40 bestimmt, für das ein Beispiel in Fig. 18 dargestellt ist. Mit diesem Fil¬ ter wird der Block nach der Decodierung in 41 im Empfänger gefiltert, um die Anhebung wieder rückgängig zu machen. An¬ schließend wird der Block mit dem Synthesefenster in 42 be¬ wertet und ein kontinuierliches Signal durch Aneinanderrei¬ hung der Blöcke erzeugt.
权利要求:
ClaimsP a t e n t a n s p r ü c h e
1. Verfahren zur Übertragung eines Audiosignals, das durch Zeitfenster in zeitlich aufeinanderfolgende Blöcke auf¬ geteilt wird, dann die in den Blöcken enthaltenen Si¬ gnalanteile durch Transformation in ein Kurzzeitspek¬ trum umgewandelt werden, anschließend die Kurzzeitspek¬ tren auf der Basis psychakustischer Gesetzmäßigkeiten codiert und übertragen werden und nach der Übertragung decodiert, die Kurzzeitspektren durch Rücktransformati¬ on wieder in den Zeitbereich überführt werden und schließlich die im Zeitbereich vorliegenden Blöcke an¬ einandergefügt werden, wobei die Blöcke in Unterblöcke aufgeteilt werden und bei Pegel derungen von einem Block zum anderen, die einen vorgegebenen Wert über¬ schreiten, die Signale in den nterblöcken vor der Transformation einer Kompression und nach der Rück¬ transformation einer Expansion unterzogen werden, da¬ durch gekennzeichnet, daß das Signal in Abhängigkeit der mittleren Signalleistungen in den Unterblöcken in diesen bei der Kompression verstärkt und/oder ge¬ schwächt und bei der Expansion komplementär behandelt wird.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die maximale Änderung der ze tabhängigen Verstärkung und/oder Schwächung begrenzt wird.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeich¬ net, daß die Unterteilung der Blocke in Unterblöcke durch Gewichtung mit Fensterfunktionen erfolgt, die über dem Zeitabschnitt einen ons anten Wert aufweisen.
4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß sich die Fenster unktionen überl ppen und die Blöcke an ihren beiden Rändern mit Fensterfunktionen der halben zeitlichen Breite gewichtet werden .
5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß die Blöcke mit weiteren, "weichen" Fensterfunktionen gewichtet werden, die einen stetigen Verlauf aufweisen, an den Grenzen der Unterblöcke zu Null werden und sich im gesamten Block zu einem konstanten Gewichtungswert, vorzugsweise zu 1, ergänzen.
6. Verfahren nach einem der Ansprüche 3 bis 5, dadurch ge¬ kennzeichnet, daß die Fensterfunktionen aißer an den 2
Blockrändern Hanning^Fenster enspr. cos -Fenster und an den Blockrändern cos -Halbfenster sind.
7. Verfahren nach einem der Ansprüche 3 bis 6, dadurch ge¬ kennzeichnet, daß die Signale innerhalb der jeweiligen Unterblöcke mit einem konstanten Faktor verstärkt oder geschwächt werden.
8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, daß die Verstärkungsfaktoren (Schwächungsfaktoren) aus den mittleren Leistungen in den Unterblöcken entsprechenden Signalabschnitten als Detektionsabschnitten abgeleitet werden.
9. Verfahren nach einem der Ansprüche 3 bis 6, dadurch ge¬ kennzeichnet, daß auch die Detektionsabschnitte wie die Unterblöcke durch Gewichtung der Blöcke mit Fensterfunk¬ tionen gewonnen werden, die über dem Zeitabschnitt ei¬ nen konstanten Wert besitzen.
10. Verfahren nach Anspruch 9, dadurch gekennzeichnet, daß sich die Fensterfunktionen zu vorzugsweise überlappen.
11. Verfahren nach einem der Ansprüche 8 bis 10, dadurch gekennzeichnet, daß für die mittleren Leistungen in den Detektionsabschnitten Maßzahlen (Energie geteilt durch Abschnittdauer) gebildet werden.
12. Verfahren nach Anspruch 11, dadurch gekennzeichnet, daß die Maßzahlen für die Detektionsabschnitte eines Blocks auf die Maßzahl eines Detektionsabschnittes, vorzugswei¬ se desjenigen mit der größten Maßzahl, bezogen werden und daß die entstehenden Maßzahl.-"-erhältnisse die Ver¬ stärkungsfaktoren, vorzugswei e proportional, bestimmen.
13. Verfahren nach Anspruch 12, dadurch gekennzeichnet, daß quantisierte Verstärkungsfaktoren gewählt werden.
14. Verfahren nach Anspruch 13, dadurch gekennzeichnet, daß die Quantisierung ungleichmäßig durchgeführt wird, vor¬ zugsweise derart, daß für kleine Verstärkungsfaktoren kleinere Quantisierungsstufenhöhen gewählt werden als für größere.
15. Verfahren nach einem der Ansprüche 1 bis 14, dadurch gekennzeichnet, daß die Verstärkungsfaktoren auf einen Maximalwert von vorzugsweise 40 dB begrenzt werden.
16. Verfahren nach einem der Ansprüche 1 bis 15, dadurch gekennzeichnet, daß die Signale i'or der Blockbildung einer Preemphase und nach der Übertragung und Aneinan¬ derfügung der Blöcke einer komplementären Deemphase un¬ terworfen werden.
17. Verfahren nach Anspruch 16, dadurch gekennzeichnet, daß durch die Preemphase höherfrequente Spektralanteile des Audiosignals gegenüber tieferfrequenten Anteilen angeho¬ ben werden.
18. Verfahren nach einem der Ansprüche 1 bis 15, dadurch gekennzeichnet, daß die Signale, welche zur Bestimmung der mittleren Signalleistungen in den Unterblöcken die¬ nen, frequenzabhängig, vorzugsweise mittels eines Band¬ paßfilters gefiltert werden und daß die Kompression und Expansion ebenfalls frequenzabhä gig durchgeführt wird.
19. Verfahren nach Anspruch 18, dadurch gekennzeichnet,' daß aus den Signalen, welche zur Bestimmung der mittleren Signalleistungen in den Unterblöcken dienen, Maßzahlen zur Veränderung eines adaptiven Bandpasses gewonnen wer¬ den, mittels dem die Kompression und Expansion durchge¬ führt wird.
20. Verfahren nach Anspruch 19, dadurch gekennzeichnet, daß der adaptive Bandpaß als Transversalfilter mit drei Ko¬ effizienten ausgeführt ist.
21. Verfahren nach Anspruch 19 oder 20, dadurch gekennzeich¬ net, daß aus den Maßzahlen, die zunächst für jeden Un¬ terblock auf denjenigen mit der höchsten Signalleistung bezogen sind, für jeden Abtastwert in den Unterblöcken Zwischenwerte extrapoliert werden und daß das adaptive Filter bei jedem Abtastwert entsprechend den extrapo¬ lierten Zwischenwerten verändert wird.
22. Verfahren nach Anspruch 21, dadurch gekennzeichnet, daß in den Unterblöcken, die nach dem Unterblock mit der höchsten Signalleistung folgen, die Maßzahlen gleich dem Bezugswert dieses Unterblocks mit der höchsten Si¬ gnalleistung gesetzt werden, d.h., daß in diesen Unter¬ blöcken keine Änderung des adaptiven Filters in Abhän¬ gigkeit der Abtastwerte mehr <-or-<_r<-*-nommen wird.
23. Verfahren nach Anspruch 21 oder 22, dadurch gekennzeich¬ net, daß nur die der Anzahl der Unterblöcke entsprechen¬ den, als Stützwerte dienenden Maßzahlen übertragen wer¬ den und gegebenenfalls zusätzlich die Extrapolationsvor¬ schrift übertragen wird und daß empfangsseitig die ex¬ trapolierten Zwischenwerte rekonstruiert und zur "Durch¬ führung der Expansion invertiet-t werden.
类似技术:
公开号 | 公开日 | 专利标题
US10529347B2|2020-01-07|Methods, apparatus and systems for determining reconstructed audio signal
JP6592148B2|2019-10-16|高周波数の再構成方法を使用するコーディング・システムの性能拡大方法
US20160358616A1|2016-12-08|Methods for improving high frequency reconstruction
Johnston et al.1992|Sum-difference stereo transform coding
US8913754B2|2014-12-16|System for dynamic spectral correction of audio signals to compensate for ambient noise
Johnston1988|Transform coding of audio signals using perceptual noise criteria
US5125030A|1992-06-23|Speech signal coding/decoding system based on the type of speech signal
US5825979A|1998-10-20|Digital audio signal coding and/or deciding method
JPH0731280Y2|1995-07-19|符号化音声信号の処理装置
US5623577A|1997-04-22|Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
US5204677A|1993-04-20|Quantizing error reducer for audio signal
JP3141450B2|2001-03-05|オーディオ信号処理方法
KR100241498B1|2000-02-01|디지털신호 부호화장치
US5890125A|1999-03-30|Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
KR100312664B1|2002-12-26|디지탈신호부호화방법
ES2307100T3|2008-11-16|Metodos y aparatos de codificacion de audio mediante replicacion de banda espectral y reconstruccion de alta frecuencia que usan adicion adaptativa de un umbral minimo de ruido y limitacion de la sustitucion de ruido.
EP0176243B1|1990-03-07|Sprachkodierung im Frequenzbereich
Tribolet et al.1979|Frequency domain coding of speech
Brandenburg1987|OCF--A new coding algorithm for high quality sound signals
KR100209870B1|1999-07-15|오디오 신호의 순서화된 타임 시퀸스 처리 방법 및 오디오 신호 전송 방법
EP0420745B1|1995-11-15|Digitalsignalkodiergerät
EP1160770B2|2018-04-11|Perzeptuelle Kodierung von Audiosignalen unter Verwendung von getrennter Reduzierung von Irrelevanz und Redundanz
US5621856A|1997-04-15|Digital encoder with dynamic quantization bit allocation
EP0537361B1|1997-05-14|Digitales Datenkodierungs-und Dekodierungsgerät mit hoher Wirksamkeit
FI84538C|1991-12-10|Foerfarande foer transmission av digitaliska audiosignaler.
同族专利:
公开号 | 公开日
US5179623A|1993-01-12|
JPH02504457A|1990-12-13|
AT111271T|1994-09-15|
HK55496A|1996-04-03|
JP3171840B2|2001-06-04|
KR900702672A|1990-12-08|
KR970002686B1|1997-03-08|
EP0378609B1|1994-09-07|
EP0378609A1|1990-07-25|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
WO1986003873A1|1984-12-20|1986-07-03|Gte Laboratories Incorporated|Method and apparatus for encoding speech|
EP0193143B1|1985-02-27|1992-05-06|TELEFUNKEN Fernseh und Rundfunk GmbH|Verfahren zur Übertragung eines Audiosignals|
EP0251028A2|1986-06-27|1988-01-07|TELEFUNKEN Fernseh und Rundfunk GmbH|Verfahren zur Übertragung eines Audiosignales|EP0453282A2|1990-04-20|1991-10-23|Sony Corporation|Digitale Teilbandkodierungsvorrichtung|
US5451954A|1993-08-04|1995-09-19|Dolby Laboratories Licensing Corporation|Quantization noise suppression for encoder/decoder system|
EP0687073A3|1990-03-07|1997-04-02|Sony Corp|Gerät zur Kodierung eines digitalen Signals|US3238298A|1962-05-07|1966-03-01|Avco Corp|Multiplex communication system with multiline digital buffer|
US4045616A|1975-05-23|1977-08-30|Time Data Corporation|Vocoder system|
DE2908321C2|1979-03-03|1984-06-28|Robert Bosch Gmbh, 7000 Stuttgart, De||
JPS5857758B2|1979-09-28|1983-12-21|Hitachi Ltd||
DE3310480C2|1983-03-23|1986-02-13|Seitzer, Dieter, Prof. Dr.-Ing., 8520 Erlangen, De||
US4747143A|1985-07-12|1988-05-24|Westinghouse Electric Corp.|Speech enhancement system having dynamic gain control|
US4759071A|1986-08-14|1988-07-19|Richards Medical Company|Automatic noise eliminator for hearing aids|
DE3703143A1|1987-02-03|1988-08-11|Thomson Brandt Gmbh|Verfahren zur uebertragung eines audiosignals|DE4020656A1|1990-06-29|1992-01-02|Thomson Brandt Gmbh|Verfahren zur uebertragung eines signals|
DE4211945C1|1992-04-09|1993-05-19|Institut Fuer Rundfunktechnik Gmbh, 8000 Muenchen, De||
US20050259833A1|1993-02-23|2005-11-24|Scarpino Frank A|Frequency responses, apparatus and methods for the harmonic enhancement of audio signals|
US5625743A|1994-10-07|1997-04-29|Motorola, Inc.|Determining a masking level for a subband in a subband audio encoder|
DE10000934C1|2000-01-12|2001-09-27|Fraunhofer Ges Forschung|Vorrichtung und Verfahren zum Bestimmen eines Codierungs-Blockrasters eines decodierten Signals|
US6931292B1|2000-06-19|2005-08-16|Jabra Corporation|Noise reduction method and apparatus|
法律状态:
1989-11-30| AK| Designated states|Kind code of ref document: A1 Designated state(s): JP KR US |
1989-11-30| AL| Designated countries for regional patents|Kind code of ref document: A1 Designated state(s): AT BE CH DE FR GB IT LU NL SE |
1990-01-17| WWE| Wipo information: entry into national phase|Ref document number: 1989906111 Country of ref document: EP |
1990-07-25| WWP| Wipo information: published in national office|Ref document number: 1989906111 Country of ref document: EP |
1994-09-07| WWG| Wipo information: grant in national office|Ref document number: 1989906111 Country of ref document: EP |
优先权:
申请号 | 申请日 | 专利标题
DE3817789||1988-05-26||
DEP3817788.9||1988-05-26||
DE3817788||1988-05-26||
DEP3817789.7||1988-05-26||
DE3817864A|DE3817864A1|1988-05-26|1988-05-26|Verfahren zur uebertragung eines audiosignals|
DEP3817864.8||1988-05-26||DE58908326A| DE58908326D1|1988-05-26|1989-05-24|Verfahren zur übertragung eines audiosignals.|
EP89906111A| EP0378609B1|1988-05-26|1989-05-24|Verfahren zur übertragung eines audiosignals|
KR1019900700170A| KR970002686B1|1988-05-26|1989-05-24|오디오 신호의 전송방법|
[返回顶部]