Verarbeitung der Phonak Spice Generation

Transcrição

Verarbeitung der Phonak Spice Generation
Verarbeitung der Phonak Spice Generation
Eine neue Generation von Geräusch-Klassifikation und Direktionalität
Ist größer oder kleiner besser? Hierzu kann man natürlich
keine eindeutige Antwort geben, da auch die allgemeine
Dimension in Betracht gezogen werden muss, auf die sich
diese Frage bezieht. Ein Bereich, in dem größer und mehr mit
Sicherheit besser ist, ist die Verarbeitungsleistung einer
Phonak Plattform. Sie ist die technologische Grundlage einer
Generation von Hörsystemen inklusive des dazugehörigen
Chipsatzes,
der
Signalverarbeitungsfunktionen,
des
mechanischen Designs und der Anpasssoftware.
Die neue Plattform der Phonak Spice Generation bietet eine
doppelt so hohe Verarbeitungsleistung wie die CORE Plattform
der vorherigen Generation. Diese zusätzliche Leistung wurde
bereits von der ersten Welle der Spice Hörsysteme geboten
und stellt die Ausgangsbasis für fortschrittliche
Klangverarbeitung und innovative Hörsysteme dar.
Kann es so etwas wie zu viel Verarbeitungsleistung
geben?
Haben Sie jemals jemanden sagen hören, „danke, aber mein
Computerprozessor ist eigentlich schnell genug. Sie können
die zusätzlichen Gigahertz behalten. Ach ja, und ich habe
auch genug Speicherplatz.“ Wenn Sie gerade dabei sind,
können Sie auch die Festplatte mit zusätzlichen 100 Gigabyte
zurückgeben. So etwas bekommt man nie zu hören.
Als das Spice Entwicklungsteams damit begann, Methoden zur
Leistungsverbesserung zu entwickeln, die sich für Träger und
Hörgeräteakustiker gleichermaßen eignen, reagierten die
Phonak Hardware-Techniker darauf sehr schnell mit dem
Entwurf einer neuen Plattform, die eine doppelt so hohe
Verarbeitungsleistung wie CORE bietet. Ausgehend von dieser
soliden Grundlage und einer gemeinsamen Vision, führte die
weitere Zusammenarbeit des gesamten globalen Forschungsund Entwicklungsteams von Phonak zu der bahnbrechenden
neuen Spice Plattform.
Oft ist die beste Methode, etwas Neues schätzen zu lernen,
der Vergleich mit einem bereits vorhandenen Referenzobjekt.
Abbildung 1 zeigt die Evolution der wichtigsten physikalischen
Dimensionen der letzten 3 Phonak Plattformen. Die Anzahl der
Transistoren steigt mit jeder Plattformgeneration an und die
Struktur tendiert nach unten. Je mehr Transistoren verfügbar
V1.00/2011-01•1/4
sind, desto mehr Verarbeitung ist möglich. Je dünner die
Struktur ist, desto mehr Komponenten können auf dem
Mikrochip untergebracht werden und desto weniger Energie
verbraucht der Mikrochip für dieselbe Verarbeitungsaufgabe.
Abbildung 1 - Evolution der wichtigsten physikalischen Dimensionen
Abbildung 1 zeigt ein ähnliches Bild für einige der wichtigsten
Verarbeitungsdimensionen. Der fast verdoppelte MOPS-Wert
(million operations per second) von Spice im Vergleich zu
CORE bedeutet, dass der Chip der neuen Generation doppelt
so viel leistet.
Abbildung 1 - Evolution der wichtigsten Verarbeitungsdimensionen
Phonak Hörsysteme sind wirkliche Vorreiter, wenn es um die
Nutzung aller Vorteile der
zugrundeliegenden Plattformkomponenten
geht,
auf denen sie basieren.
©Phonak AG Alle Rechte vorbehalten
Einleitung
Erkennung der Klassifikation der Klangumgebung
Stellen Sie sich einmal die Premierenvorstellung in einem
Konzertsaal vor, und dies insbesondere aus der Perspektive
von drei verschiedenen Personen im Zuschauerraum. Zunächst
ist da der Platzanweiser, der den Gästen ihre Plätze zeigt. Er
ist in den zehn Minuten vor dem Heben des Vorhangs extrem
beschäftigt, aber es gibt immer Gäste, die zu spät kommen
und noch nach Veranstaltungsbeginn zu ihren Plätzen müssen.
Es ist wichtig, dass der Platzanweiser einen verspäteten Gast
deutlich versteht, damit Störungen des bereits sitzenden
Publikums möglichst vermieden werden. Denken Sie jetzt
einmal an eine zweite Person, eine Musikliebhaberin mit
einem Konzert-Abonnement. Sie geht besonders gern zu
Premieren und genießt die erste perfekte Vorstellung nach
wochenlangen Proben. Die dritte Person, der Beleuchter, hat
sicherzustellen, dass der Scheinwerfer immer auf den Sänger
gerichtet ist. Er befindet sich direkt über den Lautsprechern
und muss mit dem dröhnenden Klang fertigwerden und
gleichzeitig die genaue Ausrichtung des Scheinwerfers
beibehalten. Auch wenn dies zuerst wie ein und dieselbe
Klangumgebung aussieht, ist sie doch für jede Person sehr
unterschiedlich, und vor allem hat jede Person eine andere
Hörabsicht. Die Spice Verarbeitung bietet eine hochentwickelte Geräuschklassifikation und intuitive Lernfunktionen,
mit denen sich die Hörabsicht eines Trägers genauestens auf
aktuelle Klangumgebung abstimmen lässt.
Ist Genauigkeit dasselbe wie Präzision?
Die Hörgeräte der Phonak Spice Generation genießen das
Privileg einer bisher unvorstellbaren Verarbeitungsfähigkeit.
Eines der zahlreichen Merkmale der Spice Klangverarbeitung,
das diese Fähigkeit fördert, ist die Klassifikation der
Klangumgebung durch die SoundFlow Automatik, welche für
alle Phonak Hörgeräte erhältlich ist (Nyffeler, 2009)1. Die
meisten modernen Hörgeräte ermöglichen eine gute und
genaue Klassifikation der grundlegenden Klangumgebungen.
Jedoch stellt die Präzision dieser Klassifikation, eine höhere
Herausforderung dar.
Die SoundFlow Klassifikation durch den Spice Chipsatz erfolgt
durch die Berechnung von 46 verschiedenen Parametern des
eingehenden Klangs, beispielsweise SNR, Tieftonbereiche,
Onsets und spektrale Dämpfung. Diese Parameter werden
dann analysiert, weiter kombiniert und auf einen Punkt in
einem 3D-Klangmodel projiziert, das die vier in Abbildung 3
gezeigten Klangbereiche enthält: Ruhige Situation, Sprache
bei Störgeräuschen, Störgeräusche und Musik.
Wenn ein Punkt innerhalb eines der Klangbereiche liegt, wird
er als zu 100% mit dieser Klangumgebung verbunden
angenommen, und das ungemischte Basisprogramm für diese
Umgebung wird verwendet. Wenn der Punkt nicht in einem
der Bereiche liegt, wird die Klassifikation der Klangumgebung
V1.00/2011-01•2/4
mit Hilfe eines Gesetzes der Anziehung berechnet. Diese
Methode liefert eine natürliche Zuordnung einer
Klangumgebung im 3D-Klangmodell und somit eine genauere,
zuverlässigere und schnellere Klassifikation des eingehenden
Klangs.
Abbildung 3
Hochauflösendes,
mehrdimensionales
GeräuschKlassifikationssystem, das von SoundFlow für eine präzise und nahtlose,
automatische Anpassung verwendet wird.
Falls diese Berechnungen noch nicht komplex genug klingen,
so berücksichtigt das SoundFlow Umgebungsanalysesystem
jetzt auch Raumklangunterschiede. Das bedeutet, dass die
Analyse die Richtung einbezieht, der ein Träger zugewendet
ist. Somit wird im Konzertsaal Sprache von rücksichtslosen
Zuhörern, die hinter der Musikliebhaberin sitzen, zu Recht als
Hintergrundgeräusche behandelt und daher bei der
Klassifikation als „Sprache im Störgeräusch“ betrachtet.
Diese Präzisionsklassifikation wird ständig in Echtzeit neu
berechnet, so dass SoundFlow für jeden Moment ein optimales
Mischprogramm zusammenstellen kann, das auf den
verschiedenen Basisprogrammen aufbaut. Desweiteren sind
die Übergänge zwischen diesen Mischprogrammen so sanft,
dass man sie nicht einmal wahrnimmt.
Wachsendes Verständnis für Hörgeräte
Die präzise Klassifikation der Klangumgebung in Echtzeit
scheint sehr beeindruckend zu sein, aber um einen messbaren
Vorteil für den Träger zu bieten, muss auch seine Hörabsicht
berücksichtigt werden. Durch die Spice-Verarbeitung wächst
das Verständnis für Hörgeräte, die sich zusammen mit ihren
Trägern entwickeln.
FlexControl, eine bahnbrechende Innovation in der SpiceVerarbeitung in Bezug auf intelligente Anwenderinteraktion,
ermöglicht, durch Berücksichtigung der Hörabsicht des Trägers,
die Anpassung in Bezug auf mehr Klarheit und höherem
Komfort. Zurück im Konzertsaal – Die Hörabsicht des
Platzanweisers
ist,
Sprache
bei
beträchtlichen
©Phonak AG Alle Rechte vorbehalten
Dieses Phonak Insight untersucht einige der Innovationen im
Bereich der Signalverarbeitung, die jetzt dank dieses Sprungs
in der Verarbeitungsleistung verfügbar sind.
Hintergrundgeräuschen zu verstehen, die Absicht der
Musikliebhaberin ist, ein möglichst angenehmes Musikerlebnis
zu genießen, und der Beleuchter sucht nach etwas Ruhe in
einer extrem lauten Situation, damit er sich auf seine Arbeit
konzentrieren kann. Die einfache Erhöhung/Reduzierung der
Verstärkung ist nur insofern für den Träger nützlich, da er
dadurch seine Hörabsicht ausdrückt. FlexControl führt
intelligente Anpassungen sowohl für die Verstärkung
(Hörverlust, gewünschte Frequenzgang- und Lautstärkestufen)
als auch für die Klangbereinigung (direktionale Einstellung,
Windgeräusch-Management, Reduktion von Hintergrundgeräuschen und Echoauslöschung) durch. Validierungsergebnisse zeigen, dass FlexControl unter allen Klangbedingungen im Vergleich zu einer herkömmlichen
Lautstärkeregelung insgesamt bessere Leistungen erbringt
(Phonak AG, 2010)2.
Die Self Learning Funktion bringt die SoundFlow GeräuschKlassifikation und die multidimensionalen FlexControl
Parameter zusammen. Diese Konvergenz von interaktiver
Steuerung und automatischer Anpassung bietet dem Träger
eine neue Dimension der Hörgerätsteuerung.
In diesem Szenario würde eine Steuerung, die einen
durchschnittlichen Zeitfaktor berechnet, zuerst die
Verstärkung erhöhen, wodurch sich ein beträchtlicher
Überschuss ergäbe, bevor schließlich die angemessene
Kompression wie durch die graue Linie in Abbildung 2
angewendet würde.
Die Phonak Spice Verarbeitung vermeidet solche Fallen, die
sich auf andere Systeme auswirken können, indem sie die
Erkennung des Eingangspegels von der Berechnung der
spektralen Verstärkung trennt. Durch die in beiden Wegen
hundertfach pro Sekunde stattfindende Berechnung der
Parameter werden die spektralen Hinweise genauer
reproduziert, um sich an ständig wechselnde Klangumgebungen anzupassen. So wird der angemessene
Kompressionspegel sofort angewendet, was darin resultiert,
dass kein Verstärkungsüberschuss entsteht, siehe grüne Linie
in Abbildung 2. Für die Premierenvorstellung bedeutet dies,
dass der Beleuchter die gewaltigen Eröffnungsklänge
komfortabel erleben und sich dennoch weiterhin auf seine
Arbeit konzentrieren kann.
Zweiwege-Kompression in Zusammenarbeit
V1.00/2011-01•3/4
Abbildung 2 - Anpassungen der Verstärkung über längere Zeiträume als
Reaktion auf einen abrupten Anstieg der Signalintensität
Dieses einzigartige adaptive Zweiwege-Kompressionssystem
ist auch im SoundFlow integriert, so dass die Verstärkungssteuerung sowohl zeit- als auch situationsspezifisch reagiert.
Je nach Situation werden automatisch die Zeitkonstanten
ausgewählt, die die beste Signalübertragung mit der
geringsten Verzerrung liefern. Dies führt zu sofortigen und
reibungslosen automatischen Anpassungen, so dass selbst die
abruptesten Änderungen der Klangumgebung effizient ohne
Verzerrungen oder Artefakte verarbeitet werden.
Direktionalität ist eine Leidenschaft von Phonak
Phonak war schon immer ein Vorreiter in der direktionalen
Mikrofontechnologie. Die Spice Plattform setzt die Messlatte
der Branche durch zwei wegweisende Innovationen im Bereich
Direktionalität erneut ein gutes Stück höher.
Direktionale Störgeräuschauslöschung wird räumlich
Normalerweise wird der Algorithmus zur StörgeräuschUnterdrückung unabhängig vom Mikrofonmodus immer auf
dieselbe Art und Weise angewendet – basierend auf
temporalen Hinweisen. Im Direktionalmodus ist die Quelle von
Interesse jedoch bekannt, so dass ein anderer Ansatz
angewendet werden kann – UltraZoom mit SNR-Boost ist die
© Phonak AG All rights reserved
Moderne digitale Signalprozessoren in Hörgeräten verwalten
und steuern hunderte von Parametern. In vielen Fällen
beeinflussen diese Parameter sich gegenseitig, teilweise auch
negativ. Was einen effektiven Signalprozessor hervorhebt, ist
die Kunst, hunderte verschiedener Parameter zu harmonisieren,
um Artefakte und interne Interferenzen zu vermeiden. Selbst
in einem so gut entwickelten Bereich wie der Signalverarbeitung als Kompression gehört die Beachtung der
Details zu den wichtigsten Aufgaben, um dem Träger höchste
Klarheit und größtmöglichen Komfort zu bieten. Das Bedürfnis,
schnell und akkurat auf verschiedene Situationen zu reagieren,
bedeutet, dass Kompressionssysteme häufig eine ZweiwegeStrategie einsetzen, wobei ein Weg eine langsam wirkende
und der andere eine schnell wirkende Verstärkungssteuerung
bietet. Jedoch kann der schnell wirkende Weg mit seinen
kurzfristigen Konstanten die Amplitudenfluktuationen des
Originalsignals verzerren, und der langsam wirkende Weg
kann die Reaktionsfähigkeit bei der Verwaltung plötzlicher,
unangenehmer lauter Geräusche beschränken.
Einige Hörgerätehersteller setzen ein Verfahren ein, in dem
beide Kompressionswege direkt gesteuert werden, indem über
einen längeren Zeitraum ein Durchschnittswert für das
Eingangssignal ermittelt wird. Diese Einstellung ist
möglicherweise nicht ideal. Denken wir noch einmal an die
Premiere im Konzertsaal zurück und an den Moment, in dem
die Vorstellung dann tatsächlich beginnt. Die Lichter gehen
aus und das Tuscheln im Publikum verstummt. Der
Scheinwerfer des Beleuchters ist auf das Orchester gerichtet,
das darauf wartet, vom Dirigenten zum Leben erweckt zu
werden. Mit einer kleinen Bewegung des Taktstocks überflutet
das Orchester in perfekter Harmonie den Konzertsaal mit dem
Eröffnungsakkord. In diesem Moment ist der Beleuchter
schutzlos diesem plötzlichen akustischen Angriff ausgesetzt.
Herkömmliche Direktionalität
UltraZoom mit SNR-Boost
Abbildung 3 - Herkömmliche Direktionalmikrofone verstärken alles, was sich
innerhalb des Richtstrahls befindet, auch unerwünschte Störgeräusche.
UltraZoom mit SNR-Boost unterdrückt effektiv Störgeräusche und verbessert
gleichzeitig den SNR für die von vorn kommende Sprache.
NoiseBlock analysiert Klangvariationen über einen längeren
Zeitraum über mehrere Frequenzbänder und reduziert dabei
die Verstärkung für verschiedene Frequenzbänder, sobald
Störgeräusche erkannt werden. Im Gegensatz dazu analysiert
SNR-Boost die Eintreffrichtung des Klangs, und wenn ein
Zielgeräusch von vorne erkannt wird, reduziert er die
Verstärkung für Klänge, die aus der hinteren Hemisphäre
stammen. Im Gegensatz zu den meisten Systemen zur
Störgeräuschauslöschung hält er die Zielklänge von vorne
genauer und führt eine detailliertere Auswahl der
Störgeräusche von hinten durch. Und das auch, wenn die
Störgeräusche Sprache beinhalten. Natürlich agiert SNRBoost auch individuell für verschiedene Frequenzbänder und
wendet die Verstärkungsreduzierung an, die den Bedingungen
des aktuellen Klangs entspricht. In Kombination mit
NoiseBlock und dynamische Aktivierung über SoundFlow
agieren beide Algorithmen im Einklang und sind auf ihre
jeweiligen Stärken feinabgestimmt.
Ist ein Paar Hörgeräte besser als zwei einzelne Hörgeräte?
Die Antwort ist mit der Phonak Spice Generation ein
eindeutiges Ja. Durch die geschickte Kombination eines
binauralen direktionalen Vorteils mit fortschrittlichen
drahtlosen Optionen und Breitband-Audioübertragung wurde
eine Weltneuheit in der Hörgerätebranche geschaffen.
Ein einziges omnidirektionales Mikrofon erfasst den Klang aus
allen Richtungen, und durch das Hinzufügen eines zweiten
Mikrofons kommt die Direktionalität hinzu. Die Akustiktheorie
besagt, dass je höher die Anzahl der verfügbaren Mikrofone ist,
desto höher ist der Pegel der Direktionalität (Brandstein and
Ward, 2001)3. Allerdings gibt es ein Problem, wenn man ein
Hörgerät mit mehreren Mikrofonen ausstatten will, da es
hierdurch größer würde. Daher war die Frage für die Techniker
V1.00/2011-01•4/4
von Phonak, wie man ein weiteres Mikrofon hinzufügen kann,
ohne das Gerät größer zu machen.
Die Techniker von Phonak denken auch gerne unkonventionell.
Daher wurde ihnen bewusst, dass ja bereits ein anderes
Mikrofon für einen binauralen Träger verfügbar war - nämlich
das Gerät im anderen Ohr. Dort befanden sich nicht nur 2
zusätzliche Mikrofone, sondern der große Abstand zwischen
den Geräten trug auch beträchtlich zur Tiefton-Direktionalität
bei, siehe Abbildung 4.
Abbildung 4 – Verbesserung beim Direktivitätsindex mit StereoZoom
Diese Multimikrofon-Konfiguration selbst war aber noch nicht
alles. Damit die kontralateralen Mikrofone zur Direktionalität
beitragen können, muss das gesamte Audiosignal von beiden
Geräten für die integrierte Verarbeitung verfügbar sein. Diese
Fähigkeit war von Phonak glücklicherweise schon für die
Plattform der vorherigen Generation eingeführt worden CORE. Diese Fähigkeit ermöglicht binaurale Funktionen wie
ZoomControl und DuoPhone in CORE Produkten. Durch die
Verarbeitungsleistung von Spice wurde StereoZoom mit
verbesserter
Sprachverständlichkeit
und
reduzierter
Höranstrengung möglich, wie klinische Tests belegen (Phonak
AG, 2010)4. StereoZoom ist ein klassisches Beispiel dafür, dass
das Ganze mehr ist als die Summe seiner Teile.
Übersicht
Die Phonak Spice Generation zeigt, was mit einem
ganzheitlichen Innovationskonzept möglich ist. Mit einem Teil
dieser Plattform, dem Spice Chipsatz, wird eine Vielzahl an
Signalverarbeitungsfunktionen harmonisch dirigiert und den
Trägern ein unvergleichlicher Hörgenuss geboten. Dieses
Phonak Insight bietet nur einen Vorgeschmack auf das, was
Spice alles ermöglicht.
Literaturhinweise
1
Nyffeler M: Software seeks to provide seamless adaptation
to changing soundscapes. Hear J 2009:62(10):43-45
2
Phonak AG: FlexControl – Individualizing automatic
performance. Field Study News Sept 2010
3
Brandstein M, and Ward D. 2001. Microphone Arrays –
Signal Processing Techniques. Berlin: Springer-Verlag
4
Phonak AG: StereoZoom – Improvements with directional
microphones. Field Study News Sept 2010
©Phonak AG Alle Rechte vorbehalten
nächste Entwicklung im Bereich der adaptiven MehrkanalMultimikrofontechnologie.
Der SNR-Boost ist eine räumliche Störgeräuschunterdrückung,
und wird zusammen mit UltraZoom, dem Phonak Multimikrofonsystem, eingesetzt. Im Gegensatz zur zeitbasierten
Störgeräuschauslöschung NoiseBlock, konzentriert er sich auf
die Richtung des eingehenden Klangs, siehe Abbildung 3.