Verarbeitung der Phonak Spice Generation
Transcrição
Verarbeitung der Phonak Spice Generation
Verarbeitung der Phonak Spice Generation Eine neue Generation von Geräusch-Klassifikation und Direktionalität Ist größer oder kleiner besser? Hierzu kann man natürlich keine eindeutige Antwort geben, da auch die allgemeine Dimension in Betracht gezogen werden muss, auf die sich diese Frage bezieht. Ein Bereich, in dem größer und mehr mit Sicherheit besser ist, ist die Verarbeitungsleistung einer Phonak Plattform. Sie ist die technologische Grundlage einer Generation von Hörsystemen inklusive des dazugehörigen Chipsatzes, der Signalverarbeitungsfunktionen, des mechanischen Designs und der Anpasssoftware. Die neue Plattform der Phonak Spice Generation bietet eine doppelt so hohe Verarbeitungsleistung wie die CORE Plattform der vorherigen Generation. Diese zusätzliche Leistung wurde bereits von der ersten Welle der Spice Hörsysteme geboten und stellt die Ausgangsbasis für fortschrittliche Klangverarbeitung und innovative Hörsysteme dar. Kann es so etwas wie zu viel Verarbeitungsleistung geben? Haben Sie jemals jemanden sagen hören, „danke, aber mein Computerprozessor ist eigentlich schnell genug. Sie können die zusätzlichen Gigahertz behalten. Ach ja, und ich habe auch genug Speicherplatz.“ Wenn Sie gerade dabei sind, können Sie auch die Festplatte mit zusätzlichen 100 Gigabyte zurückgeben. So etwas bekommt man nie zu hören. Als das Spice Entwicklungsteams damit begann, Methoden zur Leistungsverbesserung zu entwickeln, die sich für Träger und Hörgeräteakustiker gleichermaßen eignen, reagierten die Phonak Hardware-Techniker darauf sehr schnell mit dem Entwurf einer neuen Plattform, die eine doppelt so hohe Verarbeitungsleistung wie CORE bietet. Ausgehend von dieser soliden Grundlage und einer gemeinsamen Vision, führte die weitere Zusammenarbeit des gesamten globalen Forschungsund Entwicklungsteams von Phonak zu der bahnbrechenden neuen Spice Plattform. Oft ist die beste Methode, etwas Neues schätzen zu lernen, der Vergleich mit einem bereits vorhandenen Referenzobjekt. Abbildung 1 zeigt die Evolution der wichtigsten physikalischen Dimensionen der letzten 3 Phonak Plattformen. Die Anzahl der Transistoren steigt mit jeder Plattformgeneration an und die Struktur tendiert nach unten. Je mehr Transistoren verfügbar V1.00/2011-01•1/4 sind, desto mehr Verarbeitung ist möglich. Je dünner die Struktur ist, desto mehr Komponenten können auf dem Mikrochip untergebracht werden und desto weniger Energie verbraucht der Mikrochip für dieselbe Verarbeitungsaufgabe. Abbildung 1 - Evolution der wichtigsten physikalischen Dimensionen Abbildung 1 zeigt ein ähnliches Bild für einige der wichtigsten Verarbeitungsdimensionen. Der fast verdoppelte MOPS-Wert (million operations per second) von Spice im Vergleich zu CORE bedeutet, dass der Chip der neuen Generation doppelt so viel leistet. Abbildung 1 - Evolution der wichtigsten Verarbeitungsdimensionen Phonak Hörsysteme sind wirkliche Vorreiter, wenn es um die Nutzung aller Vorteile der zugrundeliegenden Plattformkomponenten geht, auf denen sie basieren. ©Phonak AG Alle Rechte vorbehalten Einleitung Erkennung der Klassifikation der Klangumgebung Stellen Sie sich einmal die Premierenvorstellung in einem Konzertsaal vor, und dies insbesondere aus der Perspektive von drei verschiedenen Personen im Zuschauerraum. Zunächst ist da der Platzanweiser, der den Gästen ihre Plätze zeigt. Er ist in den zehn Minuten vor dem Heben des Vorhangs extrem beschäftigt, aber es gibt immer Gäste, die zu spät kommen und noch nach Veranstaltungsbeginn zu ihren Plätzen müssen. Es ist wichtig, dass der Platzanweiser einen verspäteten Gast deutlich versteht, damit Störungen des bereits sitzenden Publikums möglichst vermieden werden. Denken Sie jetzt einmal an eine zweite Person, eine Musikliebhaberin mit einem Konzert-Abonnement. Sie geht besonders gern zu Premieren und genießt die erste perfekte Vorstellung nach wochenlangen Proben. Die dritte Person, der Beleuchter, hat sicherzustellen, dass der Scheinwerfer immer auf den Sänger gerichtet ist. Er befindet sich direkt über den Lautsprechern und muss mit dem dröhnenden Klang fertigwerden und gleichzeitig die genaue Ausrichtung des Scheinwerfers beibehalten. Auch wenn dies zuerst wie ein und dieselbe Klangumgebung aussieht, ist sie doch für jede Person sehr unterschiedlich, und vor allem hat jede Person eine andere Hörabsicht. Die Spice Verarbeitung bietet eine hochentwickelte Geräuschklassifikation und intuitive Lernfunktionen, mit denen sich die Hörabsicht eines Trägers genauestens auf aktuelle Klangumgebung abstimmen lässt. Ist Genauigkeit dasselbe wie Präzision? Die Hörgeräte der Phonak Spice Generation genießen das Privileg einer bisher unvorstellbaren Verarbeitungsfähigkeit. Eines der zahlreichen Merkmale der Spice Klangverarbeitung, das diese Fähigkeit fördert, ist die Klassifikation der Klangumgebung durch die SoundFlow Automatik, welche für alle Phonak Hörgeräte erhältlich ist (Nyffeler, 2009)1. Die meisten modernen Hörgeräte ermöglichen eine gute und genaue Klassifikation der grundlegenden Klangumgebungen. Jedoch stellt die Präzision dieser Klassifikation, eine höhere Herausforderung dar. Die SoundFlow Klassifikation durch den Spice Chipsatz erfolgt durch die Berechnung von 46 verschiedenen Parametern des eingehenden Klangs, beispielsweise SNR, Tieftonbereiche, Onsets und spektrale Dämpfung. Diese Parameter werden dann analysiert, weiter kombiniert und auf einen Punkt in einem 3D-Klangmodel projiziert, das die vier in Abbildung 3 gezeigten Klangbereiche enthält: Ruhige Situation, Sprache bei Störgeräuschen, Störgeräusche und Musik. Wenn ein Punkt innerhalb eines der Klangbereiche liegt, wird er als zu 100% mit dieser Klangumgebung verbunden angenommen, und das ungemischte Basisprogramm für diese Umgebung wird verwendet. Wenn der Punkt nicht in einem der Bereiche liegt, wird die Klassifikation der Klangumgebung V1.00/2011-01•2/4 mit Hilfe eines Gesetzes der Anziehung berechnet. Diese Methode liefert eine natürliche Zuordnung einer Klangumgebung im 3D-Klangmodell und somit eine genauere, zuverlässigere und schnellere Klassifikation des eingehenden Klangs. Abbildung 3 Hochauflösendes, mehrdimensionales GeräuschKlassifikationssystem, das von SoundFlow für eine präzise und nahtlose, automatische Anpassung verwendet wird. Falls diese Berechnungen noch nicht komplex genug klingen, so berücksichtigt das SoundFlow Umgebungsanalysesystem jetzt auch Raumklangunterschiede. Das bedeutet, dass die Analyse die Richtung einbezieht, der ein Träger zugewendet ist. Somit wird im Konzertsaal Sprache von rücksichtslosen Zuhörern, die hinter der Musikliebhaberin sitzen, zu Recht als Hintergrundgeräusche behandelt und daher bei der Klassifikation als „Sprache im Störgeräusch“ betrachtet. Diese Präzisionsklassifikation wird ständig in Echtzeit neu berechnet, so dass SoundFlow für jeden Moment ein optimales Mischprogramm zusammenstellen kann, das auf den verschiedenen Basisprogrammen aufbaut. Desweiteren sind die Übergänge zwischen diesen Mischprogrammen so sanft, dass man sie nicht einmal wahrnimmt. Wachsendes Verständnis für Hörgeräte Die präzise Klassifikation der Klangumgebung in Echtzeit scheint sehr beeindruckend zu sein, aber um einen messbaren Vorteil für den Träger zu bieten, muss auch seine Hörabsicht berücksichtigt werden. Durch die Spice-Verarbeitung wächst das Verständnis für Hörgeräte, die sich zusammen mit ihren Trägern entwickeln. FlexControl, eine bahnbrechende Innovation in der SpiceVerarbeitung in Bezug auf intelligente Anwenderinteraktion, ermöglicht, durch Berücksichtigung der Hörabsicht des Trägers, die Anpassung in Bezug auf mehr Klarheit und höherem Komfort. Zurück im Konzertsaal – Die Hörabsicht des Platzanweisers ist, Sprache bei beträchtlichen ©Phonak AG Alle Rechte vorbehalten Dieses Phonak Insight untersucht einige der Innovationen im Bereich der Signalverarbeitung, die jetzt dank dieses Sprungs in der Verarbeitungsleistung verfügbar sind. Hintergrundgeräuschen zu verstehen, die Absicht der Musikliebhaberin ist, ein möglichst angenehmes Musikerlebnis zu genießen, und der Beleuchter sucht nach etwas Ruhe in einer extrem lauten Situation, damit er sich auf seine Arbeit konzentrieren kann. Die einfache Erhöhung/Reduzierung der Verstärkung ist nur insofern für den Träger nützlich, da er dadurch seine Hörabsicht ausdrückt. FlexControl führt intelligente Anpassungen sowohl für die Verstärkung (Hörverlust, gewünschte Frequenzgang- und Lautstärkestufen) als auch für die Klangbereinigung (direktionale Einstellung, Windgeräusch-Management, Reduktion von Hintergrundgeräuschen und Echoauslöschung) durch. Validierungsergebnisse zeigen, dass FlexControl unter allen Klangbedingungen im Vergleich zu einer herkömmlichen Lautstärkeregelung insgesamt bessere Leistungen erbringt (Phonak AG, 2010)2. Die Self Learning Funktion bringt die SoundFlow GeräuschKlassifikation und die multidimensionalen FlexControl Parameter zusammen. Diese Konvergenz von interaktiver Steuerung und automatischer Anpassung bietet dem Träger eine neue Dimension der Hörgerätsteuerung. In diesem Szenario würde eine Steuerung, die einen durchschnittlichen Zeitfaktor berechnet, zuerst die Verstärkung erhöhen, wodurch sich ein beträchtlicher Überschuss ergäbe, bevor schließlich die angemessene Kompression wie durch die graue Linie in Abbildung 2 angewendet würde. Die Phonak Spice Verarbeitung vermeidet solche Fallen, die sich auf andere Systeme auswirken können, indem sie die Erkennung des Eingangspegels von der Berechnung der spektralen Verstärkung trennt. Durch die in beiden Wegen hundertfach pro Sekunde stattfindende Berechnung der Parameter werden die spektralen Hinweise genauer reproduziert, um sich an ständig wechselnde Klangumgebungen anzupassen. So wird der angemessene Kompressionspegel sofort angewendet, was darin resultiert, dass kein Verstärkungsüberschuss entsteht, siehe grüne Linie in Abbildung 2. Für die Premierenvorstellung bedeutet dies, dass der Beleuchter die gewaltigen Eröffnungsklänge komfortabel erleben und sich dennoch weiterhin auf seine Arbeit konzentrieren kann. Zweiwege-Kompression in Zusammenarbeit V1.00/2011-01•3/4 Abbildung 2 - Anpassungen der Verstärkung über längere Zeiträume als Reaktion auf einen abrupten Anstieg der Signalintensität Dieses einzigartige adaptive Zweiwege-Kompressionssystem ist auch im SoundFlow integriert, so dass die Verstärkungssteuerung sowohl zeit- als auch situationsspezifisch reagiert. Je nach Situation werden automatisch die Zeitkonstanten ausgewählt, die die beste Signalübertragung mit der geringsten Verzerrung liefern. Dies führt zu sofortigen und reibungslosen automatischen Anpassungen, so dass selbst die abruptesten Änderungen der Klangumgebung effizient ohne Verzerrungen oder Artefakte verarbeitet werden. Direktionalität ist eine Leidenschaft von Phonak Phonak war schon immer ein Vorreiter in der direktionalen Mikrofontechnologie. Die Spice Plattform setzt die Messlatte der Branche durch zwei wegweisende Innovationen im Bereich Direktionalität erneut ein gutes Stück höher. Direktionale Störgeräuschauslöschung wird räumlich Normalerweise wird der Algorithmus zur StörgeräuschUnterdrückung unabhängig vom Mikrofonmodus immer auf dieselbe Art und Weise angewendet – basierend auf temporalen Hinweisen. Im Direktionalmodus ist die Quelle von Interesse jedoch bekannt, so dass ein anderer Ansatz angewendet werden kann – UltraZoom mit SNR-Boost ist die © Phonak AG All rights reserved Moderne digitale Signalprozessoren in Hörgeräten verwalten und steuern hunderte von Parametern. In vielen Fällen beeinflussen diese Parameter sich gegenseitig, teilweise auch negativ. Was einen effektiven Signalprozessor hervorhebt, ist die Kunst, hunderte verschiedener Parameter zu harmonisieren, um Artefakte und interne Interferenzen zu vermeiden. Selbst in einem so gut entwickelten Bereich wie der Signalverarbeitung als Kompression gehört die Beachtung der Details zu den wichtigsten Aufgaben, um dem Träger höchste Klarheit und größtmöglichen Komfort zu bieten. Das Bedürfnis, schnell und akkurat auf verschiedene Situationen zu reagieren, bedeutet, dass Kompressionssysteme häufig eine ZweiwegeStrategie einsetzen, wobei ein Weg eine langsam wirkende und der andere eine schnell wirkende Verstärkungssteuerung bietet. Jedoch kann der schnell wirkende Weg mit seinen kurzfristigen Konstanten die Amplitudenfluktuationen des Originalsignals verzerren, und der langsam wirkende Weg kann die Reaktionsfähigkeit bei der Verwaltung plötzlicher, unangenehmer lauter Geräusche beschränken. Einige Hörgerätehersteller setzen ein Verfahren ein, in dem beide Kompressionswege direkt gesteuert werden, indem über einen längeren Zeitraum ein Durchschnittswert für das Eingangssignal ermittelt wird. Diese Einstellung ist möglicherweise nicht ideal. Denken wir noch einmal an die Premiere im Konzertsaal zurück und an den Moment, in dem die Vorstellung dann tatsächlich beginnt. Die Lichter gehen aus und das Tuscheln im Publikum verstummt. Der Scheinwerfer des Beleuchters ist auf das Orchester gerichtet, das darauf wartet, vom Dirigenten zum Leben erweckt zu werden. Mit einer kleinen Bewegung des Taktstocks überflutet das Orchester in perfekter Harmonie den Konzertsaal mit dem Eröffnungsakkord. In diesem Moment ist der Beleuchter schutzlos diesem plötzlichen akustischen Angriff ausgesetzt. Herkömmliche Direktionalität UltraZoom mit SNR-Boost Abbildung 3 - Herkömmliche Direktionalmikrofone verstärken alles, was sich innerhalb des Richtstrahls befindet, auch unerwünschte Störgeräusche. UltraZoom mit SNR-Boost unterdrückt effektiv Störgeräusche und verbessert gleichzeitig den SNR für die von vorn kommende Sprache. NoiseBlock analysiert Klangvariationen über einen längeren Zeitraum über mehrere Frequenzbänder und reduziert dabei die Verstärkung für verschiedene Frequenzbänder, sobald Störgeräusche erkannt werden. Im Gegensatz dazu analysiert SNR-Boost die Eintreffrichtung des Klangs, und wenn ein Zielgeräusch von vorne erkannt wird, reduziert er die Verstärkung für Klänge, die aus der hinteren Hemisphäre stammen. Im Gegensatz zu den meisten Systemen zur Störgeräuschauslöschung hält er die Zielklänge von vorne genauer und führt eine detailliertere Auswahl der Störgeräusche von hinten durch. Und das auch, wenn die Störgeräusche Sprache beinhalten. Natürlich agiert SNRBoost auch individuell für verschiedene Frequenzbänder und wendet die Verstärkungsreduzierung an, die den Bedingungen des aktuellen Klangs entspricht. In Kombination mit NoiseBlock und dynamische Aktivierung über SoundFlow agieren beide Algorithmen im Einklang und sind auf ihre jeweiligen Stärken feinabgestimmt. Ist ein Paar Hörgeräte besser als zwei einzelne Hörgeräte? Die Antwort ist mit der Phonak Spice Generation ein eindeutiges Ja. Durch die geschickte Kombination eines binauralen direktionalen Vorteils mit fortschrittlichen drahtlosen Optionen und Breitband-Audioübertragung wurde eine Weltneuheit in der Hörgerätebranche geschaffen. Ein einziges omnidirektionales Mikrofon erfasst den Klang aus allen Richtungen, und durch das Hinzufügen eines zweiten Mikrofons kommt die Direktionalität hinzu. Die Akustiktheorie besagt, dass je höher die Anzahl der verfügbaren Mikrofone ist, desto höher ist der Pegel der Direktionalität (Brandstein and Ward, 2001)3. Allerdings gibt es ein Problem, wenn man ein Hörgerät mit mehreren Mikrofonen ausstatten will, da es hierdurch größer würde. Daher war die Frage für die Techniker V1.00/2011-01•4/4 von Phonak, wie man ein weiteres Mikrofon hinzufügen kann, ohne das Gerät größer zu machen. Die Techniker von Phonak denken auch gerne unkonventionell. Daher wurde ihnen bewusst, dass ja bereits ein anderes Mikrofon für einen binauralen Träger verfügbar war - nämlich das Gerät im anderen Ohr. Dort befanden sich nicht nur 2 zusätzliche Mikrofone, sondern der große Abstand zwischen den Geräten trug auch beträchtlich zur Tiefton-Direktionalität bei, siehe Abbildung 4. Abbildung 4 – Verbesserung beim Direktivitätsindex mit StereoZoom Diese Multimikrofon-Konfiguration selbst war aber noch nicht alles. Damit die kontralateralen Mikrofone zur Direktionalität beitragen können, muss das gesamte Audiosignal von beiden Geräten für die integrierte Verarbeitung verfügbar sein. Diese Fähigkeit war von Phonak glücklicherweise schon für die Plattform der vorherigen Generation eingeführt worden CORE. Diese Fähigkeit ermöglicht binaurale Funktionen wie ZoomControl und DuoPhone in CORE Produkten. Durch die Verarbeitungsleistung von Spice wurde StereoZoom mit verbesserter Sprachverständlichkeit und reduzierter Höranstrengung möglich, wie klinische Tests belegen (Phonak AG, 2010)4. StereoZoom ist ein klassisches Beispiel dafür, dass das Ganze mehr ist als die Summe seiner Teile. Übersicht Die Phonak Spice Generation zeigt, was mit einem ganzheitlichen Innovationskonzept möglich ist. Mit einem Teil dieser Plattform, dem Spice Chipsatz, wird eine Vielzahl an Signalverarbeitungsfunktionen harmonisch dirigiert und den Trägern ein unvergleichlicher Hörgenuss geboten. Dieses Phonak Insight bietet nur einen Vorgeschmack auf das, was Spice alles ermöglicht. Literaturhinweise 1 Nyffeler M: Software seeks to provide seamless adaptation to changing soundscapes. Hear J 2009:62(10):43-45 2 Phonak AG: FlexControl – Individualizing automatic performance. Field Study News Sept 2010 3 Brandstein M, and Ward D. 2001. Microphone Arrays – Signal Processing Techniques. Berlin: Springer-Verlag 4 Phonak AG: StereoZoom – Improvements with directional microphones. Field Study News Sept 2010 ©Phonak AG Alle Rechte vorbehalten nächste Entwicklung im Bereich der adaptiven MehrkanalMultimikrofontechnologie. Der SNR-Boost ist eine räumliche Störgeräuschunterdrückung, und wird zusammen mit UltraZoom, dem Phonak Multimikrofonsystem, eingesetzt. Im Gegensatz zur zeitbasierten Störgeräuschauslöschung NoiseBlock, konzentriert er sich auf die Richtung des eingehenden Klangs, siehe Abbildung 3.