ComputerClub 2
Sitemap Kontakt
  Wolfgang Back & Wolfgang Rudolph
Suche:   Wolfgang Back & Wolfgang Rudolph
  Aktuelle Sendung
  Nächste Sendung
  Sendungsarchiv
  Downloads


SENDUNGSARCHIV

14.11.2011
Folge 296

Neues Modell für Sprach- und Geräuscherkennung

Das so genannte Cocktail-Party-Problem beschäftigt Wissenschaftler schon seit Jahrzehnten. Wie gelingt es dem Gehirn aus vielen Geräuschen bekannte Stimmen herauszufiltern? Seit langem besteht die Hypothese, dass wir im Laufe des Lebens eine Art Geräusch-Bibliothek im Hörzentrum unseres Gehirns anlegen. Menschen sind Meister darin, Sinneseindrücke wie Geräusche oder Gerüche wiederzuerkennen, selbst wenn viele Reize gleichzeitig eintreffen. Wie die Zuordnung zwischen aktuellem Ereignis und Erinnerung funktioniert, ist bis heute aber weitgehend unverstanden. Wissenschaftler haben nun ein mathematisches Modell entwickelt, das genau diesen Prozess mit wenig Rechenaufwand nachbildet und bisher unverstandene experimentelle Befunde erklären könnte.

Forscher zeigen in einem neuen Modell, wie das Gehirn durch den Vergleich gespeicherter Eindrücke und wahrgenommener Reize besonders effizient Geräusche wiedererkennen kann. Bildlich gesprochen, arbeiten bisherige Modelle nach folgendem Prinzip: Ein Archivar, möglicherweise die Thalamus-Hirnregion, vergleicht das ankommende Geräusch einzeln mit den Einträgen in der Bibliothek. Als Ergebnis erhält er die Übereinstimmungsmenge mit allen Einträgen. In der Regel stimmen jedoch mehrere Einträge ähnlich gut, so dass unklar ist, welches Ergebnis das tatsächlich Richtige ist.

Anders beim neuen Modell: der Archivar vergleicht das Gehörte wieder mit den Bibliothekseinträgen. Diesmal erhält er nur wenige tatsächlich relevante Einträge und die Information, wie sehr sich Gespeichertes und Gehörtes unterschieden. Darum werden nur bei unbekannten oder wenig passenden Eingängen große Datenmengen zurückgesendet. Vielleicht ist dies auch ein Grund, weshalb wir Bekanntes besser ignorieren können als Neues. Im Test gelang es dem Modell sehr einfach, aus 400 Geräuschen mit überlappendem Frequenz-Spektrum den Klang einer Geige und einer Heuschrecke gleichzeitig herauszuhören. Rechen-  und Speicheraufwand waren wesentlich kleiner als bei vergleichbaren Modellen. Erstmals erlaubt ein auf dem Bibliothek-Prinzip basierendes Modell auf sehr effiziente Art und Weise eine Echtzeit-Implementierung, die eine Voraussetzung ist für die Nutzung im Gehirn.

Experimente hatten schon lange gezeigt, dass aus dem Großhirn viele Informationen in den Thalamus gesendet werden, ohne dass bisher dafür eine allgemein akzeptierte Erklärung vorläge. Das neue Modell sagt genau diesen Informationsfluss vorher. Abstrakte mathematische Modelle neurobiologischer Prozesse haben den Vorteil, dass stets alle einfließenden Faktoren bekannt sind. Damit kann man zeigen, ob das Modell auch in einem breiten, biologisch relevanten Anwendung-Spektrum funktioniert, wie in diesem Fall. Ihre Ergebnisse möchten die Forscher nun in weitere, mehr am biologischen Detail orientierte Modelle einfließen lassen und schließlich in psychoakustischen Experimenten testen.

Originalpublikation:
Otazu G, Leibold C (2011): A corticothalamic circuit model for sound identification in complex scenes. doi: 10.1371/journal.pone.0024270
http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0024270


zurück zum Archiv
Anhören:


Audiodatstream
Download 128 Kbit/s (~27 MB)
Download 32 Kbit/s (~7 MB)
Ogg Vorbis 56 Kbit/s (~12 MB)
RSS Feed (Audiocast, letzte 5 Sendungen)
RSS Feed (Audiocast, alle Sendungen)

Druckversion Impressum Haftungsausschluss