Notebookcheck
, , , , , ,
zu verknüpfen.
, , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,
 

Google-KI kann Einzelstimmen aus einer Menschenmenge herausfiltern

Google-KI kann Einzelstimmen aus einer Menschenmenge herausfiltern
Google-KI kann Einzelstimmen aus einer Menschenmenge herausfiltern
Menschen können unter gewissen Anstrengungen Stimmen aus einer Menschenmenge heraushören, insbesondere wenn dabei, wie beim sogenannten „Cocktailparty-Phänomen“, für sie besonders relevante Begriffe, wie der eigene Name, fallen. Computer können dies bisher weniger gut, eine neue Google-KI beweist das Gegenteil und verspricht viele sinnvolle, aber auch beunruhigende Anwendungsfälle.
Christian Hintze,
, , , , , ,
zu verknüpfen.
, , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,
 

Beim Cocktailparty-Phänomen hören Menschen aus dem Stimmgewirr einer Party plötzlich ihren eigenen Namen heraus und auch sonst sind Menschen in der Lage bewusst Stimmen aus Menschenmengen herauszufiltern. Einer von Google entwickelten Deep-Learning-Engine gelingt dies nun auch, teilweise sogar deutlich besser als dem Menschen.

Die Künstliche Intelligenz kann spezifische Audiospuren von Personen isolieren, indem sie die Gesichter beim Sprechen anschaut und auswertet. Das Entwicklerteam trainierte das künstliche neuronale Netzwerk zunächst darin individuelle Sprecher zu erkennen, wenn diese alleine sprechen. Daraufhin kreierten sie virtuelle Parties, inklusive Hintergrundgeräusche, um der KI das Isolieren von mehreren Stimmen in separate Audio Tracks beizubringen.

Die Ergebnisse sind erstaunlich, wie sich gut anhand des Videos nachvollziehen lässt. Selbst wenn Personen direkt gegeneinander ansprechen, schafft es die KI beide Stimmen in einer separaten Audiospur abzulegen. Das klappt selbst dann, wenn das Gesicht des Sprechers temporär abgedeckt wird, bspw. durch ein Mikrofon.

Die möglichen Anwendungsfälle liegen auf der Hand: Das Entwicklerteam spricht von den Möglichkeiten u.a. bei Videotelefonaten in lauter Umgebung, wo die Technik dabei helfen könnte die lauten Geräusche zu blockieren. Aber natürlich dürfte eine ganz andere Industrie ebenfalls Gefallen an der Technik finden: Bei der Überwachung von Personen wäre eine Aufzeichnung verschiedener, klarer Audiospuren je Person natürlich extrem hilfreich.

, , , , , ,
zu verknüpfen.
, , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,
 
static version load dynamic
Loading Comments
Diesen Artikel kommentieren / Antworten
Christian Hintze
Christian Hintze - Managing Editor - 1628 Artikel auf Notebookcheck veröffentlicht seit 2016
Ein C64 markierte meinen Einstieg in die Welt der PCs. Mein Schülerpraktikum verbrachte ich in der Reparaturabteilung eines Computerladens, zum Abschluss durfte ich mir aus “Werkstattresten” einen 486er PC selbst zusammenbauen. Folglich begann ich später ein Informatikstudium an der Humboldt-Uni in Berlin, Psychologie kam hinzu. Nach meiner ersten Arbeit als wissenschaftlicher Mitarbeiter an der Uni ging ich für ein Jahr nach London und arbeitete für Sega an der Qualitätssicherung von Computerspielübersetzungen, u.a. an Spielen wie Sonic & All-Stars Racing Transformed oder Company of Heroes. Seit 2017 schreibe ich für Notebookcheck.
Teilen Sie diesen Artikel um uns zu unterstützen. Jeder Link hilft!
> Notebook Test, Laptop Test und News > News > Newsarchiv > News 2018-04 > Google-KI kann Einzelstimmen aus einer Menschenmenge herausfiltern
Autor: Christian Hintze, 13.04.2018 (Update: 13.04.2018)