Fraunhofer IDMT, HSA
Abstract:
Eine unangestrengte Kommunikation in lauten Umgebungen oder die berührungslose Sprachbedienung von Maschinen
sind wünschenswerte Eigenschaften moderner Industriearbeitsplätze.
Für die technisch unterstützte Sprachinteraktion zwischen Werkern in Industrieumgebungen oder zwischen Werkern und
Produktionsmaschinen ist eine robuste Erkennung der Eigensprache (engl.: Own Voice Detection, OVD) notwendig.
Dieser Beitrag untersucht die Entwicklung und Evaluierung eines Algorithmus zur Erkennung der Eigensprache innerhalb
eines Gehörschutzes.
Die Entwicklung geeigneter Algorithmen zur OVD wurde für ein spezielles Earpiece durchgeführt, welches mit nach innen
und außen gerichteten Mikrofonen ausgestattet ist. Das technische Equipment des Earpiece ermöglichte die Aufzeichnung
von Eigensprache am und im Gehörgang. Durch diese Mikrofonsignale konnten geeignete Merkmale zur Erkennung von
Eigensprache extrahiert werden. Mithilfe etablierter Verfahren, die auf dem Realteil der Kohärenz, dem Self-to-Other-Ratio
und Kurzzeitpegeln basieren, wurde untersucht, welche Mikrofonsignale besonders für die OVD-Erkennung geeignet sind.
Zusätzlich wurde untersucht, ob eine Verbesserung der OVD-Erkennung durch die Nutzung von Machine Learning und
charakteristischen Merkmalen erzielt werden kann.
In der Evaluation wurden die unterschiedlichen Algorithmen für verschiedene akustische Situationen und Bedingungen
untersucht und miteinander
verglichen.