ComputerClub 2
Sitemap Kontakt
  Wolfgang Back & Wolfgang Rudolph
Suche:   Wolfgang Back & Wolfgang Rudolph
  Aktuelle Sendung
  Nächste Sendung
  Sendungsarchiv
  Downloads


SENDUNGSARCHIV

03.12.2012
Folge 345

Aussterbende Sprachen

Sprachen leben nicht nur in der realen Welt, sondern auch in Computern. Allerdings sind viele dieser Spezies vom Aussterben bedroht. Wissenschaftler haben 30 der etwa 80 europäischen Sprachen untersucht. In der Sprachtechnologie sind davon 21 gefährdet.

Sprachtechnologie ist Software, die Sprache – in geschriebener oder gesprochener Form – verarbeitet oder generiert. Bekannte Beispiele für Anwendungen, die sprachtechnologische Komponenten enthalten, sind Textverarbeitungen und Mailprogramme (Rechtschreibkontrolle, Grammatiküberprüfung), automatische Übersetzungsprogramme, persönliche Assistenten in Smartphones (z.B. Siri im iPhone), automatische Dialogsysteme für Auskünfte oder Buchungen per Telefon, Suchmaschinen im Web und synthetische Stimmen in Navigationssystemen.

Also ist Sprachtechnologie heute im Alltag angekommen. Beispielsweise dem Schreiben von Emails oder dem Buchen von Flügen. Ohne uns dessen bewusst zu sein, profitieren wir von Sprachtechnologie, wenn wir Webseiten suchen oder übersetzen, die Rechtschreib- oder Grammatikkontrolle einer Textverarbeitung benutzen, den Bordcomputer im Auto oder unser Smartphone mit Sprachbefehlen steuern, in einem Online- Shop Empfehlungen bekommen oder den gesprochenen Anweisungen eines Navigationssystems folgen. Schon bald werden wir uns sowohl mit Computerprogrammen als auch mit Maschinen und Haushaltsgeräten unterhalten können. Wo auch immer wir uns aufhalten werden, wenn wir eine Information benötigen – wir werden einfach danach fragen, sobald wir Hilfe brauchen. Computer und Smartphone werden in der Lage sein, die Frage zu analysieren und bestmöglich zu reagieren. Der Wegfall der Kommunikationsbarriere zwischen Mensch und Maschine wird unsere Welt verändern.


Die untersuchten Sprachen und die Einordnung in die Gefährdungsstufen

Derzeit basieren sprachtechnologische Komponenten und Systeme vornehmlich auf statistischen Methoden, die immens große Datenmengen geschriebener oder gesprochener Sprache benötigen. Gerade für Sprachen mit vergleichsweise wenigen Sprechern ist es oftmals sehr schwierig, diese Datenmengen im benötigten Umfang zu sammeln. Zudem unterliegen statistische Verfahren inhärenten Grenzen, was ihre Qualität betrifft, wie man z.B. an den oftmals amüsanten fehlerhaften Übersetzungen sehen kann, die von Online-Übersetzungsprogrammen erzeugt werden.

Deswegen, so meinen die Wissenschaftler werden die meisten europäischen Sprachen in der digitalen Welt unter Umständen nicht überleben.Durchgeführt wurde die Studie von META-NET, einem europäischen Netzwerk, in dem 60 Forschungszentren in 34 Ländern an den technologischen Grundlagen für ein multilinguales Europa arbeiten.

Die Studie, erstellt von mehr als 200 Experten aus Wissenschaft und Industrie, dokumentiert und beurteilt in den 30 Bänden der META-NET White Paper Serie für jede der untersuchten Sprachen die sprachtechnologische Unterstützung in vier Anwendungsgebieten: automatische Übersetzung, Erkennung und Generierung gesprochener Sprache sowie Textanalyse und Verfügbarkeit von Sprachressourcen. Insgesamt 21 der 30 Sprachen (70%) wurden von den Experten mindestens einmal in die schlechteste Kategorie „Unterstützung ist schwach oder nicht-existent“ eingeordnet. Mehrere Sprachen, zum Beispiel Isländisch, Litauisch und Maltesisch, erhalten diese Bewertung in allen vier Gebieten. Nur das Englische wurde mit „guter Unterstützung“ bewertet, gefolgt von Sprachen wie Niederländisch, Französisch, Deutsch, Italienisch und Spanisch mit „moderater Unterstützung“. Sprachen wie Baskisch, Bulgarisch, Katalanisch, Griechisch, Ungarisch und Polnisch zeigen nur „fragmentarische Unterstützung“, womit auch sie in die Gruppe von Hochrisiko-Sprachen eingeordnet werden müssen. Jedes White Paper wurde in der Sprache verfasst, über die es berichtet und beinhaltet eine vollständige englische Übersetzung.

Die META-NET Language White Paper Serie „Europe’s Languages in the Digital Age“:
http://www.meta-net.eu/whitepapers
Die deutsche Sprache im digitalen Zeitalter:
http://www.meta-net.eu/whitepapers/volumes/german




zurück zum Archiv
Anhören:


Audiodatstream
Download 128 Kbit/s (~27 MB)
Download 32 Kbit/s (~7 MB)
Ogg Vorbis 56 Kbit/s (~12 MB)
RSS Feed (Audiocast, letzte 5 Sendungen)
RSS Feed (Audiocast, alle Sendungen)

Druckversion Impressum Haftungsausschluss