DE | EN
Sitemap | Impressum
web2.0 Diaspora Vimeo Wir in der taz Wir bei Mastodon A-FsA Song RSS Twitter Youtube Unsere Artikel bei Tumblr Unsere Bilder bei Flickr Aktion FsA bei Wikipedia Spenden Facebook Bitmessage Spenden über Betterplace Zugriff im Tor-Netzwerk https-everywhere
20.09.2018 Spracherkennung als Open Source verfügbar

Echtzeitanwendungen für die Spracherkennung möglich

Spracherkennung durch Computer wird langfristig nicht mehr wie bisher von Amazon, Google und Microsoft dominiert. Es gibt nun eine erste Version einer freien Spracherkennung. Mozilla hat das als Deep Speech bezeichnete Projekt in Version 0.2 bereitgestellt.

Das Projekt hat gegenüber den proprietären Lösungen bei den Internetgiganten mehrere Vorteile:

  • es ist unabhängig von einer Internetverbindung, die Spracheingaben werden auf dem lokalen System analysiert und ausgegeben,
  • es ist Open Source, Jede/r kann nachsehen, wo und wie welche Daten verarbeitet werden,
  • und einen Vorteil für "Bastler", das Programm ist in beliebigen Anwendungen nutzbar.

Insbesondere der erste Vorteil, der Unabhängigkeit vom Internet war längst überfällig. Android, Amazon und Microsoft haben immer behauptet, die Rechenleistung zur Sprachanalyse reiche auf dem lokalen Gerät nicht aus. Dabei liefen Spracherkennungsprogramme, wie IBM Voice Type und Natural Speaking bereits in den 90-iger Jahren auf Windows XP leidlich gut. Warum sollte so etwas auf Smartphones mit 1,5GHz Prozessor nicht funktionieren?

Mozilla zeigt nun, dass es geht. Auch die umfangreichen Sprachdaten konnten weiter komprimiert werden, so dass das neue trainierte Modell, das Mozilla zur Weiterverwendung unter einer freien Lizenz bereitstellt, nun nur noch rund 180 MByte groß ist. Auch die maximale Speicherbelastung konnte von 12 GByte auf nur noch 264 MByte RAM verkleinert werden.

Auch das hinderliche "erst ausreden, dann übersetzen"-Modell konnte wesentlich verbessert werden. Die Verarbeitung der Spracheingabe sowie die Anwendung des trainierten Modells - das Inferencing - ist nun nicht nur schneller als das Sprachsample lang ist, sondern das neue Modell kann das Inferencing auch schon während der Aufnahme der Sprachdaten beginnen.

Auf Github steht nun die Version 0.2 und der englische "Sprachschatz" deepspeech-0.2.0-models.tar.gz zum Download zur Verfügung. Hoffen wir auf einen baldigen deutschen "Sprachschatz".

Mehr dazu bei https://www.golem.de/news/deep-speech-0-2-mozillas-spracherkennung-wird-kleiner-und-kann-echtzeit-1809-136645.html
und https://github.com/mozilla/DeepSpeech/releases/tag/v0.2.0


Kommentar: RE: 20180920 Spracherkennung als Open Source verfügbar

Android, Amazon und Microsoft haben immer behauptet, die Rechenleistung zur Sprachanalyse reiche auf dem lokalen Gerät nicht aus.
Ist schon seltsam, dass Apple das nicht behauptet und die Spracherkennung auf dem mobilen Gerät macht, was dann nur noch die erkannten Worte überträgt und nicht mehr die Audiodatei.

iRas., 20.09.2018 14:09


RE: 20180920 Spracherkennung als Open Source verfügbar

Jo in der Tat. Auf jeden Fall denke ich das ein privater smarter Assistent auf FOSS Basis in greifbare Nähe rückt, ein Gerät über das der Benutzer die Kontrolle behält.

Ra., 20.09.2018 14:20


RE: 20180920 Spracherkennung als Open Source verfügbar

Es gibt nun eine erste Version einer freien Spracherkennung.
ähm, es gibt schon zwei open source projekte. leider fallen mir die namen nicht ein. eins gibt es aufjedenfall. heißt "simon" oder so ähnlich.

Ru., 20.09.2018 14:22


RE: 20180920 Spracherkennung als Open Source verfügbar

http://www.simon-listens.org

Ra., 20.09.2018 19:00


RE: 20180920 Spracherkennung als Open Source verfügbar

schön das es das projket noch gibt.

Go., 20.09.2018 19:05


RE: 20180920 Spracherkennung als Open Source verfügbar

https://sourceforge.net/projects/speech2text
Das Problem ist das Spracherkennung doch mehr ist als Simon. Es geht darum normale Sprache zu verstehen und darauf zu reagieren.

Ra., 20.09.2018 19:36


RE: 20180920 Spracherkennung als Open Source verfügbar

glaubst du das wollen die entwickler nicht?

Go., 20.09.2018 19:40


RE: 20180920 Spracherkennung als Open Source verfügbar

Doch sicher. Nur es wäre nicht das erste Mal das sich ein Projekt schon länger mit was abmüht und dann einfach von einen anderen Projekt mit besseren Ansätzen überholt wird. Gerade bei verkrusteten Strukturen ist es oft einfacher und effektiver ein neues Projekt zu starten, anstatt bei einen bestehenden Projekt für Veränderung zu kämpfen.

Ra., 20.09.2018 19:57


RE: 20180920 Spracherkennung als Open Source verfügbar

genau, aber "simon" hat natürlich nicht das kapital wie mozilla, die ja auch oft die daten der user dafür absaugt!

Go., 20.09.2018 20:01


RE: 20180920 Spracherkennung als Open Source verfügbar

Jap damit hast Du auch wieder recht.

Ra., 20.09.2018 20:07


RE: 20180920 Spracherkennung als Open Source verfügbar

Kenn mich nicht so aus aber könnte das in ROMs wie LineageOS integriert werden oder zumindest als App die Features zur Verfügung stellen?

Ch., 22.09.2018 15:23


RE: 20180920 Spracherkennung als Open Source verfügbar

Von den Werten her sollte das gehen und so wie ich den Text verstehe, ist das auch geplant.
Allerdings sind schon bestehende Lösungen oft etwas ungenau. Ob Mozillas "Deep Speech" oder "Simon" Qualitativ mithalten können oder besser sind und was eine Implementierung auf mobilen Endgeräten mit der Akkulaufzeit macht, müsste man ausprobieren.
Diese beiden Punkte dürften m.E. nämlich ausschlaggebend dafür sein, ob sich die Lösungen durchsetzen können oder ob sie Außenseiterprojekte bleiben, die nur von Nerds und Verschwörungstheoretikern genutzt werden.

Ti., 22.09.2018 17:32


RE: 20180920 Spracherkennung als Open Source verfügbar

danke für die Antwort. Die bestehenen Server/Cloud-Dienste nutze ich eigentlich nicht. Aber wenn es am Gerät funktionieren würde, würde ich wohl damit experimentieren. Cortana hab ich mal ausführlicher gestestet. Wäre eigentlich ganz fein, wenn man viel Text diktieren will.

Ch., 22.09.2018 19:56


RE: 20180920 Spracherkennung als Open Source verfügbar

nicht vergessen, in smartphones sind immernoch blackbox chips wo keiner weiss was die tun.

Ru., 22.09.2018 20:03


RE: 20180920 Spracherkennung als Open Source verfügbar

Naja wir wissen schon weitgehend was sie tun. Das Problem ist das sie keiner kontrollieren kann. Sprich wir wissen nicht was in ihrer FIrmware enthalten ist bzw. aus der Ferne im Notfall auch ohne Wissen und gegen den Willen des Users nachgerüstet werden kann. Dazu kommt noch einiges an unfreien Code auf das es nach wie vor keinen Zugriff gibt.

Ra., 03.10.2018 19:13


RE: 20180920 Spracherkennung als Open Source verfügbar

Naja wir wissen schon weitgehend was sie tun.
wenn wir wissen würden was sie tun, dann könnte man es eindämmen.

Ru., 03.10.2018 19:15


RE: 20180920 Spracherkennung als Open Source verfügbar

ok, nicht immer

Ru., 03.10.2018 19:17


RE: 20180920 Spracherkennung als Open Source verfügbar

Eben wir können es nicht immer eindämmen. Und das was machbar ist kommt bei der breiten Masse nicht an weil es entweder zu komplex ist und/oder weil die breite Masse die Technik absolut unkritisch nutzt.

Ra., 03.10.2018 19:20


RE: 20180920 Spracherkennung als Open Source verfügbar

There are open source alternatives (https://alternativeto.net/software/google-translate/?license=opensource) to Google Translate. Apertium (https://www.apertium.org/) is most promising one, but right now it supports only a few languages. That is beside some good proprietary alternatives to Google Translate, which are DeepL (https://www.deepl.com/translator) and PROMT Translator (http://www.online-translator.com/), there is hope for good open source alternative in a later date.

So., 09.11.2018 21:05


Kategorie[21]: Unsere Themen in der Presse Short-Link dieser Seite: a-fsa.de/d/2Xv
Link zu dieser Seite: https://www.aktion-freiheitstattangst.org/de/articles/6626-20180920-spracherkennung-als-open-source-verfuegbar.html
Link im Tor-Netzwerk: http://a6pdp5vmmw4zm5tifrc3qo2pyz7mvnk4zzimpesnckvzinubzmioddad.onion/de/articles/6626-20180920-spracherkennung-als-open-source-verfuegbar.html
Tags: #Transparenz #OpenSource #Spracheingabe #Mozilla #Spracherkennung #Ergonomie #Verbraucherdatenschutz #Datenschutz #Datensicherheit # #Amazon #Google #Android #Microsoft
Erstellt: 2018-09-20 09:17:11
Aufrufe: 6324

Kommentar abgeben

Für eine weitere vertrauliche Kommunikation empfehlen wir, unter dem Kommentartext einen Verweis auf einen sicheren Messenger, wie Session, Bitmessage, o.ä. anzugeben.

Geben Sie bitte noch die im linken Bild dargestellte Zeichenfolge in das rechte Feld ein, um die Verwendung dieses Formulars durch Spam-Robots zu verhindern.

CC Lizenz   Mitglied im European Civil Liberties Network   Bundesfreiwilligendienst   Wir speichern nicht   World Beyond War   Tor nutzen   HTTPS nutzen   Kein Java   Transparenz in der Zivilgesellschaft

logos Mitglied im European Civil Liberties Network Creative Commons Bundesfreiwilligendienst Wir speichern nicht World Beyond War Tor - The onion router HTTPS - verschlüsselte Verbindungen nutzen Wir verwenden kein JavaScript Für Transparenz in der Zivilgesellschaft