|
Echtzeitanwendungen für die Spracherkennung möglichSpracherkennung durch Computer wird langfristig nicht mehr wie bisher von Amazon, Google und Microsoft dominiert. Es gibt nun eine erste Version einer freien Spracherkennung. Mozilla hat das als Deep Speech bezeichnete Projekt in Version 0.2 bereitgestellt. Das Projekt hat gegenüber den proprietären Lösungen bei den Internetgiganten mehrere Vorteile:
Insbesondere der erste Vorteil, der Unabhängigkeit vom Internet war längst überfällig. Android, Amazon und Microsoft haben immer behauptet, die Rechenleistung zur Sprachanalyse reiche auf dem lokalen Gerät nicht aus. Dabei liefen Spracherkennungsprogramme, wie IBM Voice Type und Natural Speaking bereits in den 90-iger Jahren auf Windows XP leidlich gut. Warum sollte so etwas auf Smartphones mit 1,5GHz Prozessor nicht funktionieren? Mozilla zeigt nun, dass es geht. Auch die umfangreichen Sprachdaten konnten weiter komprimiert werden, so dass das neue trainierte Modell, das Mozilla zur Weiterverwendung unter einer freien Lizenz bereitstellt, nun nur noch rund 180 MByte groß ist. Auch die maximale Speicherbelastung konnte von 12 GByte auf nur noch 264 MByte RAM verkleinert werden. Auch das hinderliche "erst ausreden, dann übersetzen"-Modell konnte wesentlich verbessert werden. Die Verarbeitung der Spracheingabe sowie die Anwendung des trainierten Modells - das Inferencing - ist nun nicht nur schneller als das Sprachsample lang ist, sondern das neue Modell kann das Inferencing auch schon während der Aufnahme der Sprachdaten beginnen. Auf Github steht nun die Version 0.2 und der englische "Sprachschatz" deepspeech-0.2.0-models.tar.gz zum Download zur Verfügung. Hoffen wir auf einen baldigen deutschen "Sprachschatz". Mehr dazu bei https://www.golem.de/news/deep-speech-0-2-mozillas-spracherkennung-wird-kleiner-und-kann-echtzeit-1809-136645.html Kommentar: RE: 20180920 Spracherkennung als Open Source verfügbar Android, Amazon und Microsoft haben immer behauptet, die Rechenleistung zur Sprachanalyse reiche auf dem lokalen Gerät nicht aus. iRas., 20.09.2018 14:09 RE: 20180920 Spracherkennung als Open Source verfügbar Jo in der Tat. Auf jeden Fall denke ich das ein privater smarter Assistent auf FOSS Basis in greifbare Nähe rückt, ein Gerät über das der Benutzer die Kontrolle behält. Ra., 20.09.2018 14:20 RE: 20180920 Spracherkennung als Open Source verfügbar Es gibt nun eine erste Version einer freien Spracherkennung. Ru., 20.09.2018 14:22 RE: 20180920 Spracherkennung als Open Source verfügbar http://www.simon-listens.org Ra., 20.09.2018 19:00 RE: 20180920 Spracherkennung als Open Source verfügbar schön das es das projket noch gibt.Go., 20.09.2018 19:05 RE: 20180920 Spracherkennung als Open Source verfügbar https://sourceforge.net/projects/speech2text Ra., 20.09.2018 19:36 RE: 20180920 Spracherkennung als Open Source verfügbar glaubst du das wollen die entwickler nicht? Go., 20.09.2018 19:40 RE: 20180920 Spracherkennung als Open Source verfügbar Doch sicher. Nur es wäre nicht das erste Mal das sich ein Projekt schon länger mit was abmüht und dann einfach von einen anderen Projekt mit besseren Ansätzen überholt wird. Gerade bei verkrusteten Strukturen ist es oft einfacher und effektiver ein neues Projekt zu starten, anstatt bei einen bestehenden Projekt für Veränderung zu kämpfen. Ra., 20.09.2018 19:57 RE: 20180920 Spracherkennung als Open Source verfügbar genau, aber "simon" hat natürlich nicht das kapital wie mozilla, die ja auch oft die daten der user dafür absaugt! Go., 20.09.2018 20:01 RE: 20180920 Spracherkennung als Open Source verfügbar Jap damit hast Du auch wieder recht. Ra., 20.09.2018 20:07 RE: 20180920 Spracherkennung als Open Source verfügbar Kenn mich nicht so aus aber könnte das in ROMs wie LineageOS integriert werden oder zumindest als App die Features zur Verfügung stellen? Ch., 22.09.2018 15:23 RE: 20180920 Spracherkennung als Open Source verfügbar Von den Werten her sollte das gehen und so wie ich den Text verstehe, ist das auch geplant. Ti., 22.09.2018 17:32 RE: 20180920 Spracherkennung als Open Source verfügbar danke für die Antwort. Die bestehenen Server/Cloud-Dienste nutze ich eigentlich nicht. Aber wenn es am Gerät funktionieren würde, würde ich wohl damit experimentieren. Cortana hab ich mal ausführlicher gestestet. Wäre eigentlich ganz fein, wenn man viel Text diktieren will. Ch., 22.09.2018 19:56 RE: 20180920 Spracherkennung als Open Source verfügbar nicht vergessen, in smartphones sind immernoch blackbox chips wo keiner weiss was die tun. Ru., 22.09.2018 20:03 RE: 20180920 Spracherkennung als Open Source verfügbar Naja wir wissen schon weitgehend was sie tun. Das Problem ist das sie keiner kontrollieren kann. Sprich wir wissen nicht was in ihrer FIrmware enthalten ist bzw. aus der Ferne im Notfall auch ohne Wissen und gegen den Willen des Users nachgerüstet werden kann. Dazu kommt noch einiges an unfreien Code auf das es nach wie vor keinen Zugriff gibt. Ra., 03.10.2018 19:13 RE: 20180920 Spracherkennung als Open Source verfügbar Naja wir wissen schon weitgehend was sie tun. Ru., 03.10.2018 19:15 RE: 20180920 Spracherkennung als Open Source verfügbar ok, nicht immer Ru., 03.10.2018 19:17 RE: 20180920 Spracherkennung als Open Source verfügbar Eben wir können es nicht immer eindämmen. Und das was machbar ist kommt bei der breiten Masse nicht an weil es entweder zu komplex ist und/oder weil die breite Masse die Technik absolut unkritisch nutzt. Ra., 03.10.2018 19:20 RE: 20180920 Spracherkennung als Open Source verfügbar There are open source alternatives (https://alternativeto.net/software/google-translate/?license=opensource) to Google Translate. Apertium (https://www.apertium.org/) is most promising one, but right now it supports only a few languages. That is beside some good proprietary alternatives to Google Translate, which are DeepL (https://www.deepl.com/translator) and PROMT Translator (http://www.online-translator.com/), there is hope for good open source alternative in a later date. So., 09.11.2018 21:05 Category[21]: Unsere Themen in der Presse Short-Link to this page: a-fsa.de/e/2Xv Link to this page: https://www.aktion-freiheitstattangst.org/de/articles/6626-20180920-spracherkennung-als-open-source-verfuegbar.html Link with Tor: http://a6pdp5vmmw4zm5tifrc3qo2pyz7mvnk4zzimpesnckvzinubzmioddad.onion/de/articles/6626-20180920-spracherkennung-als-open-source-verfuegbar.html Tags: #Transparenz #OpenSource #Spracheingabe #Mozilla #Spracherkennung #Ergonomie #Verbraucherdatenschutz #Datenschutz #Datensicherheit # #Amazon #Google #Android #Microsoft Created: 2018-09-20 09:17:11 Hits: 6303 Leave a Comment |
CC license European Civil Liberties Network Bundesfreiwilligendienst We don't store your data World Beyond War Use Tor router Use HTTPS No Java For Transparency |