DE | EN
Sitemap | Impressum
web2.0 Diaspora Vimeo Wir in der taz Wir bei Mastodon A-FsA Song RSS Twitter Youtube Unsere Artikel bei Tumblr Unsere Bilder bei Flickr Aktion FsA bei Wikipedia Spenden Facebook Bitmessage Spenden über Betterplace Zugriff im Tor-Netzwerk https-everywhere
01.03.2019 Spracherkennung als Open Source wächst

Projekt Common Voice stellt Sprachsamples gemeinfrei

Vor einem halben Jahr haben wir gejubelt: "Spracherkennung durch Computer wird langfristig nicht mehr wie bisher von Amazon, Google und Microsoft dominiert."

Nun sind wir einen Schritt weiter, denn das Projekt Common Voice von Mozilla hat nun den Datensatz für 18 Sprachen aus 1.400 Stunden Sprachsamples von mehr als 42.000 Beitragenden veröffentlicht. Die Datensätze stehen unter der CC-0-Lizenz und sind damit praktisch gemeinfrei.

Bei den Sprachen sind natürlich Englisch, Französisch, Deutsch und Mandarin-Chinesisch aber auch Sprachen mit einem vergleichsweise sehr kleinen Sprecherkreis, wie Walisisch oder die Berbersprache Kabylisch. Durch die große Anzahl von Sprechern in Bezug auf Herkunft, Alter, Geschlecht oder auch Akzent  sollen die Spracherkennungssysteme, die auf Common Voice aufbauen wie Mozillas eigenes Deep-Speech-Projekt, besser und gezielter trainiert werden können.

Auf Github steht seit einem halben Jahr die Version 0.2 und der englische "Sprachschatz" deepspeech-0.2.0-models.tar.gz zum Download zur Verfügung.

Mehr dazu bei https://www.aktion-freiheitstattangst.org/de/articles/6626-20180920-spracherkennung-als-open-source-verfuegbar.htm
und https://www.golem.de/news/common-voice-mozilla-stellt-groessten-oeffentlichen-sprachdatensatz-bereit-1902-139717.html


Kategorie[21]: Unsere Themen in der Presse Short-Link dieser Seite: a-fsa.de/d/31E
Link zu dieser Seite: https://www.aktion-freiheitstattangst.org/de/articles/6809-20190301-spracherkennung-als-open-source-waechst.html
Link im Tor-Netzwerk: http://a6pdp5vmmw4zm5tifrc3qo2pyz7mvnk4zzimpesnckvzinubzmioddad.onion/de/articles/6809-20190301-spracherkennung-als-open-source-waechst.html
Tags: #Sprachdateien #Transparenz #OpenSource #Spracheingabe #Mozilla #Spracherkennung #Ergonomie #Verbraucherdatenschutz #Datenschutz #Datensicherheit # #Amazon #Google #Android #Microsoft
Erstellt: 2019-03-01 09:02:09
Aufrufe: 1006

Kommentar abgeben

Für eine weitere vertrauliche Kommunikation empfehlen wir, unter dem Kommentartext einen Verweis auf einen sicheren Messenger, wie Session, Bitmessage, o.ä. anzugeben.

Geben Sie bitte noch die im linken Bild dargestellte Zeichenfolge in das rechte Feld ein, um die Verwendung dieses Formulars durch Spam-Robots zu verhindern.

CC Lizenz   Mitglied im European Civil Liberties Network   Bundesfreiwilligendienst   Wir speichern nicht   World Beyond War   Tor nutzen   HTTPS nutzen   Kein Java   Transparenz in der Zivilgesellschaft

logos Mitglied im European Civil Liberties Network Creative Commons Bundesfreiwilligendienst Wir speichern nicht World Beyond War Tor - The onion router HTTPS - verschlüsselte Verbindungen nutzen Wir verwenden kein JavaScript Für Transparenz in der Zivilgesellschaft