DE | EN
Sitemap | Impressum
web2.0 Diaspora Vimeo taz We at Mastodon A-FsA Song RSS Twitter Youtube Tumblr Flickr Wikipedia Donation Facebook Bitmessage Betterplace Tor-Netzwerk https-everywhere
01.03.2019 Spracherkennung als Open Source wächst
Sorry, most articles are not available in English yet

Projekt Common Voice stellt Sprachsamples gemeinfrei

Vor einem halben Jahr haben wir gejubelt: "Spracherkennung durch Computer wird langfristig nicht mehr wie bisher von Amazon, Google und Microsoft dominiert."

Nun sind wir einen Schritt weiter, denn das Projekt Common Voice von Mozilla hat nun den Datensatz für 18 Sprachen aus 1.400 Stunden Sprachsamples von mehr als 42.000 Beitragenden veröffentlicht. Die Datensätze stehen unter der CC-0-Lizenz und sind damit praktisch gemeinfrei.

Bei den Sprachen sind natürlich Englisch, Französisch, Deutsch und Mandarin-Chinesisch aber auch Sprachen mit einem vergleichsweise sehr kleinen Sprecherkreis, wie Walisisch oder die Berbersprache Kabylisch. Durch die große Anzahl von Sprechern in Bezug auf Herkunft, Alter, Geschlecht oder auch Akzent  sollen die Spracherkennungssysteme, die auf Common Voice aufbauen wie Mozillas eigenes Deep-Speech-Projekt, besser und gezielter trainiert werden können.

Auf Github steht seit einem halben Jahr die Version 0.2 und der englische "Sprachschatz" deepspeech-0.2.0-models.tar.gz zum Download zur Verfügung.

Mehr dazu bei https://www.aktion-freiheitstattangst.org/de/articles/6626-20180920-spracherkennung-als-open-source-verfuegbar.htm
und https://www.golem.de/news/common-voice-mozilla-stellt-groessten-oeffentlichen-sprachdatensatz-bereit-1902-139717.html


Category[21]: Unsere Themen in der Presse Short-Link to this page: a-fsa.de/e/31E
Link to this page: https://www.aktion-freiheitstattangst.org/de/articles/6809-20190301-spracherkennung-als-open-source-waechst.html
Link with Tor: http://a6pdp5vmmw4zm5tifrc3qo2pyz7mvnk4zzimpesnckvzinubzmioddad.onion/de/articles/6809-20190301-spracherkennung-als-open-source-waechst.html
Tags: #Sprachdateien #Transparenz #OpenSource #Spracheingabe #Mozilla #Spracherkennung #Ergonomie #Verbraucherdatenschutz #Datenschutz #Datensicherheit # #Amazon #Google #Android #Microsoft
Created: 2019-03-01 09:02:09
Hits: 1006

Leave a Comment

If you like a crypted answer you may copy your
public key into this field. (Optional)
To prevent the use of this form by spam robots, please enter the portrayed character set in the left picture below into the right field.

CC license   European Civil Liberties Network   Bundesfreiwilligendienst   We don't store your data   World Beyond War   Use Tor router   Use HTTPS   No Java   For Transparency

logos Mitglied im European Civil Liberties Network Creative Commons Bundesfreiwilligendienst We don't store user data World Beyond War Tor - The onion router HTTPS - use encrypted connections We don't use JavaScript For transparency in the civil society