|
Projekt Common Voice stellt Sprachsamples gemeinfreiVor einem halben Jahr haben wir gejubelt: "Spracherkennung durch Computer wird langfristig nicht mehr wie bisher von Amazon, Google und Microsoft dominiert." Nun sind wir einen Schritt weiter, denn das Projekt Common Voice von Mozilla hat nun den Datensatz für 18 Sprachen aus 1.400 Stunden Sprachsamples von mehr als 42.000 Beitragenden veröffentlicht. Die Datensätze stehen unter der CC-0-Lizenz und sind damit praktisch gemeinfrei. Bei den Sprachen sind natürlich Englisch, Französisch, Deutsch und Mandarin-Chinesisch aber auch Sprachen mit einem vergleichsweise sehr kleinen Sprecherkreis, wie Walisisch oder die Berbersprache Kabylisch. Durch die große Anzahl von Sprechern in Bezug auf Herkunft, Alter, Geschlecht oder auch Akzent sollen die Spracherkennungssysteme, die auf Common Voice aufbauen wie Mozillas eigenes Deep-Speech-Projekt, besser und gezielter trainiert werden können. Auf Github steht seit einem halben Jahr die Version 0.2 und der englische "Sprachschatz" deepspeech-0.2.0-models.tar.gz zum Download zur Verfügung. Mehr dazu bei https://www.aktion-freiheitstattangst.org/de/articles/6626-20180920-spracherkennung-als-open-source-verfuegbar.htm Category[21]: Unsere Themen in der Presse Short-Link to this page: a-fsa.de/e/31E Link to this page: https://www.aktion-freiheitstattangst.org/de/articles/6809-20190301-spracherkennung-als-open-source-waechst.html Link with Tor: http://a6pdp5vmmw4zm5tifrc3qo2pyz7mvnk4zzimpesnckvzinubzmioddad.onion/de/articles/6809-20190301-spracherkennung-als-open-source-waechst.html Tags: #Sprachdateien #Transparenz #OpenSource #Spracheingabe #Mozilla #Spracherkennung #Ergonomie #Verbraucherdatenschutz #Datenschutz #Datensicherheit # #Amazon #Google #Android #Microsoft Created: 2019-03-01 09:02:09 Hits: 1006 Leave a Comment |
CC license European Civil Liberties Network Bundesfreiwilligendienst We don't store your data World Beyond War Use Tor router Use HTTPS No Java For Transparency |