Einsprechen für Common Voice (freie Spracherkennung)

Hallo zusammen, sicherlich kennt ihr Stimmerkennung von Siri und Google Assitant. Nur leider gibt es keine gute freie / offene Lösung dafür.

Nunja “fast”! Denn Mozilla erstellt mit Common Voice eine Sammlung von Sprach-Samples, an denen freie Software üben kann. Doch damit das gut funktioniert, brauchen wir möglichst viele unterschiedliche Sprecher!
Vielleicht hat ja die deutsche Podcast-Szene Lust uns zu unterstützen? https://voice.mozilla.org

Das greifbare Ergebnis ist dann z.B. die Spracherkennung Deepspeech und kann wiederum genutzt werden, um freie Assistenten wie Siri zu bauen. Zum Beispiel mycroft. Und wer weiß, vielleicht können wir in zwei Jahren ja bereits Podcasts transkripiren?

P.S: Insbesondere fehlen noch Sprachschnipsel von Frauen! Das wäre echt ein Problem, wenn dieses deutlich schlechter erkannt werden, nur weil sich dort bisher mehr Männer stärker vertreten sind :frowning:

3 „Gefällt mir“

Ok 1300h Audiomaterial wurden bereits gesammelt!
Habt vielen Dank dafür! :bouquet::fireworks::partying_face:


https://blog.mozilla.org/press-de/2019/02/28/common-voice-mozilla-veroeffentlicht-den-bisher-groessten-oeffentlichen-transkribierten-sprachdatensatz/

2 „Gefällt mir“

Im Amerikanischen Englisch sind bereits >3000h zusammengekommen. Für Deutsch sind wir noch bei 325h: https://voice.mozilla.org/de/datasets

Wer also den freien Communities noch ein kleines Geschenk machen möchte, kann ja noch ein paar Sätze einsprechen oder korrektur-hören.

1 „Gefällt mir“

Für Deutsch sind bisher 538h zusammengekomen:

Es sind derzeit nur 9% von Frauen eingesprochen, da besteht also noch ein großes Defizit! Am besten also anmelden, Details angeben und ein paar Sätze einsprechen :slight_smile:

:raising_hand_woman::woman_health_worker::woman_student::woman_teacher::woman_judge::woman_farmer::woman_cook::woman_mechanic::woman_factory_worker::woman_office_worker::woman_scientist::woman_technologist::woman_singer::woman_artist::woman_pilot::woman_astronaut::woman_firefighter::policewoman::female_detective::construction_worker_woman::woman_with_headscarf::breast_feeding::woman_superhero::woman_mage::dancer::running_woman::swimming_woman::mountain_biking_woman::woman_in_lotus_position:

Einige haben es bestimmt bereits gehört, dass Mozilla einige finanzielle Probleme bekommen hat. Die Zukunft der CommonVoice Sammlung und Deepspeech ist also etwas ungewiss.

Man darf aber Version 0.9 der Deepspeech Spracherkennung für Englisch bewundern, welche auf der englischen Sammlung von CommonVoice basiert.

List man dort genauer, entdeckt man leider genau das Problem, was durch einseitiges Training zustande kommt:

Note that the model currently performs best in low-noise environments with clear recordings and has a bias towards US male accents . This does not mean the model cannot be used outside of these conditions, but that accuracy may be lower.

Das Problem ist leider auch für den deutschen Datensatz noch sehr ausgeprägt, den es sind nur ca. 10% Frauen dabei.

Vielleicht bietet die aktuelle Situtation mit Corona ja die Möglichkeit, dass hier die Diversität noch erhöht wird und ihr habt noch Ideen, wie mehr Stimmen von Frauen, Kinder, Senioren, … beim Auto-Fahren, in der Stadt, … aufgenommen werden können, immer zu :slight_smile:

1 „Gefällt mir“

Wer die neue Version 0.9 der Erkennung für Deutsch einmal testen möchte, kann das fertige Modell übrigens hier herunterladen: https://github.com/AASHISHAG/deepspeech-german

Mit CV Project gibt es jetzt eine nette (inoffizielle) Android-App von Saverio Morelli, mit der man unterwegs immer ein paar Sätze einsprechen kann, wenn es mal langweilig ist. Eine schöne Möglichkeit, auch soundclips mit Nebengeräuschen zu bekommen :smile_cat:

1 „Gefällt mir“

Wow, es fehlen nur noch 10h bis wir die 1000h deutsches Sprachmaterial fertig haben! :rocket:
Na dann mal los! Gerne wird auch noch Hilfe bei der Bestätigung von fremden Sprachschnipseln angenommen :smiley:

2 „Gefällt mir“

Wow es sind tatsächlich 1000h bestätigt worden und schon 1200h eingesprochen. Darunter zunehmend auch nicht männliche Stimmen die nicht unbedingt zwischen 20…30 Jahren zu sein scheinen :smiley:

Habt vielen Dank für das Engagement! :handshake: :tada: :trophy: