

Offline Umsetzung von Sprachaufzeichnungen in Text
Wofür ist das notwendig?
Auf meinen Solo-Wanderungen hatte ich das Bedürfnis, meine Gedanken festzuhalten, um später darüber berichten zu können. Notizen auf Papier oder elektronischen Geräten erschienen mir zu umständlich, wenn ich abends im Dunkeln im Zelt liege und den Kopf freibekommen möchte. Alle meine PDAs und Smartphones boten eine Aufnahmefunktion und irgendwie würde ich daraus später schon Text machen können. So stapelten sich jahrelang unangehörte Textnachrichten auf meinen Geräten.
Erst Jahre später merkte ich, daß das Niederschreiben dieser Sprachmitschnitte sehr umständlich ist und einen Haufen Zeit frißt. Meist hatte ich nur leise in das Mikrophon gesprochen, weil ich keine Aufmerksamkeit erregen wollte. Häufig pfiff der Wind oder es gab andere Umgebungsgeräusche, wie knirschender Kies unter den Sohlen. Die Aufnahmen waren sehr schlecht ausgesteuert und meine Stimme kaum zu hören. Es brauchte viel Konzentration und Ausdauer, die Aufzeichnungen eines Urlaubs niederzuschreiben.
Eigentlich hatte ich insgeheim schon immer gehofft, diese Aufgabe durch Software abgenommen zu bekommen. Im März 2018 hatte ich Gelegenheit, Nuance Dragon Pro 15 auszuprobieren, ein Programm, das aus allen Tests in Fachzeitschriften immer als Klassenbester hervorgegangen war. Zur Kalibrierung auf meine Stimme war ein 15-minütiges Vorlesen eines Referenztextes erforderlich. Das Resultat war verheerend! Kaum ein Wort wurde richtig erkannt, dafür war der Text gefüllt mit Phantasiebegriffen. Ich habe die Kalibrierung noch mehrmals wiederholt, mit guten Mikrophonen und auch mit dem PDA, mit dem die Sprachaufnahmen erstellt wurden. Nichts half.
Ich mußte mich damit abfinden, daß ich eine Stimme habe, die nicht automatisch transkribiert werden kann. Bis 2024 habe ich diese Arbeit vollständig von Hand erledigt. Es kamen zwar Online-Dienste auf, die ich bei Freunden testen konnte und die meine Beispielsätze ordentlich in Text umgewandelt haben, aber die Geschäftsbedingungen dieser Dienste sind für mich nicht akzeptabel. Ich möchte nicht, daß meine Texte für irgendwas weiterverwendet werden, selbst wenn der fertige Bericht hinterher im Internet erscheint und für jeden zu lesen ist.
Test von noScribe
Im Januar 2025 bin ich auf noScribe von Kai Dröge gestoßen, ein Programm, das eine KI (Künstliche Intelligenz) auf einem lokalen Rechner laufen läßt. Ich war neugierig, was das kann. Das Programm war schnell auf meinem Spielerechner mit Ryzen-6-Kern-Prozessor und RTX 3060 Grafikkarte installiert. Vom CUDA-Programmbundle von NVIDIA genügt es, nur die Runtime zu installieren. Der andere Kram kann draußen bleiben.
Nach der Auswahl von Sprache (deutsch), Qualität (precise) und Anzahl der Sprecher (1) konnte ich sofort mit der Konvertierung des ersten Samples loslegen. Weil ich jeden meiner 180 Sprachschnipsel separat laden mußte und auch jedesmal ein neuer Ausgabedateiname einzugeben war, zog sich die Konvertiererei über zwei Tage hin. Hier liegt noch viel Verbesserungspotential, z. B. daß der Name der Textdatei automatisch aus dem Namen der Tondatei abgeleitet wird. Oder noch besser: ein Batch-Modus. Das Format des Ton-Samples spielt keine Rolle. MP3, WAV und OGG werden akzeptiert. Die Konvertierung meiner wenige Megabyte großen Dateien dauern jeweils nur eine Minute.
Wie sieht nun das Ergebnis aus? Ich habe als Beispiel eine Datei aus meinem Madeira-Urlaub 2017 nochmal mit noScribe bearbeitet, die ich 2018 schon mit Nuance Dragon Pro 15 konvertiert hatte. Wer die Fakten checken will, kann das Destillat des Audioschnipsels in diesem Wanderbericht nachlesen. Es ist der 29.11.2017. Der Bericht ist abends leise im Zelt ins Mikro eines Motorola XT1068 gesprochen, mit einigen Denkpausen, in denen ich die Ereignisse rekapituliere. Das ist nie für die direkte Veröffentlichung gedacht gewesen, deshalb spare ich mir, die Tondatei hier einzubauen. Mitten im Sprechen tauchen zwei freche Spatzen vor meinem Zelt auf, die mich aus dem Konzept bringen und denen ich einige Sätze widme. Die Aussteuerung der Datei liegt bei höchstens 10%, es gibt allerdings keine Hintergrundgeräusche.
Nuance Dragon Pro 15
noScribe 0.5
Gegessen dich lassen die Berge Swing bin ich heute früh um sieben schneller klingenden Energie durch den schon eingesandte Samstagen meinen richtigen mich wirklich gebührend gefressen finanzielles Fruchtangebot, um die Wohnung eines stattfindet wie seelisch einzustampfen, dann bin ich in der Atelier gestern noch vorhandenen einfach vom Hotel über die Straße, die Treppen runter hinterlegen :-) Haltestellen ein, 9:10 Uhr soll der Bus von gebundenen 30 nach Portmonees dieser Schmerz eingenommen und einmal am Tag verteilt über den mit der das Signal nur dieser mindestens ganze einfach wieder ins getürkte kann Walter einfach gewisse Wortformen zu Mitnahme anstellen. Ihrer ist durch ihn sehr einfach zu sein, das man in Bremen anhält, auch nicht so einfach, ja, ich würde dann also ein Dauer Sexmo Simon 9:25 Uhr, noch den Booster pünktlich und in der deutsche Touristen wird im Gespräch zu verwickeln, auch dann, endlich einen Generaloberst vor auf die Straße gesprungen ist er ein Held müsse mich hier die Presse einhalten Major einander Zwänge unterwegs, also noch als aus dünnem Termin in Palma und teilte ihnen in regulärer Frau war nur die zweite Pause war, versucht noch mal zur Tankstelle zugehen. Richtig große Tankstelle mit Wartungsteilen in allen Schweiß und auf vielen Graskanistern windig, wollte Honeckers Kartusche hatten sie nicht wissen jetzt schön in der Bilanz C Tankstellen zwei große Supermärkte in großer Sportladen sind unzählige kleine Läden der Weges im relativ weit bisher hoch zur Spezialkiste Partnerfirma ewig daraufhin immer zunächst sofort erst 12:45 Uhr wurden in den Bergen nie 11:45 Uhr zustimmen und die Jungs hatten mir renitente beschrieben Kiosken der Rucksacktablett mittendrin ersetzen können. Junges antworten können, noch den nachgefragte Honeckers Kartusche hat eine rechtliche Mittel Smith in Verbindung bisher auch der eine nicht nur Kaffee entgegen eingelöst 45 aus mehr wie dem auch sei, binnen also in den Weg eingestiegen. Zum höchsten Berg der Insel, dem Heil den höchsten Berg, damit sich die Wanderung so vorstellen wie eine Treppe mit zehn Teilen Stufen, vielleicht weil die ganze Zeit sehr steil geht immer nur Treppenstufen und Treppenstufen Treppenstufen. Als erstes werden komplett nur ohne Unterbrechung ab und zu ist, sonst den Absatz in der Trip mit Merkels Brigade heiß, aber das meiste ist Treppenreiterei mehr als sie sie nicht mein Ding des Schlauch zünden kein schönes erstens wäre Manowar nur noch easy und Ihrer Frau gemerkt. Ein schönes doch immer immer langsamer oder in den dritten ansonsten eine gut abgesicherte Tumor und macht eingespeisten kommt und der Regen, weil im Gebirge gerade erst vorbei. Da war also am Anfang noch die Gefahr des Landstreicher Enders machen, aber am Anfang war alles gut ausgeschnitten, dass die Sträucher, die nicht berühren müsste hinzukommende einüben. Vorbei war es noch runter tropft dann das und einen Pfleglingeelchen, wobei Torbogenscans zur selben relativ zügig schön geworden der Praxis bei 1000 900 fordern irgendwann mal auf 1500 auf 1046 gegründet werden. Wäre man quer Zippel Modelle runter und am Schluss muss man halt die Kraft entwickelt Julia 1870 so in etwa meterhoch kurz vorher gibt's Import Klitoris und müssen immer formalen Stellen angeguckt. Auf mögliche Zeltplätze, aber diesem Plateau geht von Hartwig in General Klima wegen Bushs Saison ab und dauern Zeltplatz. Der war einfach zu verlockend. Derwischtension 16:00 Uhr diesmal beschlossen, aufzuhören, scrollen folgender über mein Spatz über Menzel drüber und seine Kompagnon wird erste Teil. Dahinter braune Jahr Eisen entschieden wir Ihnen mit diesen Riesen war frei abgebrannt und Platz für vielleicht fünf Zelte schönen Wind geschützt durch seine niedrig wachsenden Sicherheit und die einzelnen Entgegennahme Unterrichts links steht in hoher Felsen als Hirngewebe gibt. Ich meine stop einschlägt Zelt hinein erreicht ziemlich neugierig Himmelzelte aufgestellt und Hingabe befreundet interessiert. Grundlose belastet werden. In diesem Vögelchen gehen heißt Krümel mit putzen allerdings ersichtliche Korken hinterlassen besser herangetreten ist eine Felsformation in erster Linie Festungsrennfahrer seine angestrahlt wurden, verschwinden cool aus. Mindestens jeder Wald nur abgebrannt. Die schwarzen Bäume sind die oben liegende Seite von Böden dies Hinweisgeber, die Tunnel ist noch schwarz und Tschernobyl bezahltes werde morgen, wenn nichts dazwischen kommt noch dreieinhalb Kilometer zum Blick für die Röhren Machenschaften schon mal gesehen von dem äußersten Auslegung eines Zeltplätze Kaninchen sehen und dort werden halt auch zwei Regen geschützt hätten eingezeichnet gewesen und auch weiteren Wärmeamplitude, wozu er aber mehr noch schlimmer. Vier Schlussmann doch nicht viel machen. Neue Hartwig Maxwell Modell hält sie nach dem Wetterbericht von gestern. Seit dem zehnten Einfahrtsregelung ist morgen früh aufstehen. Nur soweit, Asthma, die Nacht ruhig. Erstaunlicherweise hatten die bei dem Norweger römische Eingangtag Windstärke endgültig ein Zimmer angeschaut, aber einer Kiste sechs in sich der Verteilung einer Kiste war auch Gegenwind meiner bestimmt schäumend geübt
Ich hatte ja gestern beschlossen, wieder in die Berge zu fahren, äh, deswegen bin ich heute früh, um sieben hab ich den Wecker klingeln lassen, schnell geduscht und schön angefangen zusammenzupacken, war dann frühstücken und hab mich wirklich kugelrund gefressen dort, (..) mir fehlt ein bisschen das Fruchtangebot, und die waren es alles, stopfend, wie soll ich reinzstopfen? (.) Ja, und dann bin ich, äh, wie mit der Hotelier gestern noch verraten hatte, einfach vom Hotel über die Straße, die Treppen runter und dann links war die Bushaltestelle und neun Uhr zehn sollte der Bus fahren. (.) Die 139 nach Porto Moniz, die ich ja schon am Anfang genommen hatte, und einmal am Tag fährt der über den Ecomedia-Pass, nämlich genau nur dieser, ansonsten ist es gar nicht so einfach, äh, wieder ins Gebirge zu kommen, weil da einfach keine Busse weiterfahren, zu irgendwelchen anderen Stellen. (.) Hier raus zu, schien es sehr einfach zu sein, dass man einfach jemanden anhält, aber reinzu, vielleicht nicht so einfach. (...) Ja, ich warte dann also, und da war es sechs Uhr, äh, sieben Uhr, neun Uhr, 25, war immer noch kein Bus da, versucht mich irgendeine deutsche Touristin dort im Gespräch zu verwickeln, (.) aber dann kam er endlich, und er hielt einen anderen Bus vorher, deswegen bin ich dann auf die Straße gesprungen, dass der ja anhält, man muss nämlich hier die Busse einhalten. Na ja, dann hat er zweimal unterwegs Pause gemacht, also allerstunde muss er zehn Minuten Pause machen, und ich hatte ihn in, äh, Ribeira Brava, wo die zweite Pause war, mal versucht nochmal zur Tankstelle zu gehen, da war eine richtig große Tankstelle mit, äh, Wartungshallen und allen Scheiß, und auch vielen Gaskanistern, und ich wollte auch mal eine Gaskartusche, und hatten sie nicht, ne, also es sind jetzt schon in der Bilanz zwei Tankstellen, zwei große Supermärkte, ein großer Sportladen und unzählige kleine Läden. (..) Der Weg ist eben relativ weit bis hier hoch, also speziell an der Küste braucht er schon mal ewig immer, da von einem Ort zum nächsten zu kommen. (.) Und so war ich erst zwölf Uhr 45 hier oben in den Bergen, nee, elf Uhr 45, elf Uhr 45 stimmt, und die Jungs hatten mir hier so eine kleine Hütte beschrieben, also ein Kiosk haben die immer gesagt, aber da hätte man schon drinnen sitzen können und irgendwas abwarten können, und auch den hab ich gefragt, ob er eine Gaskartusche hat, weil der vielleicht ein bisschen mit Tourismus in Verbindung ist hier, aber auch der hatte nichts. (..) Ja, wollte mir Kaffee anbieten, aber ich wollte eigentlich los. (........) Ja, elf Uhr 45 war es glaube ich, oder zwölf Uhr war es schon. (.) Naja, wie dem auch sei, bin dann also in den Weg eingestiegen zum höchsten Berg der Insel, (...) dem, halt dem höchsten Berg. (..) Und man muss sich die Wanderung so vorstellen wie eine Treppe mit zehntausend Stufen vielleicht, (.) weil die ganze Zeit, es ist so steil, es geht immer nur Treppenstufen und Treppenstufen und Treppenstufen, also die ersten 200 Meter komplett nur ohne Unterbrechung und ab und zu ist auch mal so ein kleiner Absatz in der Treppe, geht es mal ein kleines bisschen gerade aus, aber das meiste ist Treppenlatscherei. (..) Naja, das ist sowieso nicht so mein Ding und es schlaucht schon ganz schön, also die ersten Stunden, aber irgendwie merke ich dann schön, dass ich doch immer langsamer werde an den Treppen. (..) Ja, ansonsten eine gut abgesicherte Tour und macht eigentlich Spaß. Man kommt dort, der Regen war ja hier im Gebirge gerade erst vorbei, da war also am Anfang noch (.) die Gefahr, dass die nassen Sträucher einen nass machen, aber am Anfang war alles gut ausgeschnitten, dass die Sträucher, dass man die nicht berühren musste und ab und zu kommt man so an Überhängen vorbei, wo es noch runter tropft, dann wird ein bisschen nass (..) und an so kleinen Höhlchen kommt man vorbei und im Torbogen, naja, das ist ganz nett so. Also ich habe relativ zügig Höhen gewonnen, der Pass ist bei 1000 und ich war dann irgendwann auf 1500, dann kommt man auf 1600, dann geht es wieder ein Stück runter 200 Meter und man quert so ein bisschen, immer ein bisschen hoch und runter und am Schluss muss man halt auf den Pico di Rua 1870 so in etwa Meter hoch. (...) Kurz vorher gibt es so ein paar Plateaus und ich hatte mir schon immer vorher mal so Stellen angeguckt auf mögliche Zeltplätze, aber auf diesem Plateau geht vom Hauptweg in den (.) kleinen Weg in den Busch sozusagen ab und da war ein Zeltplatz, der war einfach zu verlockend. (..) Da habe ich dann schon 16 Uhr diesmal beschlossen aufzuhören, da ist gerade ein Vogel hier über meinen, so ein riesen fetter Spatz über mein Zelt drüber und sein Kompanion, also der ist total bunt und dahinter ist noch einer, ein brauner. (...) Ja, ich habe also entschieden, in der Mitte ist ein riesen Lagerfeuer schon abgebrannt und das Platz für vielleicht so fünf Zelte, schön windgeschützt durch seine niedrig wachsenden Büsche halt und, naja, die kommen ja richtig ans Zelt und picken irgendwas. (..) Und rechts und links steht in hoher Felsen, also falls es hier ein Gewitter gibt, dann hoffe ich mal, dass es dort einschlägt. (...) Die sind schon am Zelt, haben schon die Leine erreicht und ziemlich neugierig. (....) Ja, ich habe also mein Zelt hier aufgestellt und schon gearmbräuntet und es ist jetzt gerade noch so ein bisschen was zu sehen, eben diese Vögelchen, die den Rest Grümel wegputzen. (.) Allerdings habe ich glaube ich gar keine hinterlassen bisher. (.....) Ja, hier drüben ist eine Felsformation, die sieht aus wie eine Festung. Die ist vorhin von der Sonne angestreut worden, sieht auch schon cool aus. (.) Ansonsten ist hier der Wald mal abgebrannt und die schwarzen Bäume, also die oben liegende Seite auf dem Boden, die ist weiß geworden, die drunter ist noch schwarz und sieht schon auch ein bisschen bizarr aus. (.) Ich will also morgen, wenn nichts dazwischen kommt, noch dreieinhalb Kilometer zum Pico di Ruio machen. Ich habe mich schon mal gesehen von dem äußersten Ausleger meines Zeltplatzes hier, kann man ihn schon sehen. (..) Und dort wären halt auch zwei Regenschutzhütten eingezeichnet gewesen und auch weiter wäre noch ein Plateau gekommen oder zwei. (..) Aber naja, man kann auch schon mal einen Vierschluss machen, wenn man den ganzen Tag nicht viel gemacht hat. (..) Ja, naja, hoffe ich mal, dass das Wetter noch ein bisschen hält. Also nach dem Wetterbericht von gestern, soll es um 10 Uhr dann anfangen zu regnen morgen. (.) Das heißt, ich muss auch morgen früh aufstehen. (......) So weit erstmal. Ich hoffe mal die Nacht wird ruhig. (.) Erstaunlicherweise hatten die beim Norweger hier oben schon den ganzen Tag Windstärke 0 bis 1, haben wir angesagt, aber an der Küste 6. Ja, wir haben es uns da verteilt, weil an der Küste war auch kein Wind, weil er hier oben stimmt es auch im Moment. (....) Gut.
Die gelben Hervorhebungen sind von mir. Beide Programme geben keinerlei Bewertungen ab, für wie zutreffend sie ihre Ergebnisse halten. Kein unterkringeltes Wort, bei dem sie sich nicht sicher sind, wo man als Mensch nochmal nachhören sollte. Keine Möglichkeit, Varianten auszuwählen.
Wie beschrieben, ist das Kauderwelsch von Dragon purer Unsinn. Allenfalls der Wortreichtum ist beeindruckend. Die Transkription von noScribe kann ich als Ausgangsmaterial und Gedächtnisstütze verwenden. Ohne die Satzmelodie zu hören, sind die vielen Nebensätze schwer zu deuten. Spielt man das Sample ab und liest dazu den Text, wird sofort klar, was gemeint ist. Einige Bindeworte hat die KI durch andere ersetzt, die aber in den Rahmen passen und die ich genausogut gesagt haben könnte. Auffällig ist, daß manchmal sehr unbekümmert neue Worte erfunden werden. Teils liegt das an meiner sächsischen Aussprache, wie bei "Grümel", manchmal auch an der zu kurzen Pause zwischen zwei Worten.
Ich hoffe, daß es mit diesen Transkriptionen einfacher und angenehmer wird, das alte Material aufzuarbeiten. Dem Autor von noScribe, Kai Dröge, herzlichen Dank dafür! Bei neueren Touren bin ich von der Technik der Audioaufzeichnung wieder abgekommen und tippe lieber gleich den Text ins Handy. Eine offline Transkription für das Handy habe ich noch nicht gefunden.
