Przeskocz do treści

Skrybot? Unikaj jak ognia!

Potrzebowałem rozwiązania do rozpoznawania mowy z plików .mp3 nagranych wcześniej. To ważne -- nie mówię tu bowiem o dyktowaniu na bieżąco (do czego w zupełności wystarczy telefon z Androidem i klawiaturą Google).

Przejrzałem klika rozwiązań on-line i off-line i zdecydowałem się na polskie rozwiązanie -- Skrybot. To była największa porażka, jeśli chodzi o temat.

Jeżeli szukasz rozwiązania do takiego właśnie celu -- konwersji plików .mp3 do .txt -- to naszego rodzimego rozwiązania powinieneś unikać, jak ognia! Jego zakup będzie bowiem oznaczał tylko frustrację, zmarnowany czas i pieniądze wyrzucone w błoto!

Skrybot jest reklamowany jako głównie rozwiązanie do rozpoznawania mowy w locie, czyli rodzaj inteligentnego dyktafonu. Być może potrafi to robić w miarę -- nie wiem, nie testowałem. Potrzebowałem rozwiązania do konwersji plików .mp3 do .txt, a Skrybot reklamuje się, że rzekomo nadaje się świetnie również i do tego celu.

Otóż... nie! A raczej... to zależy, jak definiujesz pojęcie "nadaje się świetnie"?

W moim przypadku program rozpoznał prawidłowo... dwa wyrazy na pięćset! Cała reszta, czyli jakieś 99% rzekomo rozpoznanego tekstu to komplety bełkot.

Proszę, oto przykład -- fragment "rozpoznanego" nagrania:

Nic mózgu oświadczył. Dziś w łodzi stonoga. Która właśnie tak jest na pewno ludzie się ciągle się tak oderwany od normalnego takie rzeczy powiedzieć że byłe miasto raz na wiele wiele straci prawo tak jak się bowiem że jestem 5 już nie wypada nagrywa się ja się myliłem się jest w 5 roku. Gdy w. Tak y prawa zanim się urodziłem była ze ja w europie co ja byłem wśród wejdzie w nasze ślady tego obiektu. Widać też jak do ciąży to nie jadłam bo to tylko wiedza dawała ręce po latach lepiej o partię a zarazem takich którą tak bardzo jak się urodziwe to ja proszę która wie czyja to w tak władców bardziej deklaratywny tych sieci a o to jak ta stała miejsce teraz w czasie powstań a co w takiej muzyka że jeżeli nie przeżyje żyć z takim że w tym 2 proc. Wzrosła też liczba nowych chociażby dlatego żeby były to znaczy w międzyczasie jakoś się pozbierała dziecko na malarza wszystkie opieki jak dzieło opowiada emerytka była przez 5 lat wraz z najgorszym jestem prawie zaraz też e i ten kto to ugryzienie ten palec aten ale mam dla was kilka naturalnie czy 2 list w opisuje w literę y mnie już wie wajda to jakby o naziemną. Na majdanie tak jak uda nam naturalnie zbyt naturalnie nie były duże pogodny człowiek.

A tu drugi, równie sympatyczny fragmencik:

W odpowiedzi mamy pełne życia i nie gada i nic w nim udział i kierowanie takim. Bardzo wykopać społeczne w te rzeczy na walne czyli natomiast ma też tego co wiem gdzie dochodzi szybko zderzenie zapalenie gdy jest jeszcze znana. W chinach mogą stanowić do 5 minut przed zamachem. Mówi że tam bym w to zdjęcie ma głosu dopełnienia bo nie muszą nas do stworzenia schronienie w dziewięcioro się urodziło 1 znale miał przy wieżowce to jest towar zapisany ten film w zarząd a młodzież będzie chciała mieć w dniu rozprawy w jej krwi 3 por. Ratujcie ale daty wciąż nie pamiętam nie pamiętam nie ale nas między którymi telewizję to także udział w niej bowiem że 2 raty ale my z wielu ale anielę dodaje. To był bardzo medialny. Ten co wytworzył tak jak w domu mówiło się a kiedy wielkim pozostaje ciągle bardzo pana proszę zobaczyć nowy wiedzę że nawet dobra a kraj no to co mogę im już o rozmiarach jak planowana przez co jest leczenie na najwyższym też nas rządzi już tekst jeszcze zdradzać zmarł 3 dni deszczem.

Sympatyczny o tyle, że można się pośmiać, czytając te bzdury. Ale z rozpoznawaniem tekstu nie ma to oczywiście absolutnie nic wspólnego.

Nie mogę opublikować tu oryginalnego tekstu, bo to prywatne notatki. Powiem jednak, że dokładnie ten sam plik audio przepuściłem przez trzy różne konkurencyjne rozwiązania i uzyskałem efekt dokładnie odwrotny -- to znaczy kilka wyrazów nie zostało rozpoznanych. A średnio 90-95% tekstu zostało rozpoznane bezbłędnie.

Przetestowane rozwiązania alternatywne to:

Generalnie polecam wszystkie trzy -- są o niebo lepsze od Skrybota. Choć trudno w ogóle używać tu jakichkolwiek porównań, bo Skrybot po prostu nie działa.

Frustracja? Powyższe cytaty są chyba wystarczającą odpowiedzią.

Zmarnowany czas? Zdecydowanie -- bo z jakiegoś poronionego powodu Skrybot nie potrafi nawet obsługiwać plików .mp3 bezpośrednio. Tylko musi przedtem skonwertować je do formatu .wav. Plus to, że jest to rozwiązanie off-line, czyli wymaga "zabawy" z instalacją, konfiguracją itp.

Pieniądze wyrzucone w błoto? Za te 99 zł kupiłbym w dowolnej z powyższych usług kilkanaście lub nawet kilkadziesiąt godzin rozpoznawania on-line.

Oczywiście, napisałem do twórców programu Skrybot, z prośbą o zwrot pieniędzy za rozwiązanie, które kompletnie nie działa (co widać powyżej)! Ale w odpowiedzi dostałem the official letter of spierdalaj z boskim przekonaniem, że ich program jest przezajebisty, a winę ponoszę ja i rzekomo badziewiastej jakości nagrania audio.

Szkoda tylko, że dla trzech innych rozwiązań te same nagrania były w sam raz.

Zostaw komentarz

Ta strona jest obecnie w trakcie importu. Przenoszę posty z innych źródeł. Różne dziwne rzeczy mogą się tu dziać, dopóki ten proces się nie zakończy (a ta informacja nie zostanie usunięta). Dziękuję za zrozumienie.

Trwa import wpisów...