Proč nejsou v systému všechna česká slova?
Odpověď: Čeština je ohebný jazyk (jména se skloňují, slovesa časují), což vede k obrovskému nárůstů unikátních slovních tvarů. Analýzou největšího archivu českých elektronických textů bylo nalezeno již více než 1,8 milionu různých slov použitelných v češtině. Žádný systém na světě však není schopen pracovat s tak velkým slovníkem. Tvůrci NewtonDictate z tohoto obrovského množství vybrali ta slova, která se vyskytla v soudních textech alespoň 3x, což vedlo ke slovníku o velikosti cca 370 tisíc nejčastěji se vyskytujících slov. (Pro zajímavost, u slovníku, který je 3krát menší, je asi 3krát vyšší pravděpodobnost, že diktované slovo nebude rozpoznáno, protože není ve slovníku.)
Proč nejsou ve slovníku všechna česká jména a příjmení?
Odpověď: Souvisí to s předchozím vysvětlením. Navíc je třeba si uvědomit, že MV ČR eviduje asi 250 tisíc různých příjmení. Kdyby všechna měla být ve slovníku a ještě ve všech potenciálních skloňovaných tvarech, vedlo by to na slovník v němž by muselo být jen příjmení v různých tvarech více než 2,5 milionu.
Ve slovníku mi schází některé tvary slov, např. rozkazovací způsob některých sloves.
Odpověď: Souvisí to opět s předchozím vysvětlením. Některé tvary slov (např. rozkazovací způsob u sloves, či pátý - volací - pád u jmen, se v odborných soudních textech prakticky nevyskytují. Protože se nevyskytly v dostupných textech, nemohly se dostat ani do slovníku.
Může systém poznat, že bylo řečeno slovo, které není ve slovníku?
Odpověď: Pokud je systém jednoduchý a s malým slovníkem (100 tisíc a méně slov), pak se dá tato detekce chybějících slov použít. Nikdy ale nemůže fungovat dost spolehlivě, protože rozhodnutí kdy má systém vyřčené slovo odmítnout hodně závisí na kvalitě výslovnosti uživatele. Čím je systém a jeho slovník rozsáhlejší, tím méně je nutná tato detekce chybějících slov, protože pravděpodobnost, že vyřčené slovo není ve slovníku, je hodně malá. U lidí, kteří mají méně standardní výslovnost, by navíc detektor poměrně často hlásil, že slovo zní jaksi "podezřele" a tudíž asi není ve slovníku, což by vedlo spíše ke zhoršení komfortu diktování.
Vyplatí se adaptace na hlas konkrétního uživatele?
Odpověď: Pro lidi, kteří se naučili správně používat NewtonDictate, dává tento program poměrně vysoké skóre úspěšnosti i bez adaptace. Tomu, kdo však systém chce používat častěji, se adaptace (která trvá cca 40 minut) určitě vyplatí. Dlouhodobé testy ukázaly, že sníží chybovost cca o jednu čtvrtinu (tedy např. z 92 % zvedne úspěšnost na 94 %, z 96 % na 97 %, atd.).
Co se stane, pokud (omylem) muž diktuje s nastaveným ženským hlasovým profilem, a obráceně?
Odpověď: Hlasový profil by měl být správně nastaven - jeho nastavení je vidět v horní modré liště programu. Pokud je nastaven obráceně, je výsledek rozpoznávání výrazně zhoršen, protože mužský a ženský hlas se svými charakteristikami značně liší.
