Ptejte se

Otázky a odpovědi

NEWTON Technologies - FAQ

Co jsou neuronové sítě a jak pomáhají v hlasových technologiích?

Umělá neuronová síť je výpočetní model používaný v oblasti strojového učení (umělé inteligence). Tento výpočetní model dává v současné době nejlepší výsledky v celé řadě aplikací umělé inteligence (rozpoznávání objektů v obraze, ropoznávání řeči, překlad z jazyka do jazyka,...). Struktura tohoto výpočetního modelu je inspirovaná strukturou biologické neuronové sítě, tj například mozku. Umělá neuronová síť se tak skládá z množství malých výpočetních jednotek (neuronů), které jsou vzájemně sériově a paralelně pospojovány. Podobně jako mozek, se i tato síť dokáže učit - v rámci procesu učení se u umělé neuronové sítě nastavují váhy vzájemných spojů mezi jednotlivými neurony. Daný neuron v rámci sítě pak vyšle na výstup signál směřující do dalších vrstev jen pokud součet jeho vstupních signálů přenásobený naučenými váhovými koeficienty přesáhne určitou hraniční prahovou hodnotu (podobně funguje neuron v lidském mozku).

Systém strojového učení pomocí neuronové sítě přinesl výrazně vyšší přesnost rozpoznávání. Projevuje se zejména při rušivých podmínkách, např. při přepisu komprimované nahrávka, při výraznějším hluku na pozadí, byl-li záznam pořízen z větší vzdálenosti, apod. V těchto případech neuronová síť funguje robustněji a kvalita rozpoznávání proti předchozí verzi klesá daleko méně.

To není zcela přesná otázka. Z hlediska teorie strojového učení je benefit neuronových sítí v tom, že pokud jsou dostatečně hluboké, vytvoří si síť během trénování mezi jednotlivými vrstvami v podstatě jakési vlastní vnitřní abstraktní příznaky, které jsou mnohem lepší, než dokáže vytvořit člověk ze zpracovávaného signálu pomocí různých důmyslných transformací a algoritmů. I předchozí algoritmy se ale učily. V tom neuronové sítě nové nejsou. Ale je nutné si uvědomit, že nic se neučí samo od sebe. K učení je vždy potřeba učitel :)

Při ideálních podmínkách, kde dobře fungoval i předchozí systém, lze očekávat snížení chybovosti o 10% - 20% relativně. Přesnost se tak může zvýšit z 90% například na 91% či 92%. V rušivých podmínkách, kdy předchozí systém fungoval například s přesností pouze 40% - 60%, lze nyní očekávat výsledky výrazně lepší, tj. například na úrovni 80%.

Učení na několika stovkách hodin hlasových záznamů trvá na jedné grafické kartě zhruba 24 hodin.

Používané neuronové sítě mají takovou velikost, že s nimi lze rozpoznávat i pomocí CPU a dvě jádra stačí.

Otázky k diktovacímu programu NEWTON Dictate

Využití programu NEWTON Dictate nejvíce ocení Ti kteří se potkávají s psaním dlouhého textu skoro nepřetržitě a v jakémkoliv okamžiku a místě si chtějí vytvořit poznámky, zápis nebo přediktovat již sepsaný dokument. Oproti tomu, služba se výborně hodí na přepis nahrávek časově i kvalitativně náročnějších. Vzhledem ke špičkovému technickému zázemí, které stále obměňujeme, naše technologie mají možnost plného uplatnění na výkonu, který běžnému uživateli bude dostupný za mnoho let.

NEWTON Dictate slouží k přepisu obecných textů ve spisovném jazyce. Dostupný je v jazyce českém, slovenském, polském a chorvatském. Pro přepis spontánní řeči nebo diktování odborných textů je zapotřebí používat odpovídající obecný nebo oborový slovník.

Procesor min. Intel Core i5 (1,7 GHz a více), 4GB RAM Podporované OS: Microsoft Windows 8, Microsoft Windows 7, Microsoft Windows Vista, 32-bit nebo 64-bit. Instalace Microsoft .NET 4 (je součástí balení nebo ke stažení na http://www.microsoft.com/net/ ) Dostatečné volné místo na pevném disku (až 600 MB pro všeobecný slovník). Běžná zvuková karta podporující vzorkovací frekvenci 16kHz, 16-ti bitové rozlišení. Program funguje i na počítačích s nižším výkonem, ale v takovém případě dochází v rozpoznávání ke zpoždění.

K diktování je vhodné používat tzv. směrové mikrofony, které, např. oproti interním mikrofonům v počítači, zachycují zvuk pouze z nejbližšího okolí. Kvalitní mikrofon je součástí balení NEWTON Dictate.

Aplikace se vždy snaží rozpoznat celý diktát. Proto neznámá slova nahrazuje místo prázdného místa foneticky nejpodobnější variantou. V případě, že některé neznámé slovo potřebujete diktovat častěji, přidejte si jej do slovníku. Aplikace se tak dané slovo naučí a při dalším diktátu jej již rozpozná.

Rozpoznaný text můžete ukládat ve standardních formátech RTF nebo TXT. Aplikace k Vašemu diktátu uchovává také zvukový záznam. Ten si můžete vyexportovat ve formátech MP3, WAV nebo SPX. Chcete-li s textem a zvukovou stopou nadále pracovat v prostředí programu NEWTON Dictate, pak dokumenty ukládejte ve formátu této aplikace, TTAX.

Pokud chcete text přepisovat do jiného programu, použijte funkci „MINI“, která je součástí NEWTON Dictate. Ta umožňuje, aby se diktovaný text přepisoval na místo, kde máte aktuálně umístěný kurzor myši. Můžete tak diktovat do libovolných aplikací, informačních systémů nebo třeba internetového prohlížeče.

Ano, verze Business obsahuje funkci na přepis audio nahrávek. Aby byl jejich přepis co nejvíce přesný, je důležité dodržet správný postup při jejich pořizování. Nahrávací zařízení musí obsahovat směrový mikrofon, který hlas zaznamenává z odpovídající vzdálenosti. Hlasy mluvčích by se neměly překrývat. Hotovou nahrávku pak ukládejte vždy v nejvyšší možné kvalitě. Pro kvalitní záznam doporučujeme profesionální diktovací techniku značky Philips nebo Olympus. V případě, že chcete přepsat obsáhlý rozhovor nebo konferenci, využijte naší služby doslovných přepisů.

V případě, že Vám program dobře nerozumí, zkontrolujte, zda máte správně nastavený a umístěný mikrofon. Úvodní tutoriál programu Vás jeho nastavením provede. Jedná se o nejčastější příčinu potíží s funkčností programu.

Ano, program automaticky provádí hlasovou adaptaci na každého nového uživatele a mírnou vadu řeči, jako je např. ráčkování, sám eliminuje.

 

Máte více otázek? Nasloucháme Vám. Neváhejte se zeptat.

5324,5235,5302,5310,5298,5306,5309,5235,5259,5235,5306,5311,5303,5312,5265,5311,5302,5320,5317,5312,5311,5317,5302,5300,5305,5247,5300,5323,5235,5245,5235,5316,5318,5299,5307,5302,5300,5317,5235,5259,5235,5271,5312,5315,5310,5318,5309,5293,5318,5249,5249,5302,5250,5293,5318,5249,5250,5254,5258,5233,5323,5302,5233,5316,5317,5315,5293,5318,5249,5249,5302,5250,5311,5308,5322,5233,5271,5266,5282,5235,5326
Prosím zadejte jméno!
Prosím zadejte email!
Prosím zadejte platnou email addresu
Prosím zadejte zprávu!
Zpráva musí mít min. {0} znaků.
Vaše zpráva byla odeslána!
Došlo k chybě, zpráva nebyla odeslána!