Praha, 16. března 2009 – Občanské sdružení BMI (Březen měsíc internetu), Křižovatka.cz a AISO uspořádaly 14. března v Praze již po deváté konferenci Internet a informační systémy pro osoby se specifickými potřebami (INSPO 2009). Konference, která se těšila zájmu téměř tří set účastníků, se zaměřila na novinky a trendy v informačních systémech jak pro lidi s tělesným, tak i sluchovým a zrakovým postižením.
Největší ohlas mezi účastníky konference zaznamenal prototyp aplikace NewtonDictate fungující na mobilních zařízení typu SmartPhone. Aplikace umožňuje diktování libovolných textů do mobilních přístrojů vybavených operačním systémem Windows Mobile 6 a využívá vestavěný mikrofon telefonu. Úspěšnost rozpoznávání je velkou měrou dána kvalitou mikrofonu zařízení, dále závisí na řadě okolností, zejména na okolním ruchu, výslovnosti, typu slov a diktovaném tématu. Plně funkční aplikace je nyní ve fázi testování. Uvedení na trh se předpokládá během dvou až tří měsíců, sdělil Petr Herian, ředitel společnosti Newton Technologies.
Jaroslav Winter z občanského sdružení BMI uvedl, že letos se konference výrazně zaměřila na převod mluvené řeči do textu. Zatímco před rokem prezentovali pokrok v této oblasti výzkumníci z Technické univerzity Liberec a Západočeské univerzity v Plzni, letos již jejich řešení mají podobu komerčních produktů a stovky praktických aplikací. Kromě toho, že je k přepisu textů využívají zatím nejhojněji v soudnictví, zdravotnictví a na úřadech, nahrazují lidem s pohybovým postižením psaní na klávesnici.
V květnu 2008 byla například na brněnské Právnické fakultě Masarykovy univerzity obhájena první diplomová práce, která byla kompletně nadiktována hlasem a automaticky převedena do digitálního písma. Autorem stopadesátistránkové práce nazvané „Přistoupení k EU a nutnost provádění ústavních změn“ je Jiří Zeman, pracovník Nejvyššího správního soudu, jemuž tělesné postižení brání v používání klávesnice a myši. K převodu diktátu do písma použil program MyDictate od společnosti Fugasoft, vyvinutý na Technické univerzitě v Liberci. Program NewtonDictate, který také vznikl ve spolupráci s libereckou univerzitou, již s úspěchem testuje také neslyšící středoškolák, který díky pochopení učitelky češtiny a dějepisu sleduje její výklad přenášený bezdrátovým mikrofonem na svém notebooku, kde jej software ihned převádí s poměrně vysokou přesností do textu.
Právě aplikace Newton Dictate nebo také Elektronická zapisovatelka, pracuje s největším slovníkem dostupným pro spojité diktování (tj. diktování běžným způsobem normální tempem řeči) v České republice. Obsahuje 370 000 slov, což pokrývá 97% nejpoužívanějších slov a slovních spojení spisovné češtiny. Slovníky se pravidelně aktualizují. Aplikace funguje i jako diktafon. Řeč nahrává, automaticky přepisuje, přičemž kteroukoli část přepisu si lze kdykoli přehrát a v případě potřeby snadno opravit.
NEWTON Technologies, a.s. je nově založená společnost, která se zaměřuje na systémy rozpoznávání hlasu. Společnost NEWTON Technologies převzala v této oblasti veškerá práva a závazky od společnosti NEWTON Media, a.s.. Společnost využívá a dále rozvíjí hlasové technologie na základě exkluzivní Licenční smlouvy uzavřené s Technickou univerzitou v Liberci. Na základě této dohody se klíčoví pracovníci libereckého výzkumného týmu pod vedením Prof. Ing. Jan Nouzy, CSc., podílejí na dalším rozvoji hlasových systémů a na jejich nasazování do praxe.
Technická univerzita v Liberci - Ústav informačních technologií a elektroniky, Fakulta mechatroniky.
Výzkumný tým pod vedením Prof. Ing. Jana Nouzy, CSc. má 12 odborných pracovníků (včetně doktorandů). Vedoucím projektu automatického rozpoznávání řeči se zaměřením na češtinu je Ing. Jindřich Žďárský, Ph.D.
Výzkumný tým je zapojen v národních a evropských programech výzkumu, spolupracuje se zahraničními týmy (Dánsko, Švýcarsko, Španělsko, Francie…). Výsledkem práce týmu jsou vedle publikací i realizované aplikace jako např.:
- InfoCity(1999) - historicky první český informační systém založený na telefonním dialogu s počítačem
- MyVoice (2005) – hlasové ovládání počítače pro handicapované.
- AudioSearch (2007) – vyhledávání v rozsáhlých audio archívech
Výzkumná témata:
- automatické rozpoznávání řeči se zaměřením na češtinu
- rozpoznávání osob podle hlasu
- automatický přepis mluvené řeči a zvukových záznamů
- hlasový dialog s počítačem, zejména po telefonu
- audiovizuální komunikace (rozpoznávání i syntéza s podporou vizuální informace)
- hlasové technologie na pomoc postiženým.
kontaktní osoba:
Petr Herian
petr.herian@newtontech.cz
NEWTON Technologies, a.s.
Na Pankráci 1683/127, budova Gemini
Praha 4, 140 00
Czech Republic
tel: +420 225 540 110
mobil: +420 602 333 202
fax: +420 225 540 101