Dragon Systems, Lernout & Hauspie (L&H), IBM e Philips são as maiores empresas que actuam neste mercado. As duas primeiras fazem parte do mesmo grupo, desde que a belga L&H (http://www.lhsl.com) comprou a norte-americana Dragon (http://www.dragonsys.com) em 2000. Há pouco mais de um ano, a Dragon detinha cerca de 60% do mercado de sistemas de reconhecimento de voz, no mundo, com a IBM e L&H disputando cerradamente o segundo lugar. A Dragon, no entanto, nunca investiu no desenvolvimento do reconhecimento da língua portuguesa, e a L&H não fez mais do que incluir o nosso idioma entre as opções de dicionário, no tradutor Power Translator. A IBM cedo demonstrou interesse em criar uma versão para português do seu produto IBM ViaVoice (www.ibm.com/speech), embora só numa versão orientada para o português brasileiro. A Philips comercializava ainda à bem pouco tempo o produto FreeSpeech 2000 (http://www.speech.philips.com), orientado para utilizadores em ambientes doméstico e de escritório. Contudo, e talvez porque as perspectivas de futuro não eram muito prometedoras, a Philips decidiu enveredar no desenvolvimento de produtos exclusivamente para profissionais.
De um modo geral, todos os produtos, para além de permitirem que o utilizador dite os seus textos num processador de texto do tipo Microsoft Word, permitem criar macros para a introdução de texto ou ditado com qualquer aplicação Windows. De igual modo, todos eles (excepto o NaturallySpeaking) permitem comandos de voz fiáveis para a inicialização de programas e para correr macros de teclado/rato previamente criadas. Paralelamente, todos os produtos disponibilizam algumas funcionalidades Web com capacidade de voz.
O Dragon NaturallySpeaking caracteriza-se pela sua facilidade de utilização, incluindo a formatação e a navegação na Web através de comandos de voz. Além disso, como conta com uma optimização melhorada para novos processadores e com melhoramentos a nível do reconhecimento de voz e de comandos, o NaturallySpeaking disponibiliza uma exactidão impressionante (cerca de 95%). Este programa só é prejudicado pelo facto de apresentar um suporte limitado em termos de linguagem natural com outras aplicações além do Microsoft Word. Em sua defesa, a sua funcionalidade NaturalWeb permite inserir facilmente URLs e seleccionar ligações nas páginas através da voz. O NaturallySpeaking conta ainda com atalhos de formatação e de ditado intuitivos, bastando dizer "cap", por exemplo, ou "all cap" para definir maiúsculas.
Com uma taxa de exactidão de 94%, o L&H Voice Xpress disponibiliza tudo o que de básico se pode esperar de um programa de reconhecimento de voz. O ponto forte do programa reside nos seus comandos intuitivos de linguagem natural para o Microsoft Word, para o Excel e para o processador de texto simples do Voice Xpress. No entanto, as suas funcionalidades de correcção são limitadas, faltando-lhe, por exemplo, a reprodução áudio.
O IBM ViaVoice, é o mais avançado produto de reconhecimento de voz da IBM e disponibiliza bastantes funcionalidades, tanto para ditados como para o controlo de aplicações. O ViaVoice é ainda capaz de guardar o áudio das últimas mil palavras ditadas para reprodução, algo que nos pode ajudar a corrigir enganos. Esta funcionalidade é essencial se os utilizadores quiserem delegar a edição a outra pessoa. Com uma exactidão de 98%, este produto é actualmente o mais fiável do mercado.
Histórico do desenvolvimento de software de reconhecimento de voz
Final da década de 1950 Primeiras pesquisas tecnológicas para
o reconhecimento de voz.
1964: IBM apresenta um
sintetizador de voz para a fala de dígitos.
1978: A Texas Instruments
lançou o primeiro chip dedicado à síntese de voz.
1993: IBM lança
o primeiro software comercial para reconhecimento de voz, o IBM Personal Dictation
System, para OS/2.
1993: Apple apresenta
um conjunto de rotinas para Mac, para reconhecimento e síntese de voz.
1993: Universidade Federal
do Rio de Janeiro desenvolve Dosvox, com síntese de voz em português,
para deficientes visuais usarem PC's com DOS.
1994: Dragon Systems apresenta
o Dragon Dictate para ditados.
1996: IBM apresenta o
MedSpeak/Radiology, primeiro produto para reconhecimento da fala contínua
em tempo real.
1996: OS/2 Warp é
o primeiro sistema a embutir comandos de voz.
1997: Dragon Systems lança
o primeiro programa de uso geral para reconhecimento da fala contínua
em inglês.
1997: IBM lança
o ViaVoice, para fala contínua.
1998: IBM lança
ViaVoice em português.
1998: MicroPower lança
DeltaTalk, sintetizador de voz em português.
1999: Philips lança
FreeSpeech 2000, com reconhecimento da fala em português.
1999: Lotus e Corel acrescentam
recursos de voz a seus pacotes de aplicativos.
2000: L&H adquire
Dragon Systems e lança L&H Dragon NaturallySpeaking 5.0.
2001: Telemar lança
Vocall, primeiro serviço de voz aberto ao público, com síntese
e reconhecimento da fala, para e-mails e agenda.
2001: L&H é
colocada à venda, por se encontrar em grave crise financeira.
2001: Microsoft acrescenta
recursos de voz (para ditados e comandos) ao Office XP. Na versão em
português, essa facilidade está ausente.