Infra - Linux

Linux: Executando comandos utilizando a tecnologia biométrica de reconhecimento de voz

Este artigo explicará passo-a-passo como instalar e configurar um sistema de execução de comandos através da tecnologia de reconhecimento de voz. Além da ampla aplicabilidade, este projeto, com um pouco de evolução, pode vir a ser muito útil para deficientes físicos. Em meus testes superficiais, obtive ótimos resultados.

por Alessandro de Oliveira Faria



Introdução

O funcionamento básico do reconhecimento de voz resulta da integração entre uma placa com processadores digitais que realiza a captura e o tratamento do áudio falado, com um algoritmo especializado que "quebra" este áudio em pequenos pedaços.

O uso do reconhecimento de voz como interface de execução de comandos exibe uma série de vantagens em relação a outras tecnologias existentes.

A principal vantagem é o fato de a fala ser inerente ao ser humano e sua comunicação com o mundo exterior ser também natural e simples. Logo, por paralelismo, a utilização de sistemas de reconhecimento de voz é natural e simples. Além disso, a informação obtida pela máquina é diretamente introduzida nos computadores, eliminando a necessidade de uma interface pessoal e, conseqüentemente, o risco de introduzir erros nas informações e dados obtidos.

A voz é uma biometria humana e sua "autenticação" baseia-se na análise de padrões harmônicos e não simplesmente na comparação entre reproduções de uma mesma fala, sendo uma alternativa segura contra tentativas de fraude.

Para fazer o GNU/Linux executar os nossos comandos identificados pela voz, utilizaremos o sistema de reconhecimento de voz CvoiceControl .

Este sistema detecta automaticamente o comando na entrada do microfone, se a identificação do comando foi reconhecida com sucesso, o sistema executa o comando associado ao Linux/Unix.

Fonte da informação:

Notas para instalação:

Antes de efetuar o download, verifique as dependências do pacote:
  • Ncurses (biblioteca e arquivos header)
  • Pthreads (Biblioteca Ptheads)
  • OSS Biblioteca sound (sys/soundcard.h)


Instalação a partir dos fontes

Para instalar o CvoiceControl a partir dos fontes, crie uma pasta com o nome cvoicecontrol e nesta pasta efetue o download com o comando wget como no exemplo abaixo:

$ mkdir cvoicecontrol
$ cd cvoicecontrol/
$ wget
http://www.kiecza.net/daniel/linux/cvoicecontrol-0.9alpha.tar.gz

Após o download, descompacte o arquivo cvoicecontrol-0.9alpha.tar.gz com o comando "tar -zxvf nome-do-arquivo-tar", como no exemplo baixo:

$ tar -zxvf cvoicecontrol-0.9alpha.tar.gz

Agora execute o comando ./configure para gerar o arquivo Makefile, após use na seqüência os comandos make e make install. Este dois últimos comandos irão compilar e instalar o CvoiceControl. Veja o exemplo abaixo:

$ cd cvoicecontrol-0.9alpha/
$ make


ATENÇÃO: Para executar o comando make install, você deve estar logado como super-usuário.

$ su
# make install

Instalação a partir do pacote RPM

Para instalar o CvoiceControl a partir do pacote .RPM, crie uma pasta com o nome cvoicecontrol e nesta pasta efetue o download com o comando wget como no exemplo abaixo:

$ mkdir cvoicecontrol
$ cd cvoicecontrol/
$ wget
http://www.kiecza.net/daniel/linux/cvoicecontrol-0.9alpha.tar.gz

Agora transforme-se em super-usuário para efetuar a instalação do pacote .RPM com os comandos:

$ su
# rpm -ivh cvoicecontrol-0.9-alt2.alpha.i586.rpm

Fase 1: Calibrando o microfone

Fases 2 e 3: Aprendizado de comandos e controle através do reconhecimento de voz

Alessandro de Oliveira Faria

Alessandro de Oliveira Faria - Sócio-proprietário da empresa NETi TECNOLOGIA fundada em Junho de 1996 (http://www.netitec.com.br), empresa especializada em desenvolvimento de software e soluções biométricas, Consultor Biométrico na tecnologia de reconhecimento facial, atuando na área de tecnologia desde 1986 assim propiciando ao mercado soluções em software nas mais diversas linguagens e plataforma, levando o Linux a sério desde 1998 com desenvolvimento de soluções open-source, membro colaborador da comunidade Viva O Linux, mantenedor da biblioteca open-source de vídeo captura entre outros projetos.