Infra - Linux
Linux: Executando comandos utilizando a tecnologia biométrica de reconhecimento de voz
Este artigo explicará passo-a-passo como instalar e configurar um sistema de execução de comandos através da tecnologia de reconhecimento de voz. Além da ampla aplicabilidade, este projeto, com um pouco de evolução, pode vir a ser muito útil para deficientes físicos. Em meus testes superficiais, obtive ótimos resultados.
por Alessandro de Oliveira FariaIntrodução
O funcionamento básico do reconhecimento de voz resulta da integração entre uma placa com processadores digitais que realiza a captura e o tratamento do áudio falado, com um algoritmo especializado que "quebra" este áudio em pequenos pedaços.
O uso do reconhecimento de voz como interface de execução de comandos exibe uma série de vantagens em relação a outras tecnologias existentes.
A principal vantagem é o fato de a fala ser inerente ao ser humano e sua comunicação com o mundo exterior ser também natural e simples. Logo, por paralelismo, a utilização de sistemas de reconhecimento de voz é natural e simples. Além disso, a informação obtida pela máquina é diretamente introduzida nos computadores, eliminando a necessidade de uma interface pessoal e, conseqüentemente, o risco de introduzir erros nas informações e dados obtidos.
A voz é uma biometria humana e sua "autenticação" baseia-se na análise de padrões harmônicos e não simplesmente na comparação entre reproduções de uma mesma fala, sendo uma alternativa segura contra tentativas de fraude.
Para fazer o GNU/Linux executar os nossos comandos identificados pela voz, utilizaremos o sistema de reconhecimento de voz CvoiceControl .
Este sistema detecta automaticamente o comando na entrada do microfone, se a identificação do comando foi reconhecida com sucesso, o sistema executa o comando associado ao Linux/Unix.
Fonte da informação:
Antes de efetuar o download, verifique as dependências do pacote:
- Ncurses (biblioteca e arquivos header)
- Pthreads (Biblioteca Ptheads)
- OSS Biblioteca sound (sys/soundcard.h)
Instalação a partir dos fontes
Para instalar o CvoiceControl a partir dos fontes, crie uma pasta com o nome cvoicecontrol e nesta pasta efetue o download com o comando wget como no exemplo abaixo:
$ mkdir cvoicecontrol
$ cd cvoicecontrol/
$ wget http://www.kiecza.net/daniel/linux/cvoicecontrol-0.9alpha.tar.gz
Após o download, descompacte o arquivo cvoicecontrol-0.9alpha.tar.gz com o comando "tar -zxvf nome-do-arquivo-tar", como no exemplo baixo:
$ tar -zxvf cvoicecontrol-0.9alpha.tar.gz
Agora execute o comando ./configure para gerar o arquivo Makefile, após use na seqüência os comandos make e make install. Este dois últimos comandos irão compilar e instalar o CvoiceControl. Veja o exemplo abaixo:
$ cd cvoicecontrol-0.9alpha/
$ make
ATENÇÃO: Para executar o comando make install, você deve estar logado como super-usuário.
$ su
# make install
Instalação a partir do pacote RPM
Para instalar o CvoiceControl a partir do pacote .RPM, crie uma pasta com o nome cvoicecontrol e nesta pasta efetue o download com o comando wget como no exemplo abaixo:
$ mkdir cvoicecontrol
$ cd cvoicecontrol/
$ wget http://www.kiecza.net/daniel/linux/cvoicecontrol-0.9alpha.tar.gz
Agora transforme-se em super-usuário para efetuar a instalação do pacote .RPM com os comandos:
$ su
# rpm -ivh cvoicecontrol-0.9-alt2.alpha.i586.rpm
Fase 1: Calibrando o microfone
O CvoiceControl é composto de 3 binários:
No primeiro passo, você deve calibrar o seu microfone para pode utilizar recurso de reconhecimento de voz. O binário microphone_config possui este objetivo. Após preparar o seu hardware com a calibração, devemos utilizar o programa model_editor para criar modelos de voz/comandos. Depois de concluídas as duas etapas acima, possuímos os dois principais objetos para efetuar o processo de reconhecimento de voz. O programa cvoicecontrol é o responsável pelo reconhecimento e execução do comando. Chega de blá-blá-blá, para iniciar a calibração do microfone, digite microphone_config como no exemplo abaixo: $ microphone_config Selecione a o opção "Select Mixer Device" para selecionar qual é o dispositivo Mixer sua placa de som (/dev/mixer). |
Selecione a o opção "Select Audio Device" para selecionar qual é o dispositivo da sua placa de som (/dev/dsp). |
Selecione a opção "Adjust Mixer Levels" para ajustar automaticamente o volume do seu microfone através do mixer. |
Ao pressionar qualquer tecla, iremos obter a seguinte tela onde devemos falar em voz alta diante o microfone (risadas altas colaboram para a avaliação do volume no Mixer). Este procedimento é utilizado para encontrar o melhor nível de volume de seu microfone no ambiente que se encontra. |
Selecione "Calculate Recording Thresholds" para encontrar o nível do sinal sonoro mínimo para iniciar a captura de áudio. A primeira em que você deve permanecer em silêncio para a captação de todos os sons externos proporcionados do ambiente. Já na segunda fase devemos sustentar uma conversa até que o o ciclo seja concluído com sucesso. |
Selecione "Estimative Characteristics of Recording Channel" para encontrar o nível mínimo do volume do seu microfone através na análise dos ruídos do ambiente. Para efetuar esta verificação, você deve permanecer em silêncio (novamente) para a captação de todos os sons externos proporcionados do ambiente. |
Pressione (ENTER) na opção "Write Configuration" para salvar a calibração do seu microfone. Logo após selecione Exit para sair deste módulo. |
Se todas estas etapas foram concluídas, parabéns, seu microfone foi calibrado com sucesso! |
Fases 2 e 3: Aprendizado de comandos e controle através do reconhecimento de voz
Nesta etapa, associaremos amostragens sonoras a um determinado comando Linux /Unix. Cada comando deve possuir no MÍNIMO quatro amostragens sonoras. $ model_editor Ao executar o comando model_editor, devemos selecionar a opção "Edit Speaker Model", como no exemplo abaixo: |
Pressione a tecla (a) para adicionar um comando ao arquivo de modelos. |
Pressione (ENTER) para editar o novo modelo de comando. |
Pressione (L) para editar o Título do comando. |
Pressione (C) para editar o comando a ser executado. |
Pressione (R) para gravar uma amostragem de voz para o comando atual. Repita esta operação no mínimo quatro vezes. |
Pressione (B) para voltar ao menu anterior. |
Agora selecione a opção "Save Speaker Model" para salvar os comandos inseridos e/ou alterados. |
Em nosso exemplo, os comandos foram salvos com o nome comandos.cvc. Agora para restar o seu Linux obedecendo os comandos de voz, basta executar o comando cvoicecontrol <nome-arquivo-de-comandos> como no exemplo abaixo: $ cvoicecontrol comandos.cvc Pronto. Agora basta MANDAR junto ao microfone o seu computador executar os comandos desejados. Como diz o nosso amigo Eduardo dos Santos Monteiro e seu professor: "...Pietro Ubaldi, que em um de seus livros "A civilização do terceiro milênio" relata que "O próximo grande salto evolutivo da humanidade será a descoberta de que cooperar é melhor que competir"." |
- Login automático com SSH e Automatização da instalação (deploy) e atualização de sites com GitLinux
- Extensão Sun Presentation Minimizer para Broffice.ORGLinux
- Otimização de Desempenho em sistemas GNU/LinuxLinux
- Hardware para sistemas GNU/Linux - Dicas de Desempenho - Parte 3Hardware
- Hardware para sistemas GNU/Linux - Dicas de Desempenho - Parte 2Hardware