
































Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
O desenvolvimento do scanface, um projeto que utiliza algoritmos de processamento de imagens digitais, como opencv e viola-jones, para detectar e interpretar as expressões faciais de usuários através de imagens capturadas por uma webcam. O objetivo é melhorar a interação entre usuários e até mesmo entre usuários e inteligências artificiais. O texto explica os algoritmos utilizados, como viola-jones na detecção de objetos, gaussian blur e canny na manipulação da imagem da face, e a utilização do sistema facs para determinar as emoções através dos movimentos musculares.
Tipologia: Esquemas
1 / 40
Esta página não é visível na pré-visualização
Não perca as partes importantes!

































UNIVERSIDADE CATÓLICA DE PELOTAS CENTRO POLITÉCNICO DESENVOLVIMENTO EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS
por Rodrigo Fernandes de Lima Trabalho de Curso II submetido como requisito parcial à obtenção do grau de Tecnólogo em Analise e Desenvolvimento de Sistemas. Orientador: Prof. Me. Luciano Edson Mertins Pelotas, Novembro de 2014
“A persistência é o menor caminho do êxito.” Charles Chaplin
Tabela 1: Alguns AUs da Tabela FACS........................................................................... 20 Tabela 2: Combinações de AU........................................................................................ 35
O Scanface apresenta um algoritmo que tem como finalidade captar, através de imagens coletadas por uma webcam, a face do usuário, sua boca, nariz e olhos, buscando interpretar suas expressões, retornando as emoções alegria, tristeza, raiva, medo, repulsa e surpresa. O algoritmo faz uso de bibliotecas como OpenCV e métodos como Viola-Jones para determinar as áreas correspondentes à face, utilizando-se também do sistema psicológico de codificação facial (FACS) para determinar, através dos movimentos musculares, qual a emoção correspondente a imagem capturada do usuário. Palavras-chave: Computação Visual, Identificação de Expressão Facial, Computação Afetiva.
The Scanface presents an algorithm that aims to attain, through a webcam images collected, the interpretations of the users expressions, returning the emotions happiness, sadness, anger, fear, disgust and surprise. The algorithm uses libraries like OpenCV and methods as Viola-Jones to determine the areas corresponding to the face, making also use of the psychological system of coding facial (FACS) to determine, through muscular movements, which emotion corresponds to the captured image of the user. Keywords : Visual Computing, Identification of Facial Expression, Affective Computing.
Este projeto tem como objetivo geral a criação de um algoritmo para interpretação das emoções, através da expressão facial, utilizando-se de imagens captadas por uma webcam.
A metodologia aplicada neste trabalho obedece aos passos a seguir:
é apresentado um classificador para detecção de objetos, enfatizando a distinção da área da face. Essa detecção se dá sob imagens estáticas em escalas de cinza, com capacidade para seu uso em aplicações de tempo real. A estrutura deste modelo desenvolve-se em três módulos distintos:
As Haar-like features empregadas em detecção da face recebem esse nome por sua similaridade intuitiva com as Haar wavelets (HAAR, 1910), que podem ser vistas como mecanismos para decompor ou quebrar sinais nas suas partes constituintes, permitindo analisar os dados em diferentes domínios de frequências com a resolução de cada componente amarrada à sua escala (LIMA, 2003), uma vez que estas foram a base sobre a qual Viola e Jones adaptaram sua experiência em detecção. Uma Haar-like feature leva em conta regiões retangulares adjacentes para uma janela de detecção de uma localização específica, somando a densidade dos pixels em cada região e calculando a diferença entre estas somas. Esta diferença é então utilizada para categorizar subseções da imagem. Portanto, no modelo Viola-Jones, as características são representadas por uma quantidade de retângulos que contêm regiões claras e escuras, onde o resultado se dá pela soma de pixels das regiões claras, e a subtração da soma de pixels das regiões escuras. Este resultado representará o valor encontrado pela característica para determinada região (Figura 2). Em seu trabalho, Viola e Jones (2001) definiram quatro tipos de características para uso (Figura 2, subfiguras 1a, 1b, 2a e 4). Seguindo propostas sugeridas por Lienhart e Maydt (2002), estas características foram ampliadas, sendo acrescentadas Figura 2 : Características do tipo Haar-like (LIENHART; MAYDT, 2002).
cada nível, uma amostragem positiva e negativa e os valores de falsos positivos para todas as camadas da cascata (Figura 3). A cascata se constrói então, sob o número de níveis que obtenham, na classificação sobre a amostragem, os valores de falsos positivos menores que aquele determinado para a cascata. Para se utilizar da cascata treinada, a classificação se dá sobre uma sub-janela do mesmo tamanho demarcado no treinamento. O procedimento de classificação percorre a imagem a ser examinada, para então serem feitos ajustes na escala do classificador de modo que a face possa ser identificada em uma imagem ampliada. A próxima subseção explana o algoritmo de boosting do qual Viola e Jones fizeram uso, o Adaboost.
Adaboost, é uma abreviatura de Adaptative Boosting, um dos mais conceituados algoritmos de boosting existentes, que pode ser utilizado para ampliar o desenvolvimento de outros algoritmos de aprendizagem (FREUND; SCHAPIRE, 1995). Boosting é um método de treinamento de máquina que trabalha com a combinação de vários classificadores fracos para evoluir até uma classificação forte (SCHAPIRE, 1990). No intuito de obter uma classificação conjunta forte de maior eficiência, é que se realiza um conjunto de várias classificações fracas, ao invés de apenas uma forte. De Figura 3 : Cascata de classificadores (MA,2007).
acordo com o número de classificadores fracos combinados, boosting obtém melhores resultados do que utilizando apenas um classificador forte. Classificadores fracos são aqueles que retornam hipóteses com baixo nível de cobertura - resposta melhor que 50/50. Durante o treinamento com o Adaboost, várias repetições são realizadas, nas quais as classificações de um classificador fraco recebem pesos. Para cada classificação realizada corretamente a partir dos exemplos de teste, é atribuído um peso menor, em contrapartida às classificações incorretas é atribuído um peso maior. A cada classificação, o processo atualiza os índices de distribuição de erro. O “adaptative” em Adaptative Boosting , refere-se a atribuição de pesos feita a partir da performance nos testes de aprendizado/treinamento. Logo abaixo segue a descrição das etapas do algoritmo de classificação Adaboost (para classificação binária e discreta):
A busca por uma relação onde o computador entenda e manifeste emoções é o foco das pesquisas em Computação Afetiva (PICARD, 1995).
Estudos de Paul Ekman e Wallace V. Friesen sobre o comportamento facial resultaram na construção do sistema Facial Action Coding System - FACS (EKMAN; FRIESEN; HAGER, 2002). Este sistema classifica como Action Units (AU) todas as ações faciais causadas por contrações musculares (um ou mais músculos), que, com ou sem combinações, representam todas as expressões faciais possíveis, incluindo sua intensidade, duração e simetria. O sistema FACS (Figura 5) se compõe de 46 Action Units, que são as responsáveis pela descrição de ações faciais. Estas 46 AUs dividem-se em duas regiões faciais:
Referência Ação Superior 1 Elevação da parte interior das sobrancelhas 2 Elevação da parte exterior das sobrancelhas 4 Depressão das sobrancelhas 5 Elevação da pálpebra superior 6 Elevação da bochecha 7 Compressão das pálpebras 41 Pálpebras superiores descontraídas 42 Pálpebras semicerradas 43 Pálpebras cerradas 44 Sobrancelha franzida 45 Piscar de olhos 46 Piscar de um só olho Inferior 9 Enrugamento do nariz 10 Elevação do lábio superior 11 Aumento de profundidade da região nasolabial 12 Alongamento dos cantos da boca 13 Cantos da boca ligeiramente repuxados para cima 14 Cantos da boca ligeiramente repuxados para baixo 15 Depressão dos cantos da boca 16 Depressão do lábio inferior 17 Elevação do queixo 18 Contração extrema de ambos os lábios 20 Alongamento extremo, rebaixado, dos lábios 22 Compressão dos lábios mostrando os dentes 23 Compressão da boca 24 Pressão compressiva dos lábios 25 Separação entre os lábios 26 Maxilar aberto 27 Boca amplamente aberta 28 Lábios comprimidos para o interior da boca Tabela 1 : Alguns AUs da Tabela FACS (EKMAN; FRIESEN)