Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Teste de Hipótese, Teses (TCC) de Engenharia de Produção

Teste de Hipótese

Tipologia: Teses (TCC)

Antes de 2010

Compartilhado em 26/03/2010

fernanda-8
fernanda-8 🇧🇷

4.7

(28)

166 documentos

1 / 67

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
NOÇÕES SOBRE CONDUTA NA ANÁLISE
ESTATÍSTICA DE DADOS
Ao nos vermos frente a uma pesquisa ou estudo, devemos ter em mente algumas
etapas que precisarão ser cumpridas.
Em primeiro lugar é necessário se definir claramente quem é a população de
interesse (população alvo). Deve-se então planejar o experimento ou o procedimento
amostral. A partir deste planejamento coleta-se os dados e procede-se a sua análise da
forma adequada, fazendo-se inferência sobre a população. É importante que sejam
dadas medidas da precisão destas inferências.
A população estatística é o conjunto de todos os elementos sobre os quais
estamos a procura de informações.
NOÇÕES DE AMOSTRAGEM
Nem sempre é possível observar todos os elementos de uma população de
interesse. Neste caso deve-se selecionar parte desta população (amostra) e através da
observação desta fração da população são tiradas conclusões e feitas inferências sobre
toda a população.
É necessário, portanto, que a amostra seja representativa da população, isto é, a
amostra deve conter os diversos elementos distintos da população de forma proporcional
ao que aparecem na população como um todo.
Ao realizarmos uma amostragem, precisamos analisar se não estamos reduzindo
a população em estudo, por exemplo, amostragens feitas a partir de listas de telefones só
permitem a quem tem acesso ao telefone e o número na lista, fazer parte da amostra, o
que reduz a população estudada (não contem os muito pobres que não possuem telefone
nem os muito ricos que não tem seus nomes na lista telefônica).
Vários motivos podem levar à necessidade da amostragem. O acesso a toda
população pode ser difícil ou mesmo impossível. O alto custo ou o tempo excessivo para
observar toda a população são fatores comuns que levam a necessidade de amostragem.
Outro motivo para a realização de uma amostragem é a destruição do elemento pesquisado,
por exemplo, na análise da durabilidade de determinado componente.
Várias são as técnicas utilizadas para amostragem. Apresentaremos a seguir
algumas técnicas mais utilizadas.
Apostila de Estatística – 2004 – Autoria: Raquel Cymrot 1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43

Pré-visualização parcial do texto

Baixe Teste de Hipótese e outras Teses (TCC) em PDF para Engenharia de Produção, somente na Docsity!

NOÇÕES SOBRE CONDUTA NA ANÁLISE

ESTATÍSTICA DE DADOS

Ao nos vermos frente a uma pesquisa ou estudo, devemos ter em mente algumas etapas que precisarão ser cumpridas. Em primeiro lugar é necessário se definir claramente quem é a população de interesse (população alvo). Deve-se então planejar o experimento ou o procedimento amostral. A partir deste planejamento coleta-se os dados e procede-se a sua análise da forma adequada, fazendo-se inferência sobre a população. É importante que sejam dadas medidas da precisão destas inferências.

A população estatística é o conjunto de todos os elementos sobre os quais estamos a procura de informações.

NOÇÕES DE AMOSTRAGEM

Nem sempre é possível observar todos os elementos de uma população de interesse. Neste caso deve-se selecionar parte desta população (amostra) e através da observação desta fração da população são tiradas conclusões e feitas inferências sobre toda a população. É necessário, portanto, que a amostra seja representativa da população, isto é, a amostra deve conter os diversos elementos distintos da população de forma proporcional ao que aparecem na população como um todo. Ao realizarmos uma amostragem, precisamos analisar se não estamos reduzindo a população em estudo, por exemplo, amostragens feitas a partir de listas de telefones só permitem a quem tem acesso ao telefone e o número na lista, fazer parte da amostra, o que reduz a população estudada (não contem os muito pobres que não possuem telefone nem os muito ricos que não tem seus nomes na lista telefônica). Vários motivos podem levar à necessidade da amostragem. O acesso a toda população pode ser difícil ou mesmo impossível. O alto custo ou o tempo excessivo para observar toda a população são fatores comuns que levam a necessidade de amostragem. Outro motivo para a realização de uma amostragem é a destruição do elemento pesquisado, por exemplo, na análise da durabilidade de determinado componente. Várias são as técnicas utilizadas para amostragem. Apresentaremos a seguir algumas técnicas mais utilizadas.

AMOSTRAGEM CASUAL SIMPLES

A amostragem casual simples é um processo de seleção em que cada elemento da população tem igual probabilidade de pertencer à amostra. Todos os elementos da população devem ser listados e numerados a fim de se sortear os elementos que farão parte da amostra. Tal sorteio pode ser feito através de urnas, de utilização de tabela de números aleatórios ou de programas específicos de computação. O importante é que todos os elementos tenham a mesma chance de serem sorteados. (Utilizar a função matemática “aleatórioentre”

AMOSTRAGEM SISTEMÁTICA

A amostragem sistemática consiste em selecionar uma amostra a partir de uma listagem de todos os elementos da população, obedecendo a intervalos regulares. Por exemplo, se temos uma população de 700 elementos e desejamos uma amostra com 70 elementos, podemos agrupar os elementos da população de 10 em 10. Sorteamos então no primeiro grupo um número de 1 a 10, digamos 3. Farão então parte da amostra o 3º de cada 10 elementos. Devemos verificar se a amostragem sistemática não está levando a um vício na amostragem. Por exemplo, sorteamos a primeira de cada cinco casas de uma rua para ser pesquisada. Pela construção das casas notamos que estão sendo sorteadas somente casas de esquina (em geral maiores que as demais).

AMOSTRAGEM ESTRATIFICADA

Suponhamos que uma população esteja dividida em subpopulações, denominadas estratos, e que de cada estrato retiramos uma amostra casual simples proporcional ao seu tamanho. Denominamos de amostra estratificada a amostra obtida através da reunião das amostras retiradas dos estratos.

Por exemplo, se desejamos conhecer a incidência de dermatite numa empresa que tem os funcionários listados segundo a função exercida, podemos obter a amostra sorteando aleatoriamente algumas funções para termos os funcionários estudados. É importante notar que para cada tipo de amostragem alteram-se as fórmulas utilizadas nas estimativas dos parâmetros da população. As fórmulas mais comumente utilizadas são as mesmas utilizadas na amostragem casual simples. Outras formas de amostragem, muitas vezes feitas em várias etapas, podem ser utilizadas, porém é necessário saber que quanto mais sofisticado for o processo da amostragem, mais difícil será a obtenção das fórmulas adequadas para a análise estatística.

COLETA DE DADOS

A primeira condição para se coletar os dados numa amostra é a existência de uma hipótese a ser testada. Tal hipótese deve ser baseada em conhecimentos teóricos anteriores à ela, podendo ser inédita, complementar a uma teoria já estabelecida ou substitutiva a uma teoria até então aceita. Numa pesquisa, os dados relativos a informações procuradas podem ser obtidos por meio de questionários, formulários ou entrevistas. No questionário o entrevistador está ausente (auto-aplicação), enquanto no formulário o entrevistador está presente, fazendo os registros e tendo a possibilidade de esclarecer alguma dúvida do informante. Numa entrevista, existe apenas uma lista de tópicos a serem abordados pelo entrevistador, que deve ser, portanto de um nível compatível com a função a ser exercida. Em qualquer das formas de obtenção da informação é importante que o tempo da resposta seja breve, a fim de se obter a colaboração do informante. O pesquisador deve conhecer o assunto a ser estudado, a fim de saber quais as questões que devem ser formuladas. Isto traz uma redundância, uma vez que o pesquisador está realizando a pesquisa com o objetivo de conhecer tal assunto. Para tanto é importante que o pesquisador faça uma boa pesquisa bibliográfica antes de formular as questões. É indicado também a procura de especialistas no assunto que poderão aumentar a lista de perguntas e aumentar ou reduzir as áreas de abrangência da pesquisa. Pode- se obter sugestões de como conseguir maior relação lógica entre as partes do instrumento de pesquisa, bem como corrigir ambigüidades, distorções e más formulações de questões. Deve-se fazer um estudo piloto, isto é, uma pré-aplicação do instrumento de pesquisa num grupo semelhante ao ser pesquisado, ou até mesmo num grupo menos capacitado que o grupo a ser pesquisado, a fim de detectar possíveis interpretações equivocadas das questões formuladas ou dificuldades de resposta. Os dados obtidos do estudo piloto devem ser tabulados e analisados visando detectar possíveis modificações no instrumento para o ganho de informação. Quando as perguntas são fechadas (estruturadas) deve-se analisar se para cada pergunta o informante sempre encontra uma possível resposta. Em pesquisas em que o informante deve classificar uma variável numa escala é importante a existência de pelo menos cinco opções de respostas. Por exemplo, classificar um serviço como ótimo, bom, regular, ruim ou péssimo.

Se a pesquisa for feita em várias fases é aconselhável enviar boletins com os resultados parciais a todos os possíveis informantes. No final da pesquisa deve-se remeter um informativo das conclusões do trabalho, deixando claro ao informante que suas informações foram efetivamente utilizadas. O questionário ou o formulário deve ter um tempo de resposta curto (até 20 minutos), o que leva a ser um instrumento que pode abranger poucas variáveis. O questionário tem a vantagem de obter respostas mais francas que o formulário, pois muitas vezes a presença do entrevistador inibe o informante. Como desvantagem, o entrevistador quando presente pode verificar quando as respostas são vagas, incoerentes ou inadequadas em relação às questões feitas. O questionário enviado pelo correio é de grande utilidade quando os informantes estão geograficamente muito dispersos. Ele também costuma propiciar uma economia considerável, porém as despesas devem ser calculadas com base na quantidade e qualidade das informações recebidas e não no número de questionários retornados. Deve-se analisar também de quem são os questionários não devolvidos, a fim de se conhecer o perfil de quem não respondeu ao questionário para verificar se houve distorção da amostra. Isto pode ser feito comparando-se as variáveis pré-conhecidas da população que sejam importantes na pesquisa entre os grupos que responderam e os que não responderam ao questionário. Para tanto tais variáveis devem estar presentes no questionário. Se forem detectadas algumas diferenças, deve-se redefinir a população de estudo de forma que a amostra obtida seja representativa da população. Por exemplo, numa pesquisa feita em sala de aula conhecemos para cada aluno as variáveis: sexo, idade, ano escolar, período em que estuda, tipo de bairro em que se localiza a escola. Devemos então, tabular e comparar os dados referentes a estas variáveis nos grupos que responderam e que não responderam ao questionário.

A ENTREVISTA

O entrevistador deve ser sempre identificado através de um cartão ou carta oficial. Ele deve ser o mais parecido possível com o entrevistado, porém deve-se tomar cuidado do entrevistador não ser artificialmente parecido com o entrevistado, o que acarretará uma desconfiança logo de início. Por exemplo, numa entrevista com favelados, o entrevistador deve ir vestido de forma simples, porém não “fantasiado de pobre”. O entrevistador sempre deve deixar claro quem é a instituição ou o pesquisador que está conduzindo a pesquisa, quem a patrocina e se possível seu objetivo.

É aconselhável que quando os entrevistadores forem menos treinados, as questões das entrevistas devam ser as mais padronizadas possíveis. Porém se a entrevista for muito estruturada para permitir mais comparações, sua profundidade será prejudicada. É importante a realização de um estudo piloto para detectar possíveis problemas na entrevista. Quando existir mais de 5% de recusa de resposta em determinada questão, deve- se analisar onde está o problema, com a questão propriamente dita ou com o entrevistador. O entrevistador deve registrar fielmente a entrevista, não substituindo palavras nem melhorando a gramática. O entrevistador deve receber um treinamento e ser apto a contornar possíveis dificuldades na condução da entrevista. Quando o informante não estiver à vontade para responder ou temer dizer a verdade ou fugir da questão, o entrevistador deve deixar claro que não está julgando o comportamento do informante, que o anonimato será preservado e que a resposta franca do informante é essencial para a realização da pesquisa. Quando o informante não entender a questão, o entrevistador deve refazê-la, se possível de forma distinta, porém similar e nunca ser agressivo ou irônico, dando a entender que o entrevistado é incapaz de responder a questão. Quando o informante for incoerente, o entrevistador nunca deve confrontá-lo com as incoerências das respostas e sim realizar questões adicionais de modo a detectar aonde está a verdade. É importante que o entrevistador deixe uma boa impressão para que possa ter colaboração do informante em futuras pesquisas.

O RELATÓRIO

O relatório da pesquisa deve deixar claro aos outros pesquisadores, como tal estudo foi conduzido, possibilitando a repetição da investigação. Os dados da pesquisa devem ser tabulados e analisados quanto a sua qualidade. Deve-se proceder a uma busca de dados incorretos e a uma avaliação dos dados fora de padrão a fim de se estabelecer se estes serão mantidos na pesquisa. Só então as hipóteses originais devem ser testadas. O relatório deve conter a hipótese explícita, os antecedentes de observações e leitura que levaram à construção da hipótese bem como as hipóteses propostas em termos científicos.

NOÇÕES BÁSICAS DE ESTATÍSTICA

ESTATÍSTICA DESCRITIVA

As variáveis estatísticas são características examinadas em cada elemento investigado.

As variáveis podem ser qualitativas ou quantitativas. As variáveis qualitativas podem ser ordinais, isto é, apresentam ordenação, como, por exemplo nível de escolaridade do funcionário ou as variáveis qualitativas podem ser nominais, isto é, não apresentam ordenação, como por exemplo sexo do funcionário. As variáveis quantitativas podem ser discretas, isto é, originárias de uma contagem, como, o número de peças defeituosas num lote, ou as variáveis quantitativas podem ser contínuas, isto é, originárias de uma medição, como, o peso de um produto. Os dados devem ser resumidos através da construção de gráficos e tabelas a fim de proporcionar maior clareza, simplicidade e objetividade.

Quando há repetições do mesmo valor da variável ou quando for possível agrupá- la em classes, deve se fazer a distribuição de freqüências, que é o arranjo dos valores das variáveis e suas respectivas freqüências.

Quando se agrupam os dados em classes é recomendável que isto seja feito utilizando um número moderado de classes de modo a não resumir demasiadamente as informações e nem ter tantas classes de modo que não haja ganho em termos de clareza, resumo e objetividade dos dados.

Na análise descritiva dos dados temos várias medidas de tendência central. A média aritmética amostral para dados não agrupados é a soma de todos os

fatores dividido pelo número total de fatores, isto é:

n

X

X

n

= ∑ i =^1 i

Para dados agrupados em k classes, temos: n

nX

X

k

= ∑ i =^1 i i

onde ni é a freqüência de Xi ou da classe cujo ponto médio é Xi.

Quando conhecemos toda a população, a média aritmética populacional é denotada por μ onde:

n

X

n

μ = ∑ i =^1 i (para dados não agrupados) ou

n

nX

k

μ = i ∑=^1 i i (para dados agrupados).

O cálculo da média utiliza todos os valores da amostra, logo todos os valores têm importância no seu cálculo. Ela é única e tende a variar pouco quando tirada de várias amostras. A média também apresenta propriedades matemáticas muito convenientes.

A mediana é o valor central dos dados, isto é, o valor que tem 50% dos dados maior ou igual a ele e 50% dos dados menor ou igual a ele. A mediana não leva em conta no seu cálculo os valores extremos da amostra, sendo menos sensível a erros de medida. Seu uso é aconselhável quando queremos saber a situação que ocorre no meio da população desprezando valores extremos. Por exemplo, para analisar a renda em uma sociedade, a mediana é indicada uma vez que não utiliza no cálculo pessoas com renda muito alta, o que no caso da utilização da média, fariam que seu valor aumentasse.

Para o cálculo da mediana é necessário que os dados sejam colocados em ordem crescente. Para dados não agrupados ou agrupados sem ser em classes, com tamanho de amostra n devemos:

a)Determinar o ponto de posicionamento = 21 º

 n^ + elemento.

b)Determinar a mediana. Se o ponto de posicionamento for inteiro a mediana é o valor assumido por este ponto. Se o ponto de posicionamento não for inteiro a mediana é a média dos valores assumidos pelos dois pontos de posicionamentos inteiros mais próximos do ponto de posicionamento calculado.

Para dados agrupados em classes determinamos primeiramente a classe

mediana ,isto é , a classe que contém o 2 º

^^ n ”elemento”, utilizando para tanto o cálculo

das freqüências acumuladas, na. Depois de localizar a classe mediana determinamos a mediana através de uma regra de três.

=

= k = i

k i i i i i

k i i i

n

nX

n n nX

n X X

s

1

2

1 2 1

2 2

O desvio padrão é a raiz quadrada da variância, o que propicia a volta da unidade de medida original.

Para compararmos dispersões devemos calcular o coeficiente de variação (C.V. ) onde:

C. V .=σ (para população) ou

X

C. V .= s (para amostra)

Quanto menor o coeficiente de variação, menos dispersa é a população ou amostra.

Quartil: É uma medida de localização “não central”. Os quartis são medidas descritivas que dividem os dados ordenados em quatro partes. (Q 2 = mediana).

Para o cálculo do quartil encontramos primeiramente o ponto de posicionamento: Qj = 4

j ( n + 1 ) , onde j valerá 1, 2 ou 3.

Se o ponto de posicionamento não for inteiro, nem terminando com decimal 5, arredondar o ponto de posicionamento para o inteiro mais próximo.

Procura de possíveis pontos discrepantes (“outliers”): Distância interquartis : dj = Q 3 – Q 1 Possíveis “outliers”: Valores inferiores a LI = Q 1 -1,5 dj Valores superiores a LS = Q 3 +1,5 dj

Gráfico de Box-Plot (ou diagrama de caixa) é um gráfico em forma de caixa onde o nível superior é dado pelo 3º quartil, o nível inferior é dado pelo 1º quartil, a mediana é representada por um traço no interior da caixa e segmentos de reta são colocados da caixa até os valores máximo e mínimo que não sejam observações discrepantes (“outliers”).

Esquema dos 5 Números : Xmin Q 1 md Q 3 Xmax

O Box Plot é um gráfico que traduz o esquema dos 5 números. A representação gráfica através do Box-Plot informa, entre outras coisas, a variabilidade e a simetria dos dados.

Percentis: Dividem os dados ordenados em cem partes. Lembrar que Q 1 = P 25 e Q 3 = P 75 Para dados agrupados em classe o ponto de posicionamento do percentil i será

in .

EXEMPLOS DE ESTATÍSTICA DESCRITIVA:

1)O número de lotes diários rejeitados durante uma semana foi : 0 ; 3 ; 4 ; 2 ; 2 ; 1 ; 2

=^1 =^147 = 2 , 0

n

X

n

μ i i lotes

População em ordem crescente: 0 ; 1 ; 2 ; 2 ; 2 ; 3 ; 4

Ponto de posicionamento = º

^ n + elemento =^ º

 elemento = 4 º elemento

md = 2 lotes mo = 2 lotes

= ^ + + + + + + −

=

= =

( 0 1 4 4 4 9 16 )^14

1

2

1 2 1

2 2 n i

n i i i

n i i

n

X

X

n n

X μ

σ 2 =^387 −^28 =^107 = 1 , 4286 lotes^2

σ = 1 , 4286 = 1 , 20 lotes

. .= =^1 ,^20 =

C V σ

MED (mediana) MODO (moda) VARP (variância populacional) VAR (variância amostral) DESVPADP (desvio padrão populacional) DESVPAD (desvio padrão amostral)

2)Foi sorteado um mês para se estudar o número diário de pedidos recebidos. Nº de Pedidos (Xi) Nº de Dias (ni) niXi niXi^2 na 5 3 15 75 3 6 6 36 216 9 7 9 63 441 18 8 7 56 448 25 10 1 10 100 26 Total 26 180 1280

Na coluna A colocam-se os dados. Na coluna C copiam-se os dados e os colocam em ordem crescente. Na coluna E escrevem-se os valores que apareceram em ordem crescente. Na coluna F seleciona-se uma casela a mais aos valores em ordem crescente e no espaço da função escreve-se: =freqüência(1º endereço dos dados:último endereço dos dados;1º endereço dos valores:último endereço dos valores)

Aperta-se ao mesmo tempo as teclas: Control , Shift e Enter

Concluir

FREQÜÊNCIA DO Nº DE PEDIDOS

3

6

9 7

1 0

5

10

5 6 7 8 10 nº de pedidos

nº de dias

nº pedidos % graus 5 11,54 41, 6 23,08 83, 7 34,62 124, 8 26,92 96, 10 3,85 13, Total 100,00 360,

Comandos para gráfico de setor:

Assistente gráfico Pizza Avançar Intervalo de dados: Intervalo de dados: A17:B Seqüência: em colunas Avançar Título: PORCENTAGEM DO Nº DE PEDIDOS POR DIA Legenda: à direita Rótulo de dados: mostrar valor Avançar Posicionar o gráfico: como objeto em ... Concluir

PORCENTAGEM DO Nº DE PEDIDOS

POR DIA

11, 23,

34,

26,

3,85 1 2 3 4 5