Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Aprendendo a trabalhar com dados no R: Entrada, distribuições e testes estatísticos, Resumos de Estatística

Uma introdução ao r, um ambiente de computação estatística, mostrando como entrar com dados no r, trabalhar com distribuições de dados e realizar testes estatísticos. O documento também apresenta exemplos práticos e códigos em r para ilustrar as técnicas apresentadas.

Tipologia: Resumos

2024

Compartilhado em 10/03/2024

helifax
helifax 🇧🇷

2 documentos

1 / 176

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
UNIVERSIDADE FEDERAL DE MINAS GERAIS
INSTITUTO DE CIÊNCIAS EXATAS – ICEx
DEPARTAMENTO DE ESTATÍSTICA
BIOESTATÍSTICA BÁSICA USANDO O
AMBIENTE COMPUTACIONAL R
Autores
Aloísio Joaquim Freitas Ribeiro (coordenador)
Edson Francisco Ferreira
Esta apostila é parte integrante produzido pelo projeto “Modernização
do Ensino da Disciplina Introdução à Bioestatística – EST179” sob o
Edital PROGRAD 002/2009.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Pré-visualização parcial do texto

Baixe Aprendendo a trabalhar com dados no R: Entrada, distribuições e testes estatísticos e outras Resumos em PDF para Estatística, somente na Docsity!

UNIVERSIDADE FEDERAL DE MINAS GERAIS

INSTITUTO DE CIÊNCIAS EXATAS – ICEx

DEPARTAMENTO DE ESTATÍSTICA

BIOESTATÍSTICA BÁSICA USANDO O

AMBIENTE COMPUTACIONAL R

Autores

Aloísio Joaquim Freitas Ribeiro (coordenador)

Edson Francisco Ferreira

Esta apostila é parte integrante produzido pelo projeto “Modernização

do Ensino da Disciplina Introdução à Bioestatística – EST179” sob o

Edital PROGRAD 002/2009.

Índice

7.1 – Tabela de Freqüência Segundo Duas Variáveis -

Aula 1 - Introdução ao R

O R é ao mesmo tempo uma linguagem de programação e um ambiente para computação estatística e gráfica. Algumas das suas principais características são: o seu caráter gratuito e a sua disponibilidade para uma gama bastante variada de sistemas operacionais. Apesar do seu caráter gratuito o R é uma ferramenta bastante poderosa com boa capacidade de programação. Ele tem sido utilizado por pesquisadores das mais diversas áreas na análise de dados. O objetivo deste texto é introduzir os alunos da disciplina Introdução à Bioestatística ao uso do R. Esperamos com isto tornar mais interessante o curso de Introdução à Bioestatística, permitindo ao aluno utilizar as técnicas estatísticas aprendidas na disciplina e aprimorar o entendimento dos conceitos estatísticos estudados.

Nesta primeira aula trataremos da instalação e de alguns aspectos gerais do R importantes para a sua utilização.

1.1 - Como Instalar o R?

1º passo) Vá ao endereço www.r-project.org da página principal do projeto R e clique em download R, como mostrado na figura seguinte.

2º passo) Escolha o espelho de sua preferência, no Brasil existem 4.

3º passo) Clique em um dos espelhos e abrirá uma nova tela. Se você utiliza plataforma Windows clique em Windows , caso contrário clique na plataforma conveniente.

6º passo) Na nova janela clique na opção referente a salvar o arquivo e selecione a pasta onde o arquivo será salvo. Depois é só executá-lo.

1.2 - Aspectos Gerais do R

1.2.1 - Iniciando o R

O R é uma linguagem interativa, ou seja, permite ao usuário enviar um comando por vez e receber o resultado. Para isso você precisa conhecer e digitar os comandos, pois ele não possui “menus” para clicar. Existem alguns módulos desenvolvidos para o R que permitem ao usuário escolher os comandos através de cliques, mas não trataremos deles neste texto.

Ao instalar o R ele criou um ícone na área de trabalho. Clique no ícone R e o programa será inicializado mostrando a seguinte tela:

O símbolo > indica a linha de comando ("prompt") na qual serão digitados os comandos para execução das análises. Os comandos aparecem escritos em vermelho e os seus resultados (as respostas) em azul. Por exemplo, para calcular a raiz quadrada de 16 digite o comando sqrt(16) na linha de comandos e tecle ENTER.

> sqrt (16) [1] 4

Importante: Ao invés de digitar sqrt(16) na linha de comandos você pode copiar e colar o texto sqrt(16) (sem o sinal >) em frente ao sinal > desta linha.

Observe que a linha de comando está em vermelho e a linha de resposta em azul. Mais adiante você entenderá o símbolo [1]. Para executar outros comandos você deve proceder desta forma: digitar o comando e teclar ENTER.

Algumas vezes na linha de comando aparece o sinal +. Ele indica que o comando está incompleto e esperando o restante do mesmo. Você deve digitar o restante do comando em frente ao sinal + e teclar ENTER. Por exemplo, veja o que acontece ao executar o sqrt(

1.2.4 - Separador de Casas Decimais

Para separar a parte inteira da parte decimal (separador de decimais) o R utiliza ponto.

Exemplo:

> sqrt (21) [1] 4.

Entenda o resultado como 4,582576.

1.2.5 - Utilizando os Comandos de Ajuda no R

Durante a utilização do software é possível consultar a sintaxe de algum comando ou obter mais informações sobre determinada função. Para isso o R conta com o comando help. A sintaxe do comando é a seguinte:

> help (nome da função)

>? nome da função

As duas sintaxes acima são equivalentes, ou seja, produzem o mesmo resultado. Por exemplo, para saber mais sobre a função sqrt.

> help (sqrt) # Obtendo ajuda sobre a função raiz quadrada

Ao executar o exemplo acima, uma interface do menu de ajuda será executada mostrando o tópico da função sqrt, que é a função matemática para o cálculo de raiz quadrada.

No menu principal, em Ajuda , são disponíveis alguns manuais e comandos de ajuda. Para acessá-los clique em Ajuda-Funções R e escreva a função de interesse seguida de ENTER.

Os arquivos de ajuda do R são geralmente compostos de 9 tópicos.

  1. Description – descrição sumária da função.
  1. Usage – define como utilizar a função e quais são seus argumentos.
  2. Arguments – indica o significado de cada argumento.
  3. Details – indica detalhes ao quais se devem estar atendo ao usar a função.
  4. Value – indica como é apresentado o resultado da função.
  5. Note – notas sobre a função.
  6. Authors – lista os autores da função.
  7. References – referências bibliográficas sobre a função.
  8. See Also – lista funções do R relacionadas.
  9. Examples – Exemplos de uso da função.

Veja o arquivo de ajuda sobre a função mean.

> help (mean) # Obtendo ajuda sobre a função média

Observe que esta função faz parte do pacote base.

Agora que você já sabe como utilizar os comandos de ajuda, faça bom proveito deles.

Mas o que fazer quando não sabemos qual função do R faz a análise desejada?

Você pode usar o comando help.search( ) ou simplesmente ??( ). Por exemplo, se você quiser informação sobre funções para calcular mediana (“median”)

> help.search(“median”) # é o mesmo que >?? median

Você também pode buscar ajuda na internet, no site do R, com o comando RsiteSearch( ). Para utilizar esta função você precisa estar conectado à internet. Por exemplo, para buscar ajuda sobre funções para construir tábuas de vida (“life table”)

> RSiteSearch(“life table”)

Aula 2 – Objetos do R

O R opera com entidades chamadas de objetos. Objetos podem ser vetores, matrizes, funções ou estruturas mais gerais. Durante uma sessão do R objetos são criados e armazenados por nome.

Por exemplo, vamos criar um objeto de nome raiz no qual vamos armazena a raiz quadrada de 16, para isto faça:

> raiz <- sqrt(16) # lê-se raiz recebe raiz quadrada de 16 > raiz # mostra o conteúdo de raiz [1] 4

Ao invés do símbolo <- você pode usar o sinal de igualdade.

> raiz = sqrt(16)

Para ver todos os objetos criados na sua sessão de trabalho, use a função objects().

> objects() [1] "raiz"

Caso você queira remover um objeto use o comando rm (abreviação de remove). Por exemplo, para remover o objeto raiz faça:

> rm(raiz) # remove o objeto raiz

Nesta aula abordaremos alguns dos objetos do R. Iniciaremos com os vetores.

2.1 - Vetores

Os vetores são os objetos mais importantes do R. Podem ser formados por números, nomes, elementos lógicos, desde que todos os elementos sejam do mesmo tipo.

2.1.1 -Criando Vetores

Podemos entrar com dados definindo vetores com o comando c ( ) ("c" corresponde a concatenate ) ou usando funções que criam vetores. Veja e experimente com os seguintes exemplos.

Para criar um vetor com as observações 23 - 21,8 - 26,1 – 27 , referentes as idades, em anos, de 4 pessoas, faça:

> idade <- c (23 , 21.8 , 26.1 , 27) # cria o vetor idade > idade # mostra os elementos do vetor idade [1] 23.0 21.8 26.1 27.

Suponha que os elementos do vetor acima são as idades de Maria, Pedro, João e Rosa. Para criar um vetor com estes nomes:

> nome<-c("Maria","Pedro","João","Rosa") > nome [1] "Maria" "Pedro" "João" "Rosa"

Ao criar um vetor de nomes (caracteres), os elementos devem estar entre aspas duplas.

2.1.2 - Valores Faltantes no R

Vamos agora construir um vetor com o número de anos de estudo destas 4 pessoas. Sabemos que Maria, Pedro e João possuem respectivamente 10, 12 e 8 anos de estudo, mas esta informação não é conhecida para Rosa. Como fazer neste caso?

O R utiliza o símbolo NA (“not available”) para observações faltantes.

> anosestudo<-c(10,12,18,NA) > anosestudo [1] 10 12 18 NA

Outras funções aritméticas

Simbologia Outras funções aritméticas

Outras funções aritméticas

Raiz quadrada sqrt( ) Soma de todos os elementos

sum( )

logaritmo log( ) Produto de todos os elementos

prod( )

exponencial exp( ) Mínimo min( )

Seno sin( ) Máximo max()

Cosseno (^) cos( ) Comprimento (^) length( )

tangente (^) tan( ) Média dos valores (^) mean( )

Variância var( ) Desvio padrão sd( ) Mediana median( )

Para calcular a distância de cada uma das idades do vetor idade em relação à idade média

> distidade<-idade - mean(idade) > distidade [1] -1.475 -2.675 1.625 2.

Outras duas funções muito úteis são sort e rank. A função sort ordena os elementos do vetor e a função rank atribui posições aos elementos do vetor. Experimento estas 2 funções com o vetor idade: (23 , 21.8 , 26.1 , 27).

> sort(idade) # ordena os valores em ordem crescente [1] 21.8 23.0 26.1 27. > rank(idade) # atribui posições aos elementos [1] 2 1 3 4

Observe que ordenando as idades em ordem crescente, o primeiro valor de idade (23) ocupa a segunda posição no vetor ordenado de forma crescente, 21,8 ocupa a primeira posição e assim por diante.

Caso queira ordenar os elementos do vetor em ordem decrescente,

> sort(idade, decreasing = TRUE) # decreasing = FALSE é o padrão. [1] 27.0 26.1 23.0 21.

2.1.5 - Criando Vetores Formados por Seqüências Regulares

Os comandos seq e rep são muito úteis para criar vetores constituídos por seqüências regulares. Vamos ver alguns exemplos:

a) criar um vetor com números de 1 a 15 de nome seq

> seq1<-1: > seq [1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

b) criando a seqüência no sentido inverso

> seq2<-15: > seq [1] 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1

c) criando uma seqüência de 0 a 15 com intervalos de tamanho 2

> seq3<-seq(from=1, to =15, by=2) > seq [1] 1 3 5 7 9 11 13 15 > # ou simplesmente > seq3<-seq(1,15,2) > seq [1] 1 3 5 7 9 11 13 15