




























































































Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Uma introdução ao r, um ambiente de computação estatística, mostrando como entrar com dados no r, trabalhar com distribuições de dados e realizar testes estatísticos. O documento também apresenta exemplos práticos e códigos em r para ilustrar as técnicas apresentadas.
Tipologia: Resumos
1 / 176
Esta página não é visível na pré-visualização
Não perca as partes importantes!





























































































7.1 – Tabela de Freqüência Segundo Duas Variáveis -
Aula 1 - Introdução ao R
O R é ao mesmo tempo uma linguagem de programação e um ambiente para computação estatística e gráfica. Algumas das suas principais características são: o seu caráter gratuito e a sua disponibilidade para uma gama bastante variada de sistemas operacionais. Apesar do seu caráter gratuito o R é uma ferramenta bastante poderosa com boa capacidade de programação. Ele tem sido utilizado por pesquisadores das mais diversas áreas na análise de dados. O objetivo deste texto é introduzir os alunos da disciplina Introdução à Bioestatística ao uso do R. Esperamos com isto tornar mais interessante o curso de Introdução à Bioestatística, permitindo ao aluno utilizar as técnicas estatísticas aprendidas na disciplina e aprimorar o entendimento dos conceitos estatísticos estudados.
Nesta primeira aula trataremos da instalação e de alguns aspectos gerais do R importantes para a sua utilização.
1.1 - Como Instalar o R?
1º passo) Vá ao endereço www.r-project.org da página principal do projeto R e clique em download R, como mostrado na figura seguinte.
2º passo) Escolha o espelho de sua preferência, no Brasil existem 4.
3º passo) Clique em um dos espelhos e abrirá uma nova tela. Se você utiliza plataforma Windows clique em Windows , caso contrário clique na plataforma conveniente.
6º passo) Na nova janela clique na opção referente a salvar o arquivo e selecione a pasta onde o arquivo será salvo. Depois é só executá-lo.
1.2.1 - Iniciando o R
O R é uma linguagem interativa, ou seja, permite ao usuário enviar um comando por vez e receber o resultado. Para isso você precisa conhecer e digitar os comandos, pois ele não possui “menus” para clicar. Existem alguns módulos desenvolvidos para o R que permitem ao usuário escolher os comandos através de cliques, mas não trataremos deles neste texto.
Ao instalar o R ele criou um ícone na área de trabalho. Clique no ícone R e o programa será inicializado mostrando a seguinte tela:
O símbolo > indica a linha de comando ("prompt") na qual serão digitados os comandos para execução das análises. Os comandos aparecem escritos em vermelho e os seus resultados (as respostas) em azul. Por exemplo, para calcular a raiz quadrada de 16 digite o comando sqrt(16) na linha de comandos e tecle ENTER.
> sqrt (16) [1] 4
Importante: Ao invés de digitar sqrt(16) na linha de comandos você pode copiar e colar o texto sqrt(16) (sem o sinal >) em frente ao sinal > desta linha.
Observe que a linha de comando está em vermelho e a linha de resposta em azul. Mais adiante você entenderá o símbolo [1]. Para executar outros comandos você deve proceder desta forma: digitar o comando e teclar ENTER.
Algumas vezes na linha de comando aparece o sinal +. Ele indica que o comando está incompleto e esperando o restante do mesmo. Você deve digitar o restante do comando em frente ao sinal + e teclar ENTER. Por exemplo, veja o que acontece ao executar o sqrt(
1.2.4 - Separador de Casas Decimais
Para separar a parte inteira da parte decimal (separador de decimais) o R utiliza ponto.
Exemplo:
> sqrt (21) [1] 4.
Entenda o resultado como 4,582576.
1.2.5 - Utilizando os Comandos de Ajuda no R
Durante a utilização do software é possível consultar a sintaxe de algum comando ou obter mais informações sobre determinada função. Para isso o R conta com o comando help. A sintaxe do comando é a seguinte:
> help (nome da função)
>? nome da função
As duas sintaxes acima são equivalentes, ou seja, produzem o mesmo resultado. Por exemplo, para saber mais sobre a função sqrt.
> help (sqrt) # Obtendo ajuda sobre a função raiz quadrada
Ao executar o exemplo acima, uma interface do menu de ajuda será executada mostrando o tópico da função sqrt, que é a função matemática para o cálculo de raiz quadrada.
No menu principal, em Ajuda , são disponíveis alguns manuais e comandos de ajuda. Para acessá-los clique em Ajuda-Funções R e escreva a função de interesse seguida de ENTER.
Os arquivos de ajuda do R são geralmente compostos de 9 tópicos.
Veja o arquivo de ajuda sobre a função mean.
> help (mean) # Obtendo ajuda sobre a função média
Observe que esta função faz parte do pacote base.
Agora que você já sabe como utilizar os comandos de ajuda, faça bom proveito deles.
Mas o que fazer quando não sabemos qual função do R faz a análise desejada?
Você pode usar o comando help.search( ) ou simplesmente ??( ). Por exemplo, se você quiser informação sobre funções para calcular mediana (“median”)
> help.search(“median”) # é o mesmo que >?? median
Você também pode buscar ajuda na internet, no site do R, com o comando RsiteSearch( ). Para utilizar esta função você precisa estar conectado à internet. Por exemplo, para buscar ajuda sobre funções para construir tábuas de vida (“life table”)
> RSiteSearch(“life table”)
Aula 2 – Objetos do R
O R opera com entidades chamadas de objetos. Objetos podem ser vetores, matrizes, funções ou estruturas mais gerais. Durante uma sessão do R objetos são criados e armazenados por nome.
Por exemplo, vamos criar um objeto de nome raiz no qual vamos armazena a raiz quadrada de 16, para isto faça:
> raiz <- sqrt(16) # lê-se raiz recebe raiz quadrada de 16 > raiz # mostra o conteúdo de raiz [1] 4
Ao invés do símbolo <- você pode usar o sinal de igualdade.
> raiz = sqrt(16)
Para ver todos os objetos criados na sua sessão de trabalho, use a função objects().
> objects() [1] "raiz"
Caso você queira remover um objeto use o comando rm (abreviação de remove). Por exemplo, para remover o objeto raiz faça:
> rm(raiz) # remove o objeto raiz
Nesta aula abordaremos alguns dos objetos do R. Iniciaremos com os vetores.
Os vetores são os objetos mais importantes do R. Podem ser formados por números, nomes, elementos lógicos, desde que todos os elementos sejam do mesmo tipo.
2.1.1 -Criando Vetores
Podemos entrar com dados definindo vetores com o comando c ( ) ("c" corresponde a concatenate ) ou usando funções que criam vetores. Veja e experimente com os seguintes exemplos.
Para criar um vetor com as observações 23 - 21,8 - 26,1 – 27 , referentes as idades, em anos, de 4 pessoas, faça:
> idade <- c (23 , 21.8 , 26.1 , 27) # cria o vetor idade > idade # mostra os elementos do vetor idade [1] 23.0 21.8 26.1 27.
Suponha que os elementos do vetor acima são as idades de Maria, Pedro, João e Rosa. Para criar um vetor com estes nomes:
> nome<-c("Maria","Pedro","João","Rosa") > nome [1] "Maria" "Pedro" "João" "Rosa"
Ao criar um vetor de nomes (caracteres), os elementos devem estar entre aspas duplas.
2.1.2 - Valores Faltantes no R
Vamos agora construir um vetor com o número de anos de estudo destas 4 pessoas. Sabemos que Maria, Pedro e João possuem respectivamente 10, 12 e 8 anos de estudo, mas esta informação não é conhecida para Rosa. Como fazer neste caso?
O R utiliza o símbolo NA (“not available”) para observações faltantes.
> anosestudo<-c(10,12,18,NA) > anosestudo [1] 10 12 18 NA
Outras funções aritméticas
Simbologia Outras funções aritméticas
Outras funções aritméticas
Raiz quadrada sqrt( ) Soma de todos os elementos
sum( )
logaritmo log( ) Produto de todos os elementos
prod( )
exponencial exp( ) Mínimo min( )
Seno sin( ) Máximo max()
Cosseno (^) cos( ) Comprimento (^) length( )
tangente (^) tan( ) Média dos valores (^) mean( )
Variância var( ) Desvio padrão sd( ) Mediana median( )
Para calcular a distância de cada uma das idades do vetor idade em relação à idade média
> distidade<-idade - mean(idade) > distidade [1] -1.475 -2.675 1.625 2.
Outras duas funções muito úteis são sort e rank. A função sort ordena os elementos do vetor e a função rank atribui posições aos elementos do vetor. Experimento estas 2 funções com o vetor idade: (23 , 21.8 , 26.1 , 27).
> sort(idade) # ordena os valores em ordem crescente [1] 21.8 23.0 26.1 27. > rank(idade) # atribui posições aos elementos [1] 2 1 3 4
Observe que ordenando as idades em ordem crescente, o primeiro valor de idade (23) ocupa a segunda posição no vetor ordenado de forma crescente, 21,8 ocupa a primeira posição e assim por diante.
Caso queira ordenar os elementos do vetor em ordem decrescente,
> sort(idade, decreasing = TRUE) # decreasing = FALSE é o padrão. [1] 27.0 26.1 23.0 21.
2.1.5 - Criando Vetores Formados por Seqüências Regulares
Os comandos seq e rep são muito úteis para criar vetores constituídos por seqüências regulares. Vamos ver alguns exemplos:
a) criar um vetor com números de 1 a 15 de nome seq
> seq1<-1: > seq [1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
b) criando a seqüência no sentido inverso
> seq2<-15: > seq [1] 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1
c) criando uma seqüência de 0 a 15 com intervalos de tamanho 2
> seq3<-seq(from=1, to =15, by=2) > seq [1] 1 3 5 7 9 11 13 15 > # ou simplesmente > seq3<-seq(1,15,2) > seq [1] 1 3 5 7 9 11 13 15