


Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
This article aims to deepen the knowledge about the programming language R, large used in data manipulation for statistical purpose. This language has many libraries that extend data processing capabilities. For this reason , R is one of the most popular languages used by statisticians and data analysts. Due to its expressive syntax and easy-to-use interface, it has grown in popularity in recent years.
Tipologia: Trabalhos
1 / 4
Esta página não é visível na pré-visualização
Não perca as partes importantes!



Isa Raquel Costa de Freitas^1 , Miguel Jonas Lima Setúbal^1 (^1) Aluno da Universidade Federal do Ceará (UFC) Campus Crateús – CE – Brasil {[email protected], [email protected]}
Abstract. This article aims to deepen the knowledge about the programming language R, large used in data manipulation for statistical purpose. This language has many libraries that extend data processing capabilities. For this reason , R is one of the most popular languages used by statisticians and data analysts. Due to its expressive syntax and easy-to-use interface, it has grown in popularity in recent years.
Resumo. Este artigo tem como objetivo aprofundar o conhecimento na linguagem de programação R, muito utilizada para manipulação de dados com fins estatísticos. Essa linguagem possui muitas bibliotecas que ampliam a capacidade de processamento de dados. Por esse motivo é uma das linguagens mais populares entre estatísticos e analistas de dados. Devido a sua sintaxe expressiva e sua interface “easy-to-use”, sua popularidade tem crescido nos últimos anos.
R é uma linguagem de programação voltada para a análise e estatística de dados. Por ser uma linguagem utilizada principalmente para o propósito analítico, apresenta um bom desempenho em relação ao processamento de dados, pois fornece a opção de estender sua capacidade, devido ao seu abrangente catálogo de bibliotecas. Porém, a linguagem R perde para outras linguagens quando a questão é velocidade de processamento (existe formas para realizar a otimização das operações).
Além disso, R fornece uma ampla variedade de técnicas estatística e de modelagem gráfica, possuindo também seu próprio modelo de documentação. Além de permitir a adição de novas funcionalidades.
O projeto da linguagem R teve início em 1995, pelos seus criadores Robert Gentleman e Ross Ihaka, ambos professores da Universidade de Auckland que hoje é considerada uma das maiores universidades da Nova Zelândia. Ela foi fundamentada a partir da linguagem S que também é voltada para a computação estatística, onde foi divulgada publicamente nos anos 80. Desde 1997, a linguagem R vem sendo gerenciada pelo R Code Group, sendo um projeto de código aberto, onde teve sua primeira versão lançada
em fevereiro de 2000. Hoje, a maioria das novas funções para essa linguagem são feitas e disponibilizadas pela comunidade de usuários contendo mais de 10000 bibliotecas criadas e aprimoradas para alavancar suas funcionalidades.
A empresa Microsoft tem uma distribuição aprimorada do R, essa plataforma também é de código aberto, e é voltada para a análise de estatística. Como é 100% baseada em R, essa plataforma é compatível com os comandos e recursos disponíveis em sua versão atual. Segundo um post no site oficial da Microsoft: “ R permite que os especialistas interpretem, interajam e visualizem dados com rapidez e facilidade” (MICROSOFT).
Como foi falado anteriormente, R é usada no meio analítico, logo ela se encaixa no Domínio da Aplicação Científica. Assim como outras linguagens dessa categoria, as estruturas de dados mais usadas são vetores e matrizes, pois a maioria dos dados que são submetidos a rotinas de execução nessa linguagem ficam armazenadas em arquivos que usam umas dessas estruturas. Quando se faz necessário tratar essas informações, é usada alguma biblioteca para alocar os dados que serão usados em vetores ou matrizes. A partir desse ponto, os dados estarão prontos para serem usados na rotina a qual o programa foi feito.
No site do IBPAD (Instituto Brasileiro de Análise de Dados), o professor Robert McDonnell que faz parte do time dessa instituição que tem como foco a aplicação e ensino de técnicas e metodologias de análise de dados com sólida formação científica para atuação no mercado, mostra uma lista de aplicações na qual se usa a linguagem R. Com isso podemos evidenciar com clareza a qual domínio de linguagem R pertence, pois ele cita em sua maioria, aplicações na qual R é usado para extrair e tratar dados com fins de pesquisa ou análise. Entre a lista, destaca-se:
● Extração dados do TSE – Tribunal Superior Eleitoral, para a criação de mapas de como os brasileiro votaram em uma determinada eleição; ● Transformando dados em visualizações gráficas para pesquisas na área da biologia; ● Medir riscos em análise de redes financeiras;
A linguagem R é uma Linguagem de Domínio Específico (Domain Specific Language) ou DSL como também é conhecida.
A DSL é um paradigma de linguagem de programação ou especificação, onde se dedica a um domínio de um problema particular, ou seja, é uma maneira de expressar soluções mais simples e direta. Pode existir a cooperação de diversas linguagens a fim de resolver um problema maior, mas uma DSL resolve um único problema. As linguagens que pertencem a esse paradigma podem ser conhecidas também por linguagens pequenas ou linguagens orientadas a problema.
Embora tenha sido baseada em S, R é considerada uma linguagem DSL Externa, pois teve sua própria sintaxe e estrutura criada para atender seu domínio. O uso da DSL permite a elaboração de códigos mais compreensíveis, possibilitando grande facilidade na manutenção dos sistemas analíticos.
pessoas preferem usar R. Outro ponto forte de R é a facilidade de gráficos bem projetados serem produzidos, o que inclui símbolos e fórmulas matemáticas.
Como exposto anteriormente, R é uma das linguagens de programação para estatísticas que mais crescem atualmente, assim, R tem se tornado a linguagem padrão para a ciência dos dados.
ROBERT W; SEBESTA. Conceitos e Linguagens de Programação: 9. ed. Porto Alegre: Bookman, 2011.
Learn R Programming. Disponivel em: . Acessado em: 28 de agosto de 2019.
R ou python para Análise de Dados. Disponivel em: . Acessado em: 28 de agosto de 2019.
R (Linguagem de Programação). Disponivel em: . Acessado em: 29 de agosto de 2019.
What is R?. Disponivel em . Acessado em: 29 de agosto de 2019.
Rede de Aplicativos Microsoft R. Disponivel em: . Acessado em: 29 de agosto de 2019
O que é Programação ou Linguagem R?. Disponivel em: . Acessado em: 29 de agosto de 2019.
DSLs (Domain-Specific Languages). Disponivel em: . Acessado em 30 de agosto de 2019. Domain Specific Languages: Introdução. Disponivel em:
. Acessado em: 30 de agosto de 2019.
VANCE Ashlee. Data Analysts Captivated by R’s Power. Disponivel em: . Acessado em: 30 de agosto de 2019.
TIOBE Index for August 2019. Disponivel em: . Acessado em: 30 de agosto de 2019.