Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Linguagem de Programação R, Trabalhos de Linguagem de Programação

This article aims to deepen the knowledge about the programming language R, large used in data manipulation for statistical purpose. This language has many libraries that extend data processing capabilities. For this reason , R is one of the most popular languages used by statisticians and data analysts. Due to its expressive syntax and easy-to-use interface, it has grown in popularity in recent years.

Tipologia: Trabalhos

2019

Compartilhado em 09/10/2019

jonas-lima-53
jonas-lima-53 🇧🇷

2 documentos

1 / 4

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
R, linguagem para manipulação, análise e visualização
gráfica de dados
Isa Raquel Costa de Freitas1, Miguel Jonas Lima Setúbal1
1Aluno da Universidade Federal do Ceará (UFC)
Campus Crateús – CE – Brasil
Abstract. This article aims to deepen the knowledge about the programming
language R, large used in data manipulation for statistical purpose. This
language has many libraries that extend data processing capabilities. For this
reason , R is one of the most popular languages used by statisticians and data
analysts. Due to its expressive syntax and easy-to-use interface, it has grown
in popularity in recent years.
Resumo. Este artigo tem como objetivo aprofundar o conhecimento na linguagem
de programação R, muito utilizada para manipulação de dados com fins
estatísticos. Essa linguagem possui muitas bibliotecas que ampliam a
capacidade de processamento de dados. Por esse motivo é uma das
linguagens mais populares entre estatísticos e analistas de dados. Devido a
sua sintaxe expressiva e sua interface “easy-to-use”, sua popularidade tem
crescido nos últimos anos.
1. Introdução
R é uma linguagem de programação voltada para a análise e estatística de dados. Por ser
uma linguagem utilizada principalmente para o propósito analítico, apresenta um bom
desempenho em relação ao processamento de dados, pois fornece a opção de estender
sua capacidade, devido ao seu abrangente catálogo de bibliotecas. Porém, a linguagem
R perde para outras linguagens quando a questão é velocidade de processamento (existe
formas para realizar a otimização das operações).
Além disso, R fornece uma ampla variedade de técnicas estatística e de modelagem
gráfica, possuindo também seu próprio modelo de documentação. Além de permitir a
adição de novas funcionalidades.
O projeto da linguagem R teve início em 1995, pelos seus criadores Robert Gentleman e
Ross Ihaka, ambos professores da Universidade de Auckland que hoje é considerada
uma das maiores universidades da Nova Zelândia. Ela foi fundamentada a partir da
linguagem S que também é voltada para a computação estatística, onde foi divulgada
publicamente nos anos 80. Desde 1997, a linguagem R vem sendo gerenciada pelo R
Code Group, sendo um projeto de código aberto, onde teve sua primeira versão lançada
pf3
pf4

Pré-visualização parcial do texto

Baixe Linguagem de Programação R e outras Trabalhos em PDF para Linguagem de Programação, somente na Docsity!

R, linguagem para manipulação, análise e visualização

gráfica de dados

Isa Raquel Costa de Freitas^1 , Miguel Jonas Lima Setúbal^1 (^1) Aluno da Universidade Federal do Ceará (UFC) Campus Crateús – CE – Brasil {[email protected], [email protected]}

Abstract. This article aims to deepen the knowledge about the programming language R, large used in data manipulation for statistical purpose. This language has many libraries that extend data processing capabilities. For this reason , R is one of the most popular languages used by statisticians and data analysts. Due to its expressive syntax and easy-to-use interface, it has grown in popularity in recent years.

Resumo. Este artigo tem como objetivo aprofundar o conhecimento na linguagem de programação R, muito utilizada para manipulação de dados com fins estatísticos. Essa linguagem possui muitas bibliotecas que ampliam a capacidade de processamento de dados. Por esse motivo é uma das linguagens mais populares entre estatísticos e analistas de dados. Devido a sua sintaxe expressiva e sua interface “easy-to-use”, sua popularidade tem crescido nos últimos anos.

1. Introdução

R é uma linguagem de programação voltada para a análise e estatística de dados. Por ser uma linguagem utilizada principalmente para o propósito analítico, apresenta um bom desempenho em relação ao processamento de dados, pois fornece a opção de estender sua capacidade, devido ao seu abrangente catálogo de bibliotecas. Porém, a linguagem R perde para outras linguagens quando a questão é velocidade de processamento (existe formas para realizar a otimização das operações).

Além disso, R fornece uma ampla variedade de técnicas estatística e de modelagem gráfica, possuindo também seu próprio modelo de documentação. Além de permitir a adição de novas funcionalidades.

O projeto da linguagem R teve início em 1995, pelos seus criadores Robert Gentleman e Ross Ihaka, ambos professores da Universidade de Auckland que hoje é considerada uma das maiores universidades da Nova Zelândia. Ela foi fundamentada a partir da linguagem S que também é voltada para a computação estatística, onde foi divulgada publicamente nos anos 80. Desde 1997, a linguagem R vem sendo gerenciada pelo R Code Group, sendo um projeto de código aberto, onde teve sua primeira versão lançada

em fevereiro de 2000. Hoje, a maioria das novas funções para essa linguagem são feitas e disponibilizadas pela comunidade de usuários contendo mais de 10000 bibliotecas criadas e aprimoradas para alavancar suas funcionalidades.

A empresa Microsoft tem uma distribuição aprimorada do R, essa plataforma também é de código aberto, e é voltada para a análise de estatística. Como é 100% baseada em R, essa plataforma é compatível com os comandos e recursos disponíveis em sua versão atual. Segundo um post no site oficial da Microsoft: “ R permite que os especialistas interpretem, interajam e visualizem dados com rapidez e facilidade” (MICROSOFT).

2. Domínio da Linguagem

Como foi falado anteriormente, R é usada no meio analítico, logo ela se encaixa no Domínio da Aplicação Científica. Assim como outras linguagens dessa categoria, as estruturas de dados mais usadas são vetores e matrizes, pois a maioria dos dados que são submetidos a rotinas de execução nessa linguagem ficam armazenadas em arquivos que usam umas dessas estruturas. Quando se faz necessário tratar essas informações, é usada alguma biblioteca para alocar os dados que serão usados em vetores ou matrizes. A partir desse ponto, os dados estarão prontos para serem usados na rotina a qual o programa foi feito.

No site do IBPAD (Instituto Brasileiro de Análise de Dados), o professor Robert McDonnell que faz parte do time dessa instituição que tem como foco a aplicação e ensino de técnicas e metodologias de análise de dados com sólida formação científica para atuação no mercado, mostra uma lista de aplicações na qual se usa a linguagem R. Com isso podemos evidenciar com clareza a qual domínio de linguagem R pertence, pois ele cita em sua maioria, aplicações na qual R é usado para extrair e tratar dados com fins de pesquisa ou análise. Entre a lista, destaca-se:

● Extração dados do TSE – Tribunal Superior Eleitoral, para a criação de mapas de como os brasileiro votaram em uma determinada eleição; ● Transformando dados em visualizações gráficas para pesquisas na área da biologia; ● Medir riscos em análise de redes financeiras;

3. Paradigma da Linguagem

A linguagem R é uma Linguagem de Domínio Específico (Domain Specific Language) ou DSL como também é conhecida.

A DSL é um paradigma de linguagem de programação ou especificação, onde se dedica a um domínio de um problema particular, ou seja, é uma maneira de expressar soluções mais simples e direta. Pode existir a cooperação de diversas linguagens a fim de resolver um problema maior, mas uma DSL resolve um único problema. As linguagens que pertencem a esse paradigma podem ser conhecidas também por linguagens pequenas ou linguagens orientadas a problema.

Embora tenha sido baseada em S, R é considerada uma linguagem DSL Externa, pois teve sua própria sintaxe e estrutura criada para atender seu domínio. O uso da DSL permite a elaboração de códigos mais compreensíveis, possibilitando grande facilidade na manutenção dos sistemas analíticos.

pessoas preferem usar R. Outro ponto forte de R é a facilidade de gráficos bem projetados serem produzidos, o que inclui símbolos e fórmulas matemáticas.

Como exposto anteriormente, R é uma das linguagens de programação para estatísticas que mais crescem atualmente, assim, R tem se tornado a linguagem padrão para a ciência dos dados.

7. Referência

ROBERT W; SEBESTA. Conceitos e Linguagens de Programação: 9. ed. Porto Alegre: Bookman, 2011.

Learn R Programming. Disponivel em: . Acessado em: 28 de agosto de 2019.

R ou python para Análise de Dados. Disponivel em: . Acessado em: 28 de agosto de 2019.

R (Linguagem de Programação). Disponivel em: . Acessado em: 29 de agosto de 2019.

What is R?. Disponivel em . Acessado em: 29 de agosto de 2019.

Rede de Aplicativos Microsoft R. Disponivel em: . Acessado em: 29 de agosto de 2019

O que é Programação ou Linguagem R?. Disponivel em: . Acessado em: 29 de agosto de 2019.

DSLs (Domain-Specific Languages). Disponivel em: . Acessado em 30 de agosto de 2019. Domain Specific Languages: Introdução. Disponivel em:

. Acessado em: 30 de agosto de 2019.

VANCE Ashlee. Data Analysts Captivated by R’s Power. Disponivel em: . Acessado em: 30 de agosto de 2019.

TIOBE Index for August 2019. Disponivel em: . Acessado em: 30 de agosto de 2019.