Aplicações do R: exemplos práticos e casos reais

Aplicações do R: exemplos práticos e casos reais
Monalisa Meyrelle de Sousa Silva
Monalisa Meyrelle de Sousa Silva

Compartilhe

Se você já precisou organizar, analisar ou visualizar grandes volumes de dados, sabe que o desafio não está apenas na quantidade de informações, mas em descobrir como extrair significados delas.

É nesse cenário que uma ferramenta adequada faz toda a diferença.

A linguagem R surge como essa ferramenta ideal. Com uma gama de recursos e pacotes, ela é amplamente utilizada em diversas áreas, desde o meio acadêmico até setores como finanças, marketing e biologia.

Sua versatilidade a torna uma solução muito utilizada para quem precisa realizar desde análises simples às análises estatísticas complexas, como criar modelos preditivos, gerar visualizações de dados e muito mais.

Com uma vasta coleção de pacotes e uma comunidade ativa, o R se integra facilmente a outras linguagens e ferramentas, permitindo que profissionais adaptem a linguagem às suas necessidades e obtenham melhores resultados.

Neste artigo, vamos explorar algumas das principais áreas em que a linguagem R é utilizada e analisar seu impacto no ambiente profissional. Abordaremos os seguintes tópicos:

  • R na Estatística
  • R em Ciência de Dados e Machine Learning
  • R na Visualização de Dados
  • R na Bioinformática
  • R em outras áreas
Imagem com título “Áreas de aplicação da programação em R”. Ela contém um gráfico circular mostrando as principais áreas de aplicação da programação em R. O gráfico é composto por cinco segmentos com ícones e textos que descrevem as seguintes áreas: Bioinformática, Estatística, Ciência de Dados e Machine Learning, Visualização de Dados e Outras Áreas. No centro do gráfico, há um ícone de código ‘<>’ , representando a programação. A imagem tem um fundo azul-escuro e no canto inferior esquerdo há uma logo da Alura.

Vamos descobrir qual área de aplicação do R mais combina com seus objetivos?

R na Estatística

Quando pensamos em estatística, logo vem à mente cálculos complexos e análises detalhadas.

Se você é profissional de uma área que lida com dados, como marketing, economia ou pesquisa de mercado, sabe que muitas vezes o desafio vai além de só coletar os dados, é preciso interpretar e tirar conclusões.

Nesse cenário, o R pode ser seu aliado. Ele oferece pacotes que podem transformar números em informações, ajudando você a tomar decisões fundamentadas em dados.

Vamos explorar juntos alguns exemplos de como você, atuando nessas áreas, pode usar o R para otimizar o seu trabalho:

Análise de Vendas

Se você atua na área de vendas de uma empresa, provavelmente já precisou entender o comportamento das suas vendas ao longo do tempo.

Como identificar padrões de sazonalidade ou prever quando as vendas podem cair ou subir? Aqui, o R pode simplificar muito esse trabalho.

Vamos imaginar que sua empresa tenha observado quedas nas vendas durante o inverno.

Com o R, você pode comparar os dados de vendas de diferentes períodos e identificar padrões sazonais. Isso ajuda a prever quando as vendas podem cair ou subir.

Com base nessa análise, você pode planejar melhor seu estoque. Por exemplo, ao identificar que as vendas aumentam no fim do ano, você consegue se preparar para o período de alta demanda.

Testes A/B

No marketing, é comum testar diferentes abordagens para ver qual gera mais retorno.

O R facilita muito esse processo ao permitir a comparação precisa entre duas versões de uma campanha, conhecido como teste A/B.

Vamos dizer que você tem duas versões de um email promocional: uma mais visual e outra com um texto mais direto.

Com o R, você pode analisar as taxas de cliques e conversões de cada versão. O resultado mostra qual delas está gerando mais engajamento.

Em vez de depender de achismos, sua análise será baseada em dados. Com isso, suas decisões passam a ser mais estratégicas e embasadas, aumentando as chances de sucesso da sua campanha e economizando tempo no processo.

Pesquisa de mercado

Se sua atuação está ligada à pesquisa de mercado, o R pode facilitar muito seu trabalho. Já se viu na situação de precisar descobrir como pessoas de diferentes faixas etárias avaliam um novo produto? Com o R, isso se torna simples.

Vamos supor que sua empresa esteja lançando um novo sabor de refrigerante e queira saber como ele é aceito por diferentes faixas etárias.

Com o R, você consegue comparar as avaliações de clientes jovens e adultos. A análise pode mostrar que o novo sabor é mais aceito pelos jovens, enquanto os adultos preferem o sabor tradicional.

Com esses dados em mãos, você poderá direcionar melhor suas campanhas publicitárias, alinhada com as preferências de cada público.

Confira abaixo três pacotes e funções que você pode explorar para aprimorar suas análises estatísticas no R:

Pacote/FunçãoDescriçãoAplicação
ggplot2Pacote de visualização de dados que permite criar gráficos personalizados e avançados.Gera gráficos de barras, linhas, dispersão e outros, facilitando a análise visual de padrões sazonais, desempenho de vendas e resultados de testes A/B.
lm()Função do pacote base stats, usada para ajustar modelos de regressão linear.Permite modelar relações entre variáveis, como a previsão de vendas com base em tendências sazonais ou o impacto de uma campanha de marketing.
t.test()Função do pacote base stats, utilizada para realizar testes de hipóteses entre dois grupos.Realiza comparações entre grupos em testes A/B ou análises de preferências de clientes, identificando diferenças significativas.

Agora que exploramos um pouco sobre o uso do R em análises estatísticas, que tal mergulharmos nas suas aplicações em ciência de dados e machine learning?

Banner promocional da Alura, com um design futurista em tons de azul, apresentando o texto

R em Ciência de Dados e Machine Learning

Quando falamos de Ciência de Dados e Machine Learning, a linguagem R oferece soluções para todas as etapas do ciclo de vida de uma análise de dados.

Com seus pacotes especializados, o R suporta desde a preparação dos dados até a construção e avaliação de modelos de aprendizado de máquinas.

Vamos descobrir como podemos utilizar o R em cada uma dessas etapas para otimizar tarefas e alcançar resultados confiáveis.

Preparação dos dados

Você já deve ter notado que os dados que recebemos, na maioria das vezes, chegam em um estado que está longe de ser ideal para análise. Muitas vezes, eles precisam passar por uma etapa essencial de preparação.

Se você já tentou analisar dados financeiros, por exemplo, sabe que nem sempre as informações estão organizadas de forma ideal.

O R brilha nessa etapa, e com os pacotes dplyr e tidyr do Tidyverse, podemos realizar tarefas como limpeza, transformação e organização dos dados.

Vamos imaginar que você está trabalhando com dados financeiros, tentando prever o preço futuro de uma ação.

Se os dados tiverem lacunas ou valores ausentes, isso pode comprometer toda a análise. Então, teremos que tratar esses dados.

Veja no exemplo abaixo, onde o dplyr é utilizado para preencher os valores ausentes com a média dos valores anteriores:

library(dplyr)
#dataset com valores ausentes
precos <- data.frame(
  preco = c(10.50, 12.30, NA, 11.00, NA, 13.40, 12.00, NA, 10.70)
)
# Preenchendo valores ausentes com a média dos preços
precos <- precos %>%
  mutate(preco_ajustado = ifelse(is.na(preco), mean(preco, na.rm = TRUE), preco))
precos

Com os dados devidamente tratados, você está pronto para a próxima etapa: construir os modelos preditivos que irão gerar as previsões que você precisa. Construção de modelos

Agora que os dados estão limpos, é hora de começar a prever o futuro. Um dos desafios para um analista de investimentos é saber como uma empresa vai se comportar em um próximo período.

No R, você tem à disposição pacotes como forecast e prophet, dedicados em séries temporais – aqueles dados que mudam ao longo do tempo, como o preço de uma ação.

Considere que você queira prever o preço de uma ação para os próximos 30 dias. Com o R, você pode ajustar um modelo ARIMA, que é muito popular para esse tipo de previsão.

Abaixo você pode conferir alguns dos principais pacotes para construção de modelos para séries temporais:

PacoteDescriçãoAplicação Principal
forecastFornece ferramentas para previsão de séries temporais (como ARIMA, ETS).Previsão de dados sequenciais, como preços de ações.
prophetDesenvolvido pelo Facebook, é usado para previsão de séries temporais.Lida com dados irregulares e ajusta tendências e sazonalidade.
tsibbleEstrutura para trabalhar com séries temporais de forma organizada.Organizar e manipular séries temporais de maneira eficiente.

Esses pacotes facilitam a fazer previsões com base em dados históricos. Imagine o impacto que isso pode ter para um analista de investimentos!

Mas, depois de gerar nossas previsões, a próxima pergunta é: quão boas são essas previsões? Vamos descobrir.

Avaliação de Modelos

É muito bom gerar previsões, mas como saber se elas estão certas? Vamos supor que você previu o preço de uma ação para os próximos 30 dias, mas como ter certeza de que essas previsões são precisas? Aqui entra a avaliação do modelo.

Para isso, podemos usar algumas métricas, como o RMSE (Raiz do Erro Quadrático Médio), que mostra se as previsões estão muito diferentes dos valores reais. Quanto menor o RMSE, mais próximo o modelo está de prever corretamente.

Vamos pensar que o preço de uma ação vai variar entre R$45 e R$50 nos próximos dias, mas quando os dados reais chegam, percebe-se que o preço variou entre R$48 e R$52.

A diferença entre o que você previu e o que realmente aconteceu pode ser calculada, e o RMSE vai te ajudar a entender o quão grande esse erro foi.

Você pode conferir abaixo outros pacotes que podem nos ajudar a avaliar modelos:

PacoteDescriçãoAplicação Principal
MetricsOferece várias métricas de avaliação de modelos, como RMSE e MAE.Avaliação de erro entre previsões e valores reais.
caretContém funções para avaliar e comparar modelos de machine learning.Integra métricas de avaliação e automatiza validação cruzada.
ModelMetricsUm pacote especializado em métricas de avaliação para modelos de machine learning.Avaliação de precisão de modelos preditivos.

E de que adianta ter previsões precisas se ninguém consegue entendê-las? Vamos ver como o R pode te ajudar a criar visualizações para comunicar melhor suas análises.

R em Visualização de Dados

Quando você precisa lidar com grandes volumes de dados, apresentar as informações de forma clara faz toda a diferença na hora de tomar decisões, certo? A visualização de dados ajuda bastante nisso, pois permite que padrões e tendências apareçam de forma clara.

Nesse caso, o R possui pacotes que facilitam a criação de gráficos e dashboards, tornando a transformação de dados complexos em visualizações simples e fáceis de entender. Isso contribui diretamente para uma tomada de decisões mais rápida.

Vamos então explorar como podemos aplicar o R para criar gráficos estáticos, visualizações interativas e dashboards. Gráficos estáticos com ggplot2

Como observamos, a visualização de dados ajuda a entender melhor os resultados e assim tomar uma decisão mais assertiva.

Por exemplo, caso você esteja analisando dados de vendas mensais e precisar visualizar o desempenho de diferentes produtos ou regiões, pode utilizar o pacote ggplot2.

Com ele é possível gerar gráficos de barras, histogramas, boxplots, gráficos de calor, entre outros.

Veja um exemplo de código, onde podemos verificar as vendas de determinado produto por região:

# Vendas por região
dados_vendas <- data.frame(
  regiao = c("Norte", "Sul", "Leste", "Oeste"),
  vendas_totais = c(25000, 18000, 22000, 15000)
)
# Gráfico de barras para comparar vendas por região
library(ggplot2)

ggplot(dados_vendas, aes(x = regiao, y = vendas_totais, fill = regiao)) +
  geom_bar(stat = "identity") +
  labs(title = "Vendas Totais por Região",
       x = "Região",
       y = "Vendas Totais") +
  theme_minimal()
Gráfico de barras exibindo as Vendas Totais por Região. O gráfico apresenta quatro barras verticais, cada uma representando uma região, sendo da esquerda para a direita: Leste (barra em rosa), Norte (barra em verde), Oeste (barra em azul) e Sul (barra em lilás). O eixo vertical, y, indica as Vendas Totais, com valores variando de 0 até 25.000, e o eixo horizontal, x, mostra as diferentes regiões. A legenda à direita do gráfico identifica as cores correspondentes a cada região.

Note que ggplot2 segue uma estrutura de camadas, na qual você pode ir adicionando elementos ao gráfico, como títulos, legendas, eixos e escalas, de acordo com suas necessidades.

Agora que já criamos gráficos estáticos, podemos aumentar o nível de interação com os dados. Neste caso, o R também oferece soluções que possibilitam visualizações mais dinâmicas.

Visualizações interativas com o ploty

Se você precisa que outras pessoas interajam com suas visualizações, você poderá optar por visualizações interativas.

Digamos que você esteja trabalhando em uma campanha de marketing e quer que sua equipe possa visualizar e filtrar os dados conforme os diferentes canais de marketing, como redes sociais e e-mail.

Com o plotly, você pode transformar gráficos em interativos, permitindo que os dados sejam explorados mais detalhadamente:

Gif interagindo com o gráfico de barras exibindo o gasto por canal de marketing, ao passar o mouse sobre cada barra é mostrado o valor referente aos gastos. Os canais listados no eixo horizontal são: Afiliados, Email, Publicidade Paga, Redes Sociais e SEO. No eixo vertical, os valores de gasto variam de 0 até 5000. As barras são de cor azul, e o maior gasto é registrado em Redes Sociais, seguido de Publicidade Paga, Email, SEO e, por último, Afiliados.

Após criar suas visualizações interativas, você pode estar se perguntando: como reunir tudo isso em um único lugar para facilitar o monitoramento? A resposta está nos dashboards! Eles permitem consolidar todas as informações em um painel único.

Dashboards

Já discutimos sobre gráficos estáticos e visualizações interativas, e agora chegamos ao próximo nível: dashboards. Pense no seguinte cenário: sua equipe lançou várias campanhas promocionais e quer acompanhar o desempenho e comparar o impacto das ações de marketing em diferentes regiões.

Em vez de passar horas criando gráficos manuais ou lidando com várias planilhas, você pode usar R para criar um dashboard interativo.

Com os dashboards podemos ter todas essas informações centralizadas em um único painel de controle, permitindo visualizar todos esses dados de forma interativa.

Com um dashboard feito em R, é possível criar gráficos que se atualizam automaticamente, oferecendo uma visão de como cada região está performando.

Com pacotes como o Shiny, é possível inserir diferentes métricas (como cliques e conversões), que podem ser visualizadas e ajustadas conforme os filtros aplicados pelo usuário.

Abaixo podemos visualizar um exemplo de dashboard utilizando o Shiny no RStudio, onde podemos visualizar a quantidade de vendas conforme o filtro de datas.

Gif demonstrando a interação no Dashboard de Vendas por Região. À esquerda, há um seletor de datas, onde o usuário insere o período entre 2024-01-01 e 2024-01-03 . Ao definir as datas as barras mudam os seus valores e consequentemente seu tamanho. As barras coloridas mostram as Vendas Totais por Região. As regiões são Leste (barra vermelha), Norte (barra verde), Oeste (barra azul) e Sul (barra lilás). O gráfico exibe valores de vendas totais de 0 até 80.000 no eixo vertical, com as regiões no eixo horizontal.

Após explorarmos o uso do R na visualização de dados, vamos agora descobrir suas aplicações na Bioinformática.

R na Bioinformática

Se você trabalha com estudos genômicos ou ecológicos, lida com milhares de dados todos os dias e um grande desafio é processar, interpretar e visualizar tudo isso de forma simples e prática.

Com o R, você pode automatizar suas análises e criar pipelines reprodutíveis, o que garante que os resultados sejam consistentes e fáceis de validar em diferentes experimentos.

Por exemplo, se você quer comparar como os genes se comportam em células saudáveis e cancerígenas, pacotes como DESeq2 ou limma facilitam a identificação dessas diferenças.

Além disso, você também pode usar gráficos de calor, boxplots e outras representações visuais com ferramentas como o ggplot2.

Além disso, há também um repositório especializado em pacotes R de bioinformática - o Bioconductor.

Através dele, temos acesso a uma coleção de ferramentas prontas para analisar dados genéticos, de proteínas e outras informações biológicas.

Na tabela a seguir, temos os principais recursos que o R oferece para facilitar suas análises em bioinformática:

Pacote RDescriçãoComo ele ajuda?
BioconductorConjunto abrangente de ferramentas para análises de dados biológicos complexos.Oferece diversos pacotes especializados para trabalhar com dados genômicos, proteômicos e outros tipos de dados biológicos, como DNA e RNA.
DESeq2, limmaRealiza análises estatísticas para identificar diferenças na expressão gênica.Facilita a detecção de genes que estão funcionando de forma distinta entre condições, como ao comparar amostras de tecidos saudáveis e cancerígenos.
ggplot2, pheatmapGera visualizações personalizáveis para dados biológicos.Cria gráficos de calor, boxplots e outras visualizações que ajudam a interpretar as diferenças de expressão gênica de forma intuitiva e informativa.

Agora que observamos a aplicabilidade do R na bioinformática, vamos explorar suas aplicações, em outras áreas.

R em outras áreas

Já podemos notar como o R nos auxilia em diversas áreas. Além disso, a linguagem é amplamente utilizada em campos diversos, alguns dos quais podem ser novas áreas de exploração para você.

Ciências sociais e Geociências são dois exemplos onde o R tem sido empregado. Seja para analisar dados sobre comportamento humano ou para mapear padrões ambientais e climáticos, o R oferece ferramentas que facilitam o trabalho em ambas as áreas.

Ciências sociais

Se você trabalha com pesquisas de opinião, análise de políticas públicas ou tentando entender padrões de comportamento, o R pode simplificar bastante o seu trabalho.

Por exemplo, você está analisando as opiniões sobre uma nova política pública com base nos comentários em redes sociais.

Com o pacote syuzhet, você pode identificar o sentimento predominante nas postagens (positivo, negativo ou neutro). Isso ajuda a entender como a população está reagindo a essa política.

Veja como você pode aplicar esse e outros pacotes no seu dia a dia:

PacoteDescriçãoAplicação
surveyAjusta dados de amostragem complexa para garantir resultados precisos.Útil para pesquisas de opinião, permitindo que você ajuste os dados para representar a população.
tmFacilita a análise de grandes volumes de textos.Ideal para analisar entrevistas ou comentários em redes sociais e identificar padrões.
syuzhetAnalisa o sentimento por trás de textos.Ajuda a identificar se o tom das falas em discursos ou postagens é positivo, negativo ou neutro.

Geociências

Agora se você trabalha com dados espaciais e ambientais. O R poderá te ajudar a mapear regiões, monitorar mudanças ambientais ou até prever desastres naturais.

Caso seja encarregado de monitorar o desmatamento na Amazônia, com o pacote raster você pode processar imagens de satélite de diferentes anos e analisar a evolução do desmatamento em áreas específicas.

Abaixo podemos analisar quais pacotes se encaixam nessas tarefas:

PacoteDescriçãoAplicação no dia a dia
spTrabalha com dados geoespaciais, facilitando a criação de mapas.Ideal para mapear áreas de risco, como regiões afetadas por desastres naturais.
rasterAnalisa e processa imagens de satélite e mapas raster.Útil para monitoramento de desmatamento ou mudanças no uso do solo ao longo do tempo.
sfFacilita o trabalho com coordenadas e dados geográficos.Perfeito para trabalhar com localização de recursos naturais, como rios ou áreas protegidas.
ggplot2Cria gráficos e mapas e informativos.Ajuda a apresentar seus dados de forma clara, tornando os resultados mais compreensíveis.

Conclusão

Ao longo deste artigo, exploramos as diversas aplicações da linguagem R e como ela tem se consolidado como uma ferramenta essencial em diversas áreas.

Se você chegou até aqui, é possível que esteja refletindo sobre como essa linguagem pode se encaixar nas suas necessidades diárias, e acredito que ficou claro que o R pode ser um grande aliado.

Lembra como ele pode ser usado para análises genômicas ou para prever tendências em dados financeiros?

É justamente essa adaptabilidade que faz do R uma das linguagens favoritas entre cientistas de dados, estatísticos e pesquisadores.

Seja você uma pessoa que trabalha com grandes volumes de dados ou apenas alguém interessado em melhorar a qualidade das análises do seu dia a dia, o R certamente oferece ferramentas para isso.

Perspectivas futuras para a linguagem

E o futuro do R? Você também deve estar se perguntando se vale a pena investir tempo nessa linguagem.

A resposta é um grande “sim”! À medida que a análise de dados se torna cada vez mais indispensável no mercado, a tendência é que o R continue a evoluir e ganhar novos recursos.

A integração do R com outras linguagens e ferramentas também deve se fortalecer, tornando os fluxos de trabalho mais eficientes e colaborativos.

Além disso, com o crescimento da comunidade e novos pacotes, o R continuará evoluindo e oferecendo grandes oportunidades.

Falamos sobre as perspectivas do R, e é natural que você esteja se perguntando como dar os primeiros passos ou como aprofundar seus conhecimentos na linguagem. A boa notícia é que a Alura tem cursos que podem te ajudar nessa jornada!

Estudando R na Alura

Se, depois de tudo que observamos, você está decidido a aprender ou se aperfeiçoar no R, a Alura oferece exatamente o que você precisa.

Com conteúdos pensados para diferentes níveis e necessidades, você pode começar hoje a transformar sua forma de trabalhar com dados.

Não, perde tempo, não! Comece agora e dê um grande passo na sua carreira, transformando suas habilidades com dados em um verdadeiro diferencial competitivo:

E aí, já conhecia todo esse potencial incrível que o R oferece para análise de dados? Você já usou essa linguagem poderosa em algum projeto ou ficou com vontade de experimentar?

Conta para nós como tem sido sua experiência! Marque os perfis da Alura nas redes sociais e use a hashtag #AprendiNaAlura para compartilhar sua jornada no aprendizado do R.

Nos vemos na próxima!

Monalisa Meyrelle de Sousa Silva
Monalisa Meyrelle de Sousa Silva

Monalisa é estudante de Sistemas de Informação pela Universidade Federal de Pernambuco e faz parte do time Suporte Educacional da Escola Semente da Alura. Atualmente, o seu maior foco de aprendizagem é na área de Data Science. Acredita que a melhor forma de aprender é ensinando; por isso, sente prazer ao solucionar uma dúvida de um aluno.

Veja outros artigos sobre Data Science