O R é um ambiente de programação para a computação estatística e gráfica. Pelo facto de ser gratuito, tornou-se conhecido internacionalmente como a língua franca da programação em estatística, após ter recolhido a adesão de uma enorme comunidade técnica e científica espalhada por todo o mundo, que não só o utiliza, como o desenvolve através de inúmeras contribuições, fazendo deste programa uma das ferramentas estatísticas mais completas e em atualização permanente.
Para utilizar o R é necessário conhecer a linguagem. Este livro tem por objetivo conduzir o leitor através de uma sequência de etapas, delineadas para permitir uma abordagem simples e direta, desde o download a partir do sítio do R project for statistical computing, até à construção de funções complexas.
No capítulo 1 estudam-se os principais operadores, as estruturas de dados, desde os escalares e vetores até às tabelas tridimensionais e algumas funções elementares; no capítulo 2 faz-se uma abordagem à escrita de pequenos programas, manipulação, importação e exportação de dados, gravação de sessões de trabalho e estruturas de controlo para automatização de operações; nos capítulos 3 e 4 estudam-se operações com matrizes e vetores aplicadas a algoritmos estatísticos, vetores e valores próprios e decomposição de matrizes simétricas; o capítulo 5 ensina a construir gráficos e a controlar todos os seus aspetos, como cores, posições, tamanhos, etc.; o capítulo 6 expõe a forma como o R lida com as distribuições de probabilidades mais utilizadas, desde a execução de cálculos simples, até à apresentação de soluções gráficas.
Ao longo do livro a complexidade dos problemas aumenta. Presta-se especial atenção às funções do R, terminando com uma série de casos de estudo que abordam problemas específicos, incluindo alguns para os quais o R não tem solução, mas que podem resolver-se através da criação de funções específicas a partir de algoritmos publicados por outros autores (capítulos 7 e 8). O último caso de estudo é aproveitado para ilustrar, passo-a-passo, a forma como se acede às contribuições feitas por outros autores, disponíveis no R através do download de pacotes específicos.
Prefácio
1. Questões básicas
1.1. Instalação do R
1.2. Início de uma sessão no R
1.3. Operações básicas no R
1.4. Objetos
1.5. As funções c( ), seq( ), rep( ), paste( ), cat( )
1.6. Funções do R para estruturar os dados
2. Automatização de operações
2.1. Programas em R
2.2. Ficheiros com exemplos
2.3. Importação e exportação de dados
2.4. Estruturas de controlo
2.5. Função function( )
3. Operações com Vetores e Matrizes
3.1. Sobre a álgebra linear
3.2. Vetores e Matrizes
3.3. Aplicações de Vetores e Matrizes em Estatística
3.4. Aplicações a dados não supervisionados
3.5. Dados supervisionados
4. Vetores e Matrizes: Tópicos avançados
4.1. Matrizes simétricas
4.2. Valores e vetores próprios
4.3. Aplicações
5. Aspetos gráficos
5.1 Questões gerais sobre gráficos
5.2 Outras funções gráficas específicas
5.3 Análise de componentes principais
6. Probabilidade e estatística
6.1 Algumas notas sobre probabilidades
6.2 Noção de distribuição de probabilidades
6.3 Modelos para variáveis aleatórias discretas
6.4 Modelos para variáveis aleatórias conteínuas
7. Dois pequenos casos de estudo
7.1 Métodos relativos à correlação
7.2 Biplots
8. Caso de estudo: inspeção por amostragem
8.1 Colocação do problema
8.2 Cálculo de probabilidade de aceitação
8.3 Curvas características operacionais
8.4 Planos com riscos pré-determinados
8.5 Funções do R para planos de amostragem
8.6 Função Encontrar.Planos.Duplos( )
8.7 Conclusões sobre planos de amostragem
Referências e notas bibliográficas
Manuel Rui F. Azevedo Alves é investigador do REQUMTE (Laboratório Associado para a Química Verde), e Professor Coordenador no Departamento de Ciências da Engenharia e Tecnologia do Instituto Politécnico de Viana do Castelo. Uma grande parte da sua carreira profissional tem sido dedicada ao estudo das aplicações da estatística para a solução de problemas do quotidiano, o que se reflete em mais de 20 publicações em revistas científicas, nomeadamente na área da quimioterapia, para além da participação em inúmeras conferências, dentro das quais se destacam os congressos useR! Organizados pelo R Project for statistical computing. Embora mais preocupado com as aplicações do que com os desenvolvimentos teóricos, desenvolveu, automatizou e publicou algoritmos para aplicações na estatística multivariada, nomeadamente na área dos biplots.
Oriundo das áreas da biologia e da química, é licenciado em Ciências do Meio Aquático e Mestre em Ciência e Tecnologia Alimentar. Desenvolveu uma tese de provas públicas sobre aplicações estatísticas no controlo da qualidade de alimentos e doutorou-se em Ciências Farmacêuticas (ramo de Nutrição e Química dos Alimentos), com uma tese quase totalmente dedicada à quimioterapia. Após uma pós-graduação em six-sigma (nível black belt), tem vindo a colaborar com empresas na implementação de soluções estatísticas para problemas de redução de quebras e implementação de melhorias nos processos de negócio.