Inspired by this article i thought about gather here all multimedia resources that i know to learn use R. Today there is a lot of online courses, some MOOC’s too, that offer reasonable resources to start with R. I will just list the materials in sequence and offer my evaluation about them. Of course your evaluation can be different; this case fell free to comment. In the future i can update the material. Let’s begin:…
Read MoreR e RStudio
Genetic data, large matrices and glmnet()
Recently talking to a colleague, had contact with a problem that I had never worked with before: modeling with genetic data. I have no special knowledge of the subject, but taking a look at some articles in the area knew that one of the most used techniques for this type of data was the lasso. In R, one of the most used packages for the lasso is glmnet, which unlike most other packages like…
Read MoreData Preparation – Part I
The R language provides tools for modeling and visualization, but is still an excellent tool for handling/preparing data. As C++ or python, there is some tricks that bring performance, make the code clean or both, but especially with R these choices can have a huge impact on performance and the “size” of your code. A seasoned R user can manage this effectively, but this can be a headache to a new user. SO, in this…
Read MoreDados genéticos, grandes matrizes e o glmnet()
Recentemente, conversando com um colega, tive contato com um problema com o qual eu nunca tinha trabalhado antes: modelagem com dados genéticos. Não tenho nenhum conhecimento especial do assunto, mas dando uma olhada em alguns artigos da área soube que uma das técnicas mais utilizadas para esse tipo de dado era o lasso. No R, um dos pacotes mais utilizados para o lasso é o glmnet, que diferente da maioria dos outros pacotes como…
Read MoreANOVA and Tukey’s test on R
OBS: This is a full translation of a portuguese version. In many different types of experiments, with one or more treatments, one of the most widely used statistical methods is analysis of variance or simply ANOVA . The simplest ANOVA can be called “one way” or “single-classification” and involves the analysis of data sampled from more then one population or data from experiments with more than two treatments. It’s not my intent to study in…
Read MoreANOVA e teste de Tukey no R
Em muitos tipos diferentes de experimentos, com um ou mais de um fator, um dos procedimentos estatísticos mais utilizados é a análise de variância, ou simplesmente ANOVA. O ANOVA mais simples pode ser chamado “one way” ou mesmo “single-classification” e envolve a análise de dados amostrados de mais de uma população ou dados de experimentos com mais do que dois tratamentos. Nesse post não é o meu objetivo estudar a fundo o ANOVA, mas sim…
Read MoreLançamentos em Anlytics
No mês de julho serão lançados três títulos muito interessantes para quem é da área de análise de dados: Applied Predictive Modeling (Max Kuhn e Kjell Johnson), Dynamic Documents with R and knitr (Yihui Xie) e An Introduction to Statistical Learning: with applications in R (Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani). Os três livros abordam aspectos de modelagem e geração de documentos, todos utilizando a linguagem open source R. Cada…
Read More