A linguagem R oferece ferramentas que podem ser usadas para visualização, modelagem e leitura de bancos de dados. Mas uma de suas características mais importantes é que é uma excelente ferramenta para preparação de dados. Naturalmente, como em outras linguagens, existem alguns truques que podem (e devem!) ser utilizados para melhorar a performance das tarefas, e especialmente no caso do R essas escolhas tem um impacto gigantesco na performance do scripts. Assim, neste post vou…
Read MoreMineração de Dados
Reconhecimento de dígitos escritos a mão – Parte 1
A tarefa de reconhecimento de dígitos escritos a mão foi um dos primeiro grandes sucessos dos métodos de aprendizado de máquina. Hoje em dia, a tarefa pode ser realizada por diversas bibliotecas especializadas com altíssima acurácia (> 97% de acertos), tal que muitas vezes, apesar de utilizarmos indiretamente esses recursos em tablets e smartphones, em geral não sabemos exatamente como o método funciona. Pensando nisso, como já trabalhei com esse problema antes, vou demonstrar nesse post…
Read MoreData Preparation – Part I
The R language provides tools for modeling and visualization, but is still an excellent tool for handling/preparing data. As C++ or python, there is some tricks that bring performance, make the code clean or both, but especially with R these choices can have a huge impact on performance and the “size” of your code. A seasoned R user can manage this effectively, but this can be a headache to a new user. SO, in this…
Read MoreLançamentos em Anlytics
No mês de julho serão lançados três títulos muito interessantes para quem é da área de análise de dados: Applied Predictive Modeling (Max Kuhn e Kjell Johnson), Dynamic Documents with R and knitr (Yihui Xie) e An Introduction to Statistical Learning: with applications in R (Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani). Os três livros abordam aspectos de modelagem e geração de documentos, todos utilizando a linguagem open source R. Cada…
Read More