Preparação de dados – Parte 1

Preparação de dados – Parte 1

A linguagem R oferece ferramentas que podem ser usadas para visualização, modelagem e leitura de bancos de dados. Mas uma de suas características mais importantes é que é uma excelente ferramenta para preparação de dados. Naturalmente, como em outras linguagens, existem alguns truques que podem (e devem!) ser utilizados para melhorar a performance das tarefas, e especialmente no caso do R essas escolhas tem um impacto gigantesco na performance do scripts. Assim, neste post vou…

Read More

Reconhecimento de dígitos escritos a mão – Parte 1

Reconhecimento de dígitos escritos a mão – Parte 1

A tarefa de reconhecimento de dígitos escritos a mão foi um dos primeiro grandes sucessos dos métodos de aprendizado de máquina. Hoje em dia, a tarefa pode ser realizada por diversas bibliotecas especializadas com altíssima acurácia (> 97% de acertos), tal que muitas vezes, apesar de utilizarmos indiretamente esses recursos em tablets e smartphones, em geral não sabemos exatamente como o método funciona. Pensando nisso, como já trabalhei com esse problema antes, vou demonstrar nesse post…

Read More

Data Preparation – Part I

Data Preparation – Part I

The R language provides tools for modeling and visualization, but is still an excellent tool for handling/preparing data. As C++ or python, there is some tricks that bring performance, make the code clean or both, but especially with R these choices can have a huge impact on performance and the “size” of your code. A seasoned R user can manage this effectively, but this can be a headache to a new user. SO, in this…

Read More

Lançamentos em Anlytics

Lançamentos em Anlytics

  No mês de julho serão lançados três títulos muito interessantes para quem é da área de análise de dados:  Applied Predictive Modeling  (Max Kuhn e Kjell Johnson), Dynamic Documents with R and knitr (Yihui Xie)  e  An Introduction to Statistical Learning: with applications in R (Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani).              Os três livros abordam aspectos de modelagem e geração de documentos, todos utilizando a linguagem open source R. Cada…

Read More
1 2