Caros leitores, fizemos um novo hangout na semana passada, desta vez sobre regras de associação. Vocês podem conferir aqui o vídeo: Para resumir, no vídeo falamos um pouco sobre o que são as regras de associação, as aplicações em vendas cruzadas e recomendação e foi apresentado também um exemplo prático da famosa “market basket analysis” ou análise de cestas de mercado. O material usado na apresentação, com os slides em PDF e os códigos, está…
Read MoreAuthor: Flavio Barros
Cluster – Segmentação de Clientes
OBS: Caros visitantes, curtam a página do R Mining no Facebook, aqui ao lado! Agradeço muito. Caros leitores do blog, por conta de diversos fatores eu só estou conseguindo postar agora, pela primeira vez esse ano, em fevereiro. Enfim, demorou, mas eu tenho algo que eu acho que pode ser interessante. Um grupo de amigos, arquitetos de soluções em grandes empresas de São Paulo, está organizando alguns hangouts sobre Big Data. Você pode assistir os…
Read MoreCompartilhe Shiny Apps com o Docker e o Kitematic!
Há algum tempo atrás eu escrevi nesse blog sobre como “dockerizar” uma aplicação Shiny. Se você não sabe o que é o Docker ou o que eu quero dizer com “dockerizar uma aplicação Shiny” eu lhe aconselho dar uma olhada nesse post: Dockerizando Shiny Apps Eu usei esta solução para criar uma forma fácil de fazer o deploy (ou implatação) de Apps Shiny em servidores web, uma vez que na prática, se você quiser fazer…
Read MoreLinux e data science
Até hoje, infelizmente, nunca escrevi sobre o Linux neste blog. Infelizmente pois o Linux foi, e ainda é, um dos meus hobbies prediletos. Eu tive uma das primeiras experiências com o Linux por meio do Conectiva 4, em 1999, mas acabei na época não o utilizando integralmente, principalmente, por conta dos famigerados winmodems. Também utilizei esporadicamente outra famosa distribuição Live CD brasileira, o Kurumin Linux, mas só passei a utilizar o Linux integralmente a partir de…
Read MoreCurso “Pratical Machine Learning” do Coursera
Em mais uma rodada das resenhas de cursos sobre Data Science, desta vez vou apresentar minha avaliação do curso “Pratical Machine Learning“, ou Machine Learning Prático. 1. Sobre o que é o curso? Este é o penúltimo curso da especialização em Data Science do Coursera do Coursera. Já falei sobre o último da sequência aqui nesse blog, o Developing Data Products, mas este é o último onde são apresentados conceitos novos de Data Science. Como o…
Read MoreReconhecimento de dígitos escritos a mão – PARTE 2
Na Parte 1 desse post (que já publiquei faz um tempão!) eu fiz uma classificação de imagens de dígitos escritos mão usando o k-nn (algoritmo dos vizinhos mais próximos) usando as informações das imagens sem nenhum tipo de tratamento, isto é, sem nenhum método de preparação. Como foi mostrado, o k-nn só foi capaz de classificar razoavelmente bem com com k = 1 e conseguiu uma acurácia de apenas 78%, algo muito distante do que ainda…
Read More