OBS: Caros visitantes, curtam a página do R Mining no Facebook, aqui ao lado! Agradeço muito.
Caros leitores do blog, por conta de diversos fatores eu só estou conseguindo postar agora, pela primeira vez esse ano, em fevereiro. Enfim, demorou, mas eu tenho algo que eu acho que pode ser interessante. Um grupo de amigos, arquitetos de soluções em grandes empresas de São Paulo, está organizando alguns hangouts sobre Big Data. Você pode assistir os hangouts que estão disponíveis até o momento nesse playlist, ou mesmo ver um por um aqui:
- BIG DATA – Buscando as respostas onde elas estão.
- Falando sobre Arquitetura para Big Data.
- Cluster – Segmentação de Clientes
Eu tive a oportunidade de ser comentarista em dois deles.
E o que é esse post então? Bom, como de repente alguém poderia querer ver os códigos utilizados no terceiro vídeo, e até alguns exemplos suplementares, eu vou apresentar aqui o link dos códigos no Github e também vou destacar o que eu acho interessante sobre a análise.
- Essa é uma análise simples e o conjunto de dados é bem pequeno;
- A ideia é apresentar o conceito de cluster;
- Aplicação com segmentação de clientes;
- Descobrir o número de clusters pelo dendograma;
- Descobrir o número de clusters pelo método do cotovelo;
- Após o agrupamento a análise dos grupos provê insights;
Aqui naturalmente eu não abordei diversos tópicos no que diz respeito a aplicação da metodologia de clusters, mas como uma introdução acho que foi interessante. De resto, não vou colocar mais detalhes, como eu faço regularmente nas análises aqui, pois já temos os códigos e também o vídeo sobre a discussão.