Apache Spark

/Apache Spark

Processamento Paralelo e Iterativo para Recomendações de Aprendizado de Máquina com Spark

O texto a seguir é uma tradução livre de um tutorial da MapR que achei muito interessante. Espero que também ache :) Sistemas de recomendação ajudam a estreitar suas escolhas para aquelas que melhor atendem às suas necessidades, estando entre os mais populares aplicativos de processamento de Big Data. Neste post vamos discutir a construção de um modelo de recomendação de classificação de filmes, semelhante a estes dois artigos: Um Olhar Interno aos Componentes de um Mecanismo de Recomendação e Sistema de Recomendação com Mahout e Elasticsearch, mas desta vez usando um algoritmo iterativo e processamento paralelo com Apache Spark MLlib. [...]

Guia de 5 minutos sobre Spark

A MapR, empresa responsável por uma das principais distribuições Hadoop, traz um ótimo texto sobre as diferenças entre o Spark e o MapReduce, por que é mais fácil desenvolver em Spark, e os cinco principais casos de uso. Então, o que é o Spark? Spark é um outro framework de execução. Assim como o MapReduce, que funciona com um sistema de arquivos para distribuir os seus dados através do cluster e processá-los em paralelo. Ele também tem um conjunto de instruções de um aplicativo escrito por um desenvolvedor. O MapReduce foi codificado a partir do Java. O Spark não suporta apenas [...]

By |2018-08-29T10:16:54+00:00dezembro 28th, 2015|Apache Spark, Big Data, Big Data Analytics, noticias-tecnologia|0 Comments