Big Data Analytics

Início/Big Data Analytics

Programação em R – Parte 3 (Entendendo e Manipulando Objetos)

@page { margin: 2cm } p { margin-bottom: 0.25cm; border: none; padding: 0cm; line-height: 115%; text-align: left; page-break-inside: auto; orphans: 2; widows: 2; page-break-after: auto } a:link { so-language: zxx } Confira todos os textos da série Programação em R: Programação em R - Parte 1 (Introdução) Programação em R - Parte 2 (Manipulações simples; números e vetores) Programação em R - Parte 3 (Entendendo e manipulando objetos) Programação em R - Parte 4 (Fatores) Programação em R - Parte 5 (Matrizes) Programação em R - Parte 6 (Listas e Data Frames) Programação em R - Parte 7 (Lendo Dados [...]

Programação em R – Parte 2 (manipulações simples; números e vetores)

Confira todos os textos da série Programação em R: Programação em R - Parte 1 (Introdução) Programação em R - Parte 2 (Manipulações simples; números e vetores) Programação em R - Parte 3 (Entendendo e manipulando objetos) Programação em R - Parte 4 (Fatores) Programação em R - Parte 5 (Matrizes) Programação em R - Parte 6 (Listas e Data Frames) Programação em R - Parte 7 (Lendo Dados de Arquivos) Programação em R - Parte 8 (Agrupamentos, Loops e Execução Condicional) Programação em R - Parte 9 (Exibindo Gráficos) Vetores e atribuição R opera em estruturas de dados nomeadas. [...]

Programação em R – Parte 1 (Introdução)

Confira todos os textos da série Programação em R: Programação em R - Parte 1 (Introdução) Programação em R - Parte 2 (Manipulações simples; números e vetores) Programação em R - Parte 3 (Entendendo e manipulando objetos) Programação em R - Parte 4 (Fatores) Programação em R - Parte 5 (Matrizes) Programação em R - Parte 6 (Listas e Data Frames) Programação em R - Parte 7 (Lendo Dados de Arquivos) Programação em R - Parte 8 (Agrupamentos, Loops e Execução Condicional) Programação em R - Parte 9 (Exibindo Gráficos) Introdução Comentei aqui recentemente sobre meu projeto de análise do [...]

5 Tecnologias Que Todo Cientista de Dados Tem Que Conhecer

Você já sabe que o cientista (maluco) de dados é um misto de estatístico, matemático, analista de TI e de negócios. Se não sabia, aprenda aqui. O que a maioria das pessoas não sabe é que se, por um lado, é preciso estudar muito, por outro, quanto mais você estuda mais percebe que não é tão complicado (nem glamoroso :) quanto parecia à primeira vista. Embora a fama de "Profissão Mais Sexy do Século XXI" já tenha pegado, a verdade é que muito do trabalho do cientista de dados envolve "arrumar a bagunça" de conjuntos de dados que não estão [...]

Tudo que você queria saber sobre Agrupamento (Clustering) e não tinha a quem perguntar!

Por André Camacam Diferentes clusters em diferentes pontos coloridos (De Matthew Mayo’s Palavras Chave de Aprendizagem de Máquina, Explicado) Iniciando com Ciência de Dados (Data Science) ou precisando dar aquela refrescada na memória? O agrupamento encontra-se entre as ferramentas mais utilizadas pelos Cientistas de Dados. A seguir você vai ver 10 termos relacionados ao "tal de clustering" e suas definições. Agrupamento é um método de análise de dados, que agrupa pontos de dados em conjunto para “maximizar similaridades dentro da classe e minimizar similaridades entre as classes” (Han, Kamber & Pei), sem utilizar rótulos de pontos pré-definidos (ou seja, uma [...]

Guia do Consumidor para Big Data e Ciência de Dados (tudo que você precisa saber pra começar a adotar a tecnologia)

Introdução Estamos nadando em dados – estruturados e não estruturados, gerados por pessoas e máquinas. Os dados estão sendo criados a taxas quase inimagináveis e este cenário tende a aumentar. Estamos criando oceanos de dados provenientes de empresas, agências governamentais e até mesmo a interação de indivíduos através de redes públicas e privadas ao redor do globo. Ao longo dos próximos anos, outro bilhão de usuários vão se conectar à Internet, com mais e mais dispositivos inteligentes, conduzindo transações on-line de dados a níveis cada vez mais elevados. O fluxo de informação digital dentro e entre empresas também está crescendo [...]

Carreira em Big Data é uma escolha inteligente? 6 Provas que SIM!

Como ingressar em uma carreira em Big Data e Inteligência Artificial? Planeje-se para investir seu tempo em obter a certificações para adquirir experiência em frameworks relacionados, como Hadoop, Spark etc. É muito comum ver profissionais PERDIDOS diante de tantos conceitos, técnicas e ferramentas. Talvez você esteja se sentindo CONFUSO... Precisando de ajuda pra encontrar um caminho... Pra saber por onde começar... Neste caso uma conversa pode ajudar... Conversar com alguém mais experiente ajuda... A ter mais CLAREZA dos seus objetivos... A identificar os maiores DESAFIOS que vocẽ terá pela frente... A traçar um PLANO pra superar esses desafios... Parece interessante? [...]

Guia de 5 minutos sobre Spark

A MapR, empresa responsável por uma das principais distribuições Hadoop, traz um ótimo texto sobre as diferenças entre o Spark e o MapReduce, por que é mais fácil desenvolver em Spark, e os cinco principais casos de uso. Então, o que é o Spark? Spark é um outro framework de execução. Assim como o MapReduce, que funciona com um sistema de arquivos para distribuir os seus dados através do cluster e processá-los em paralelo. Ele também tem um conjunto de instruções de um aplicativo escrito por um desenvolvedor. O MapReduce foi codificado a partir do Java. O Spark não suporta apenas [...]

Os 7 projetos mais comuns com Hadoop

Crédito: flickr / Robert Scoble De acordo com a Infoworld, a maioria dos projetos Hadoop se encaixa perfeitamente em um desses sete tipos. O artigo cita um provérbio que diz: se você oferecer a alguém o seu total apoio e respaldo financeiro para fazer algo diferente e inovador, vai acabar fazendo o que todo mundo está fazendo. Todo mundo pensa que está fazendo algo especial com estas novas tecnologias de Big Data, mas não demora muito para encontrar os mesmos padrões. Alguns casos específicos podem diferir um pouco, mas aqui estão os sete projetos mais comuns. Projeto 1: Consolidação de [...]

Por |2020-05-09T15:47:32-03:00dezembro 21st, 2015|Big Data, Big Data Analytics, tudo-sobre|0 Comentários

10 termos do Aprendizado de Máquina (Machine Learning) que você deve aprender o quanto antes!

Se você é novo no contexto do Aprendizado de Máquina e suas aplicações (como eu), então já se deparou com alguns termos muito técnicos que são muitas vezes difíceis para os iniciantes entenderem. Por isso, resolvi traduzir os 10 termos de Aprendizagem de Máquina relacionados pelo KDNuggets, num esforço louvável de torná-los mais fáceis de entender. Vamos a eles. Aprendizado de Máquina (Machine Learning) É um subcampo da ciência da computação e inteligência artificial (IA) que incide sobre a concepção de sistemas que podem aprender e tomar decisões e previsões baseadas em dados. O aprendizado de máquina permite que os computadores [...]

Ir ao Topo