Big Data

/Big Data

Programação em R – Parte 4 (Fatores)

Confira todos os textos da série Programação em R: Programação em R - Parte 1 (Introdução) Programação em R - Parte 2 (Manipulações simples; números e vetores) Programação em R - Parte 3 (Entendendo e manipulando objetos) Programação em R - Parte 4 (Fatores) Programação em R - Parte 5 (Matrizes) Programação em R - Parte 6 (Listas e Data Frames) Programação em R - Parte 7 (Lendo Dados de Arquivos) Programação em R - Parte 8 (Agrupamentos, Loops e Execução Condicional) Programação em R - Parte 9 (Exibindo Gráficos) Fatores ordenados e não ordenados Um fator é um objeto [...]

Programação em R – Parte 3 (Entendendo e Manipulando Objetos)

@page { margin: 2cm } p { margin-bottom: 0.25cm; border: none; padding: 0cm; line-height: 115%; text-align: left; page-break-inside: auto; orphans: 2; widows: 2; page-break-after: auto } a:link { so-language: zxx } Confira todos os textos da série Programação em R: Programação em R - Parte 1 (Introdução) Programação em R - Parte 2 (Manipulações simples; números e vetores) Programação em R - Parte 3 (Entendendo e manipulando objetos) Programação em R - Parte 4 (Fatores) Programação em R - Parte 5 (Matrizes) Programação em R - Parte 6 (Listas e Data Frames) Programação em R - Parte 7 (Lendo Dados [...]

Programação em R – Parte 2 (manipulações simples; números e vetores)

Confira todos os textos da série Programação em R: Programação em R - Parte 1 (Introdução) Programação em R - Parte 2 (Manipulações simples; números e vetores) Programação em R - Parte 3 (Entendendo e manipulando objetos) Programação em R - Parte 4 (Fatores) Programação em R - Parte 5 (Matrizes) Programação em R - Parte 6 (Listas e Data Frames) Programação em R - Parte 7 (Lendo Dados de Arquivos) Programação em R - Parte 8 (Agrupamentos, Loops e Execução Condicional) Programação em R - Parte 9 (Exibindo Gráficos) Vetores e atribuição R opera em estruturas de dados nomeadas. [...]

Programação em R – Parte 1 (Introdução)

Confira todos os textos da série Programação em R: Programação em R - Parte 1 (Introdução) Programação em R - Parte 2 (Manipulações simples; números e vetores) Programação em R - Parte 3 (Entendendo e manipulando objetos) Programação em R - Parte 4 (Fatores) Programação em R - Parte 5 (Matrizes) Programação em R - Parte 6 (Listas e Data Frames) Programação em R - Parte 7 (Lendo Dados de Arquivos) Programação em R - Parte 8 (Agrupamentos, Loops e Execução Condicional) Programação em R - Parte 9 (Exibindo Gráficos) Introdução Comentei aqui recentemente sobre meu projeto de análise do [...]

5 Tecnologias Que Todo Cientista de Dados Tem Que Conhecer

Você já sabe que o cientista (maluco) de dados é um misto de estatístico, matemático, analista de TI e de negócios. Se não sabia, aprenda aqui. O que a maioria das pessoas não sabe é que se, por um lado, é preciso estudar muito, por outro, quanto mais você estuda mais percebe que não é tão complicado (nem glamoroso :) quanto parecia à primeira vista. Embora a fama de "Profissão Mais Sexy do Século XXI" já tenha pegado, a verdade é que muito do trabalho do cientista de dados envolve "arrumar a bagunça" de conjuntos de dados que não estão [...]

Amazon Web Services: Tudo que Você Deve Saber – Parte 9 (Big Data com EMR)

Amazon EMR É óbvio que, dentre a infinidade de serviços que a Amazon oferece através da sua plataforma de computação em nuvem, haveria algum serviço voltado para análise de grandes volumes de dados. Sim. Este serviço existe. E atende pelo nome de Elastic Map Reduce (EMR). A rigor, hoje o serviço se estende para muito além do map-reduce, oferecendo implantação gerenciada de Hadoop, HBase e Spark e reduzindo o ônus de gerenciamento de configurar e manter esses serviços você mesmo. Links úteis Página Inicial ∙ Guia de versões ∙ FAQ ∙ Preços Alternativas ao EMR e Lock-in A maioria dos [...]

20 Coisas Incríveis que a Inteligência Artificial poderá Fazer no Futuro Próximo!

O debate sobre os benefícios e malefícios da inteligência artificial tem sido intenso nos últimos anos e deve continuar assim por um bom tempo. Por isso eu resolvi selecionar 20 das coisas mais legais que eu li que a inteligência artificial vai viabilizar no futuro próximo. Ao mesmo tempo, sei que há riscos reais relacionados ao mau uso da tecnologia. Mas vou deixar pra falar disso outro dia. Foco no positivo hoje, ok? Vamos à lista. 1 - Governo Acessível A inteligência artificial pode abrir a oportunidades para os cidadãos interagirem com o governo de uma maneira que nunca foi [...]

Inteligência Artificial: 100+ Ferramentas pra você usar hoje!

Lyra é um assistente virtual de IA que te ajuda a monitorar suas emissões de carbono. O pessoal que desenvolveu esta solução resolveu fazer um levantamento IN-CRÍ-VEL, e listaram mais de 100 ferramentas de IA para uso pessoal!!! Veja bem. É apenas a primeira parte de um levantamento com 3 etapas, a primeira voltada para ferramentas que usam IA para te ajudar a usar melhor seu dinheiro, cuidar da saúde, planejar viagens, encontrar emprego e muito, muito mais! Eu não resisti e pedi ajuda pra traduzir a lista, completinha, e compartilhar aqui com você. Então vamos lá conferir estas 100+ ideias [...]

6 Dúvidas Comuns Sobre Big Data e o Cientista de Dados Respondidas!

Há pouco mais de 6 meses fiz uma pesquisa junto a você que acompanha o Tecnologia que Interessa!, sobre suas dúvidas em relação a Big Data e Ciência de Dados. Lamentavelmente, apenas agora pude tabular os resultados e verificar as dúvidas mais comuns, bem como outras informações interessantes sobre a percepção dos profissionais de TI em relação ao tema.        Mas vamos ao que interessa: os dados! E eles são bem interessantes! Algumas observações preliminares sobre as respostas: A pesquisa solicitava informar se o respondente estava empregado e sua área de atuação, e com isso foi possível perceber algumas [...]

Tudo que você queria saber sobre Agrupamento (Clustering) e não tinha a quem perguntar!

Por André Camacam Diferentes clusters em diferentes pontos coloridos (De Matthew Mayo’s Palavras Chave de Aprendizagem de Máquina, Explicado) Iniciando com Ciência de Dados (Data Science) ou precisando dar aquela refrescada na memória? O agrupamento encontra-se entre as ferramentas mais utilizadas pelos Cientistas de Dados. A seguir você vai ver 10 termos relacionados ao "tal de clustering" e suas definições. Agrupamento é um método de análise de dados, que agrupa pontos de dados em conjunto para “maximizar similaridades dentro da classe e minimizar similaridades entre as classes” (Han, Kamber & Pei), sem utilizar rótulos de pontos pré-definidos (ou seja, uma [...]