Análise de Dados com R para Não Programadores (Jornalistas, Advogados, Contadores e profissionais liberais!) 2

Análise de Dados com R para Não Programadores (Jornalistas, Advogados, Contadores e profissionais liberais!)

Análise de Dados com R para Não Programadores (Jornalistas, Advogados, Contadores e profissionais liberais!) 3

A linguagem R é uma das ferramentas mais importantes para análise de dados.

Por isso, muitos profissionais liberais e outros que não são de TI, mas interessados em Análise de Dados, Business Intelligence, Big Data, Ciência de Dados e Inteligência Artificial, acabam se deparando com esta linguagem ao pesquisar sobre o assunto.

E então surgem as dúvidas.

Preciso ser programador pra aprender Linguagem R?

Preciso ser de TI?

Preciso de uma formação técnica na área de exatas?

Esses são mitos que se criaram no mercado, e que são usados para associar uma complexidade que nem sempre precisa existir em projetos de análise de dados.

Posso falar isso com conhecimento de causa, pois estou ajudando uma jornalista a atuar com análise de dados.

Também posso ajudar você.

É perfeitamente possível fazer uma análise de dados simples, mas que gera resultados relevantes, que fazem diferença para os negócios.

Sejam seus resultados de carreira, sejam os resultados da empresa em que trabalha, ou mesmo da sua empresa.

Por isso resolvi escrever este texto com dicas sobre a Linguagem R para que não fique preocupado, ou mesmo assustado, caso não seja de TI e deseje aprender R para aplicar análise de dados, esta habilidade cada vez mais importante em qualquer carreira, em qualquer empresa.

E se desejar se aprofundar, escrevi um livro gratuito sobre Linguagem R para Ciência de Dados que você pode baixar clicando aqui.

A seguir você encontra uma compilação de dúvidas comuns que eu coletei da web para te ajudar a encontrar o melhor caminho para aprender R.

E se precisar de ajuda, basta gritar que estarei te ouvindo 🙂

O que torna a linguagem R boa? O que o torna ruim?

1
Eu era um usuário adiantado de R, começando na universidade e depois no trabalho. A razão pela qual me familiarizei com R foi devido a S. Usamos o S / S-plus, e R era de código aberto e, devido à sua proximidade com o S, foi fácil para muitos de nós pular o navio. Com o tempo, R se tornou mais robusto e pudemos substituir o SAS. R é o idioma para ‘Stats Hackers’. Foi assim que evoluiu.

Como é fácil para uma pessoa que não é de TI aprender o idioma R?

1
Você não precisa ser uma pessoa para aprender R ou qualquer linguagem de programação. Uma coisa que você precisa aprender antes de aprender R é Estatística Básica. Como R é uma linguagem de programação estatística, você não poderá interpretar muitas descobertas sem estatística.

Quais são os pré-requisitos para o aprendizado da linguagem R e ML?

1
Se você já está familiarizado com a programação, é fácil obter o comando sobre a sintaxe da linguagem R. Algumas das estruturas de dados usadas no R podem parecer novas para você. Um bom conhecimento de estatística será útil.

2
Quem está usando a Programação R? → A linguagem de programação R é um software de análise estatística que está se tornando muito popular e usado por: Estatísticos – Gerando várias estatísticas e relatórios a partir de conjuntos de dados. Medidores de dados – Analisando um grande conjunto de dados e gerando relatórios a partir de um grande conjunto de dados. Para desenvolver vários softwares de análise e relatório estatísticos → Portanto, o pré-requisito mais importante é: Conhecimento da teoria estatística em matemática.Você deve ter um sólido conhecimento de estatística em matemática.Compreensão de vários tipos de gráficos para representação de dados. Conhecimento prévio de qualquer programação → Aqui está uma lista de ferramentas usado para programação R: RStudio – Sua ferramenta de código-fonte aberto para programação R. O plug-in Eclipse – Eclipse está disponível para programação R – Visual Studio – Você também pode usar o Microsoft Visual Studio para programação R. Você precisa instalar o R Tools for Visual Studio e usá-lo para programação R → ML? → O pré-requisito real para o aprendizado de máquina não é matemática, é análise de dados.

3
Embora não haja regras rígidas ou pré-requisitos para aprendê-las. No entanto, o conhecimento básico de construções de programação é obrigatório.R é uma linguagem usada para Machine Learning, análise estatística, basicamente para Data Science. Aprendi programação ao mesmo tempo em que estava me ensinando ML, para que as habilidades de programação possam começar de zero a proficiente. O R fornece uma ampla variedade de técnicas estatísticas (modelagem linear e não linear, testes estatísticos clássicos, análise de séries temporais, classificação, agrupamento, etc.) e técnicas gráficas, e é altamente extensível.

A linguagem R é usada na produção em empresas?

1
Sim, pela minha experiência em algumas grandes empresas européias.R com seu pacote Shiny facilita o desenvolvimento e a implantação de aplicativos de estatísticas e visualização de front-end. Além disso, são muitos pacotes para conectar seu aplicativo aos bancos de dados e ao sistema de informações. As principais desvantagens do R eram o fato de ser lento, difícil de usar em grandes conjuntos de dados e rodar em GPU. No entanto, vários pacotes (datatable, dplyr, h2o, keras, …) estão corrigindo esses problemas.

Por que eu precisaria usar a linguagem Alteryx ou R além do Tableau Software?

1
Bem … O Alteryx é uma das ferramentas de negócios de inteligência que mais cresce no mercado no momento. Se você está pensando em aprender o Alteryx, sugiro que visite o CloudFoundation. Insisto em fazer um curso gratuito, se você não tiver nenhum. idéia básica do Alteryx. Como ajuda a entender os conceitos básicos do Alteryx. Primeiro, vamos ver quais são as vantagens que temos com o Alteryx. Reduz o tempo necessário para analisar os dados e procurar informações. É um dos mais completos e excelentes serviços ao cliente O objetivo do trabalho é analisar o comportamento de uma empresa de software em um ambiente de desenvolvimento de software, com o objetivo de otimizar os processos de negócios, aumentar a produtividade e aumentar a lucratividade, além de aumentar a produtividade e aumentar a produtividade. posso dizer que o Alteryx ativa os usuários do Tableau para economizar tempo na mistura e na preparação dos dados. então você pode me comentar abaixo ou deixar seu ID de e-mail para discutir mais.

2
O Tableau é uma ferramenta sólida de análise, mas é um pouco fraca na preparação de dados. Então você normalmente precisa de algo para front-end da manipulação de dados (‘munging’). A escolha do Alteryx ou R depende da sua orientação. por exemplo, se você é um programador, R poderia ser uma boa opção, mas também poderia usar o SQL se fosse mais orientado a dados.

3
R é uma linguagem estatística com mais de 300 pacotes de código aberto que você pode limpar dados, localizar texto, reconhecer padrões temporais, agrupar dados, prever eventos futuros … O Alteryx é uma ferramenta de análise avançada com uma vasta gama de conectores de banco de dados, incluindo o hadoop ecossistema, em que você pode preparar visualmente fluxos de trabalho lógicos para mesclar dados em silos, faça aprendizado de máquina sem entrar em codificação … (das respostas abaixo, o Tableau é uma boa ferramenta de BI, mas não é um mecanismo de preparação de dados e não é avançado análise, apresenta resultados, não há necessidade de misturar)

Como a linguagem R é diferente de Python e Java?

1
R é mais especificamente para codificar / desenvolver módulos para análise de dados avançada. Pode-se construir módulos usando a linguagem R para análises preditivas. Vários algoritmos de mineração de dados podem ser construídos usando o R de maneira muito eficaz. O Python também é usado para os fins acima, mas não se limita apenas a isso, e você pode implementar coisas muito legais, como protocolos de rede e outros com o python. usado em qualquer lugar. Ele existe quase em todos os lugares e é uma linguagem muito forte. Partindo da criação de aplicativos para sites, projetos, algoritmos podem ser programados com Java. E se essa pergunta for muito específica para adaptar uma linguagem para ciência de dados, Python e R são as escolhas. O Python, sem dúvida, é muito forte, mas será necessário mais para trazer domínio, enquanto, por outro lado, o R pode ser aprendido mais rapidamente e também o R fornece uma ampla variedade de pacotes de bibliotecas que, por sua vez, minimizam os esforços de desenvolvimento. é um site de aprendizado gratuito e cobra apenas se você quiser um certificado para o curso em particular, caso contrário, o aprendizado é absolutamente gratuito.

2
R e python são basicamente usados para ciência de dados, onde R é uma linguagem de programação estatística e python pode ser basicamente usado para qualquer finalidade. Python é muito fácil de aprender por causa de sua sintaxe. Java é muito poderoso e amplamente usado. E o mais difícil de aprender é R aqui. O aprendizado R é realmente benéfico se você deseja fazer ciência de dados. Lembre-se de que R é um pouco difícil, mas não impossível. Aprendizagem feliz!

O que há de tão bom na linguagem R? Se o estivéssemos projetando hoje, faríamos as mesmas coisas?

1
Sei que sua pergunta é sobre o idioma base, mas, no momento, o que há de tão bom no idioma R é o quão ativa a comunidade é e a taxa com que os repositórios estão crescendo. Atualmente, o CRAN hospeda 7264 pacotes. Sobre, 1880 foram adicionados ou atualizados nos últimos 100 dias. Isso mesmo, mais de 25% desse recurso incrível é mais recente que 101 dias.Leia a lista do que as pessoas estão fazendo com o R, o alcance e o alcance são fantásticos.

2
Honestamente, a única razão para usar R são as bibliotecas. É de longe o mais abrangente para dados / estatísticas / aprendizado de máquina disponível (mesmo que a documentação seja frequentemente enigmática). Além de ser um pouco amigável para estatísticos com pouca experiência em programação, praticamente todo o resto poderia ser melhorado bastante. Independentemente disso, nada compete nas bibliotecas e todo novo método possui uma implementação R antes de qualquer outra coisa.

3
Claramente, você nunca programou com Java, com o qual escrever código é como tentar construir as pirâmides com palitos para armas, ou você não estaria questionando que o RR é de código aberto, portanto, livre. O código não requer compilação. Os criadores tornaram o desenvolvimento de R incrivelmente útil. Em uma era de domínio STEM, a natureza estatística de R, juntamente com o uso intuitivo de gráficos e visualização, situou R como um candidato à programação, sendo cada vez mais adotado como uma linguagem de script. .

Quais mini projetos podem ser feitos a partir da linguagem R e da mineração de dados?

1
1) Baixe dados de alguma fonte de dados aberta. A biblioteca de mineração de dados UCI é muito boa .2) Faça o pré-processamento dos dados, se necessário .3) Faça a análise exploratória dos dados.4) Defina o problema. (Isso pode ser feito na primeira etapa, se você souber sobre a situação) 4) Procure os algoritmos de mineração de dados que você pode aplicar. 5) Aplique o algoritmo e verifique a precisão.6) Tente melhorar a precisão.7) Procure outro algoritmo e Se a resposta ajudou de alguma forma, por favor, marque como resposta.

Que oportunidades são abertas após o aprendizado da linguagem R?

1
Se você gosta de R, deve ter proficiência suficiente em Estatística, pois R é uma linguagem estatística. Analistas de dados, cientistas de dados e estatísticos usam predominantemente R.Não se restrinja a pensar que você já terminou com R. Você ganhará cada vez mais conhecimento em R somente quando você projeta um após o outro com esse idioma.

O que se entende por linguagem R?

1
Basicamente, a programação R é um programa de código aberto. O Google também está utilizando programação R, pois é uma linguagem adequada para análise estatística. Com o R, podemos criar qualquer forma de estatística e manipulação de dados onde ele executa operações estatísticas e gerar relatórios de análise de dados R em formatos gráficos ou de texto. É melhor para estatística, análise de dados e aprendizado de máquina. Usando esta linguagem, podemos criar objetos, funções e pacotes.Vamos ver os recursos na programação R-R suporta programação procedural com funções e programação orientada a objetos com funções genéricas.Os pacotes também fazem parte da programação R porque são úteis em coleta de conjuntos de funções R em uma única unidade.Inclui entrada de banco de dados, exportação de dados, visualização de dados, rótulos de variáveis e dados ausentes.Ele suporta aritmética matricial.Ele possui instalações eficazes de manipulação e armazenamento de dados.Ele também suporta um grande conjunto de operadores Algumas aplicações práticas sobre RR são a linguagem mais prevalente, porque muitos programadores de análise e pesquisa de dados usam RR é usada como uma ferramenta fundamental para o financiamento.R ajuda na importação e limpeza de dados, dependendo de como da estratégia em que você está usando. Leia mais em detalhes R importação de dados.R é melhor para a ciência de dados porque fornece uma ampla variedade de estatísticas. Ele também fornece ambiente para computação e design estatísticos.

Qual é a maneira correta de aprender análise de dados e linguagem R. Quais são os bons livros para análise de dados e linguagem R.?

1
Obrigado pela A2A, na verdade, é uma boa pergunta. Só pegar informações sobre as pessoas atuais do mercado de TI está muito empolgado em aprender e ter acesso às análises e acabar tendo aulas de R sem nenhuma pesquisa e tudo. A ciência de dados não é fácil, mas também não é impossível. Você pode fazer uma boa carreira em análise, mas precisa trabalhar duro, não há atalho para o sucesso. Falando sobre R, existem alguns requisitos que você precisa entender primeiro. Você precisa ter um conhecimento muito bom sobre 1. conceitos OOP2. Álgebra Linear 3. Estatística e probabilidade4. Boas habilidades analíticas Certifique-se de que você primeiro preencha os requisitos e depois vá para o idioma R.

R se tornará obsoleto no campo da ciência de dados?

1
Por favor, salve nossas almas de R. Python é o antídoto para todos os problemas de R e não pode chegar em breve. Escrevo códigos R e Python há anos e sou um estudante de graduação em ciência de dados e bioinformática agora. Meu trabalho atual é escrever código R de alto desempenho e altamente distribuído para executar trilhões de cálculos em dados multi-ômicos em grande escala. Eu escrevo um código em R que leva cálculos que levariam mais de meio ano para ser executado e o comprime por algumas horas.R agora é como o MySpace era antes do Facebook. É o lugar em que todos estavam, e oferece muitos recursos para fazer o que você quer, mas quando todos saem, ninguém mais vai querer usá-lo. Para mim, R é MUITO dinâmico demais para uma linguagem. ser levado a sério fora das estatísticas e da ciência de dados. Por exemplo, existem várias maneiras de representar falta, incluindo valores nulos, NA, NaN, NA_integer_, NA_character_, NA_string_, etc. valores com diferentes tipos de dados. Além disso, os tipos de dados são multicamadas (matrizes, quadros de dados, tabelas de dados, vários tipos de números e tipos inteiros, etc.) que se tornam a fonte de erros ao reutilizar o código de outras pessoas e além dessa coerção (sem o conhecimento do usuário). ) acontece automaticamente e causa erros estranhos. Às vezes, a coerção é boa, mas na maioria das vezes produz comportamentos indesejados. Isso tudo é estranho, porque linguagens muito dinâmicas como R geralmente são mais difíceis de escrever para o código reproduzível. E a reprodutibilidade é uma pedra angular da ciência. E a ciência agora está enfrentando uma crise de reprodutibilidade bastante séria.R é uma linguagem interpretada, mas os pacotes são compilados em bytes, o que significa que você não pode monitê-los e o desenvolvimento exige que você recompile, reinicie o R e reinstale o pacote. O ecossistema de pacotes R é o ponto de venda mais forte de R, mas a instalação de pacotes R também exige a instalação de compiladores C, C ++ e Fortran (se você estiver no Linux ou precisar compilar a partir do código-fonte). Além disso, os caminhos da biblioteca R são um pesadelo absoluto (você sabia que o R e o Rscript têm caminhos diferentes de pesquisa na biblioteca, então, quando você paralela um pedaço de código R, às vezes não consegue encontrar o pacote que chamou o segmento paralelo?) E eu não tenho ‘ No entanto, muitas vezes eu acho que, especialmente ao trabalhar com um HPC, é muito difícil escrever código que funcione da mesma maneira para todos – dependendo de como plataforma (Mac, PC, Linux), tipos de entrada, versões R e bibliotecas de sistemas instaladas. Estou cansado de passar inúmeras horas procurando a combinação certa de biblioteca C / GCC para corrigir um erro silencioso que ocorre em uma dependência de uma biblioteca do meu código, que só acontece em uma máquina ou que é necessário fazer o downgrade manual de pacotes que quebram o código existente. As atualizações R-base acontecem com muita frequência, e a última mudança para o R 3.5 (que honestamente deveria ter sido chamada de R 4.0) exige a reinstalação de todos os pacotes que você já instalou, o que supera todas as versões do pacote, o que pode quebrar seu código ( como eles fizeram por mim … estou olhando para você, mvtnorm). Eu recomendo a leitura do R Inferno para mais: https: //www.burns-stat.com/pages …. Já faz alguns anos, mas a maior parte ainda é muito relevante.

Qual é a diferença entre a linguagem R e o big data?

1
R é uma linguagem de programação e ambiente de software que é usado principalmente para análise estatística, representação gráfica e geração de relatórios de dados.Whereas Big Data é um termo usado para descrever os dados que são muito complexos e enormes em volume.

2
É simples, deixe-me explicá-lo por exemplo. Uma pessoa está com uma visão ruim, usa óculos para ver claramente os objetos ao seu redor. Aqui R é o vidro e o big data é o objeto.

A linguagem R será extinta em breve?

1
Não, R não será extinto tão cedo. A Microsoft colocou uma pilha enorme de chips na tabela R e há uma comunidade de desenvolvedores ativa. No entanto, o Python continua a ganhar terreno como a linguagem de fato para a produção de ciência de dados do setor, e os dois estão aumentando sua popularidade geral juntos (sem dúvida, dependendo do que você olha.) Se você trabalha com acadêmicos e / ou estatísticos ou precisa de mais de uma “bancada de trabalho”, R é provavelmente uma escolha melhor para você. Se você está trabalhando em um espaço mais amplo da tecnologia ou precisa de algo que possa ser incorporado em um modelo de produção, o Python provavelmente é a melhor escolha. Dica obrigatória para os mais avançados – o Python é a escolha para APIs / front-ends de aprendizado profundo no momento.

É possível substituir o Excel VBA pelo idioma do Excel R? Quão?

1
Tecnicamente, deve ser possível, qualquer idioma, se puder ser compilado e fornecer uma API no Excel. Mas é muito improvável que o R substitua totalmente o VBA, já que o RBA não é de propriedade da Microsoft, mas o VBA é um proprietário para eles. No entanto, existe um projeto chamado REcxel [1] decelopado por Thomas Baier e Erich Neuwirth que permite que o Excel seja usado como frente. fim para R e uma interação bidirecional (Excel para R e R para excel) pode ser possível com alguns recursos promissores. Há também um pdf, que pode ser baixado para saber mais sobre o projeto RExcel. https://www.r-project .org / confer … Notas de rodapé [1] statconn

Como o R se compara ao SPSS?

1
De maneira geral, o SPSS é orientado por menus e projetado para estatísticas fáceis e rápidas. O R é mais orientado à programação e projetado para lidar com estatísticas personalizadas mais sofisticadas. Dito isto, existem muitos usuários do SPSS que são altamente qualificados e fazem coisas que são tão complicadas quanto qualquer outro pacote de estatísticas. Se as estatísticas não são exatamente o que você gosta e você só quer fazer alguma coisa, vá com o SPSS. Se você antecipa um futuro nas estatísticas, também pode entrar no R agora, porque ele ficará incrível em seu currículo.

2
O SPSS não possui Naive Bayes (disponível apenas com a edição para servidor) .R tem tudo. O SPSS não pode ler dados diretamente usando os links da web.

3
O RPS é de código aberto e gratuito, mas o SPSS não é gratuito.O R é base de código, mas o SPSS possui interface de usuário.SPSS é fácil de aprender e entender em comparação com o RR Handel, conjunto de dados maior, mas o SPSS não pode oferecer um conjunto maior de dados. disponível em R, mas não no SPSS.

Por que as pessoas costumam usar a programação em linguagem R para inteligência artificial?

1
R é um ambiente de uso geral para análise de dados. Embora possa não ser o idioma mais rápido para todos os usos, é muito rápido e pode ajudar em quase todas as tarefas de IA que se possa pensar: reunir e limpar conjuntos de dados, usar transformações de matriz e álgebra linear para processar a divisão aleatória de dados de um grande conjunto de dados em treinamento e Os conjuntos de testes aplicam várias funções estatísticas e de aprendizado de máquina. fornecem uma análise da confiabilidade e da qualidade do ajuste dos resultados. Use os resultados para desenvolver previsões sobre novos dados. Monitore as alterações na natureza dos dados recebidos. Todo o processo de desenvolvimento pode ser capturado em um documento de remarcação para facilitar a publicação de descobertas e novas técnicas descobertas. A linguagem foi portada para ambientes de Big Data.Além disso, a linguagem pode até fornecer uma interface web experimental para que os usuários experimentem a análise de dados, criando uma sinergia entre homem e máquina para lidar com grandes Embora o idioma tenha algumas maneiras incomuns de fazer coisas comuns, muito trabalho pode ser feito com jus • Um pequeno código desenvolvido em um ambiente interativo. Isso facilita o desenvolvimento e o teste de novas ideias e a verificação delas com a ampla variedade de funções gráficas fornecidas. Além disso, essa ferramenta inteligente está disponível gratuitamente, é executada em hardware comum e de servidor usando um intérprete de código aberto e suportado por uma comunidade profissional de usuários comprometidos e cientistas de dados (até funciona bem com as soluções Python e SPSS).

2
R é projetado para estatísticas e análise de dados. R é ótimo em trabalhar com dados, apresentando operações para criar e manipular tabelas, fatores, vetores e matrizes de dados. Isso se presta bem à pesquisa de IA entre muitos outros campos acadêmicos.

3
R é uma linguagem de programação de código aberto gratuita usada para análise de dados e análise estatística. Aprender a criar e usar esses aplicativos de Inteligência Artificial com a linguagem de programação RR permitirá que você desenvolva aplicativos de Inteligência Artificial personalizados para implantar dentro de sua própria organização – aplicativos para aprendizado profundo, modelagem preditiva, para extrair informações críticas a partir de resmas de texto etc. R é uma das linguagens e ambientes mais eficazes para analisar e manipular os dados para fins estatísticos. Usando R, podemos facilmente produzir plotagens com qualidade de publicação bem projetadas, incluindo fórmulas matemáticas de símbolos, quando necessário. Além de ser uma linguagem de programação de uso geral, o R possui vários pacotes como Gmodels, RODBC, Class & Tm, que são usados no campo do ML. Esses pacotes facilitam a implementação de algoritmos de ML, para solucionar os problemas associados aos negócios. A ciência de dados está impulsionando o mercado de Inteligência Artificial, com organizações que procuram aproveitar os recursos de IA para modelagem preditiva. Para alavancar esses recursos, as organizações precisam de desenvolvedores treinados no desenvolvimento de aplicativos de IA usando R. As empresas de todo o mundo estão procurando ferramentas e aplicativos mais inteligentes que os ajudem a reduzir os esforços e maximizar os lucros. Se a resposta for informativa, FAVORECE !!!

Onde posso aprender a linguagem R?

1
Você pode aprender o idioma R on-line, existem alguns especialistas em programação R que oferecem cursos on-line, para que você possa aprender com eles. Sugiro que você ofereça os melhores cursos on-line de programação RAprenda R por prática intensiva [Curso de nível iniciante a avançado] R é conhecido por tenha uma curva de aprendizado acentuada e as explicações na maioria dos tutoriais geralmente são vagas e de alto nível. Mas este curso é diferente. Os conceitos são estruturados passo a passo, onde um conceito leva ao próximo tópico lógico e se baseia nele. Todos os tópicos são encerrados com um desafio de codificação associado semelhante ao que você encontrará no mundo real.No final do curso, você não apenas entenderá como eles funcionam, mas também se sentirá confortável para fazer qualquer tipo de manipulação de dados que possa imaginar. Esse tipo de habilidade requer muita prática. Os estudos mostram que, se você pratica o que aprendeu dentro de 24 horas depois de aprendê-lo, sua compreensão dura mais e você ganha a capacidade de aplicar instintivamente o que aprendeu no mundo real. É por isso que, no final da maioria das lições, você recebe uma desafio de codificação e solicitou que você resolvesse antes de passar para o próximo tópico. Espero sinceramente que você leve esses desafios a sério. É menos importante se você receber a resposta em um minuto ou uma hora. O que importa é que você faça uma tentativa honesta. Além disso, eu revelo a resposta no final dos vídeos.Você pode aprenderFazer qualquer tipo de manipulação de dadosCrie e domine a manipulação de vetores, listas, quadros de dados e matrizesEscreva estruturas de controle condicional, depure e lide com erros de forma eficiente Qualquer lógica dentro da função de aplicação. Em R para Ciência de DadosFundamentos Práticos de Programação R

Por que R é uma ferramenta tão popular de ciência de dados?

1
O R foi criado por estatísticos para estatísticos, que contribuíram com seus pacotes / bibliotecas, tornando-os sem dúvida o mais extenso dentre outros pacotes.R está sob licença de código-fonte aberto, tornando-o facilmente acessível a todos.R tem uma das maiores comunidades de suporte online .R é uma linguagem baseada em funções, facilitando a escrita do código R do que outras línguas.

Quais são as melhores maneiras de usar o Excel, a linguagem R e outras ferramentas para encontrar tendências obscuras nos dados?

1
Não pesquise seus dados procurando estranheza. Se o fizer, eventualmente encontrará algo, e isso não fará sentido porque você estava pesquisando através do ruído. Em vez disso, decida com antecedência o que você geralmente deseja saber sobre seus dados e pense em resumos e descrições para isso. Então, se você encontrar algo que parece estranho, você o encontrará honestamente. Se você deseja ajudar o Excel ou o R a produzir um resumo ou descrição em particular, faça isso como uma pergunta separada.

2
A melhor maneira de usar o Excel NÃO é usar o Excel. O Excel foi criado para donas de casa por donas de casa em algum lugar entre o 4º e o 5º círculo do inferno. Tente visualizar o máximo de dados possível (como você pode analisar, é claro). Use gráficos básicos como histograma, gráfico de barras, gráfico de matriz, gráfico de caixa, matriz de correlação, gráfico de dispersão. Além disso, você pode experimentar ferramentas mais sofisticadas como PCA, mapa de Kohonen, redes neurais auto-organizadas, mas essas ferramentas consomem mais tempo e não são tão claras quanto as plotagens simples.

3
Você pode experimentar o Vizydrop | Software de visualização de dadosTemos sugestões de gráficos automáticos integrados que reduzirão o tempo de descobrir tendências, relações de campos e correlações e fornecerão informações rápidas sobre seus dados.

Quem usa a linguagem R?

1
Onde eu trabalho (grandes biotecnologias), os seguintes departamentos usam R: biologia computacional, descoberta de medicamentos, bioestatística (porém, eles usam mais o SAS), inteligência comercial, ciência de dados, saúde digital e Um pouco sobre segurança de medicamentos e medicina baseada em valores. É realmente o idioma preferido para muitas áreas das ciências da vida.

Quanto tempo leva para aprender a programação R?

1
É impossível responder diretamente a essa pergunta. Em primeiro lugar, é necessário definir qual nível de domínio está implícito em “aprender programação R”. É tudo relativo. Para quase qualquer linguagem de programação abrangente moderna, não há um momento específico, quando se pode dizer que ela aprendeu a linguagem. Quase não há limite. Só se pode dizer que eles conhecem um idioma específico o suficiente para executar determinadas tarefas. Isso é duplamente verdadeiro para R devido à sua extrema flexibilidade em permitir atingir um objetivo específico por meio de vários métodos. Em segundo lugar, o tempo para atingir um certo nível de domínio sobre R, outra linguagem de programação ou qualquer outro tópico, para esse assunto, é extremamente individual e depende de vários fatores, incluindo o nível de exposição prévia à programação de computadores, as características da pessoa, seu entusiasmo e dedicação ao domínio do idioma, o tempo gasto (tanto na leitura quanto na prática) e muito mais.

Como devo começar a aprender python e linguagem R se sou um estudante sem idéia de programação?

1
Como você é estudante, busque ter boas habilidades analíticas e pode jogar com números. Assim, você pode começar com a programação em Python e entender a sintaxe, etc. Você pode fazer um pequeno projeto sobre como calcular juros simples, juros compostos, cálculo de EMI para um empréstimo à habitação etc. Inicialmente, você pode escrever um pseudocódigo e implementar o mesmo em Pitão. Você também pode ler os seguintes recursos que forneci: Resposta de Vamsidhar Vupmandla para Quais livros devo usar para aprender R ou Python como iniciante, com experiência em Java? Você também pode consultar 100 mais respostas no Quora sobre como aprender programação.Quais são as melhores maneiras de aprender programação? Feliz codificação.

2
Bem, se você não tem idéia sobre nenhuma linguagem de programação e não sabe como os programas são escritos, existe um livro que é espacialmente escrito para esse fim. Ele cobre todo o tópico importante de python que precisamos para a inteligência artificial e a ciência de dados ou para a programação competitiva. Aqui está o livro-: é o livro para os amantes de python que nem sequer sabem sobre programação. Continue aprendendo! “Voto a favor” se você gosta desse livro 🙂

3
Existem vários cursos on-line disponíveis, gratuitos e pagos. Eles são realmente muito bons em ajudá-lo a aprender qualquer tipo de linguagem de programação. Na verdade, eles são muito melhores do que muitas das palestras da faculdade. você se familiarizar com ele, vá para o próximo. Python será um bom começo. É muito fácil entender o idioma, mesmo para um não programador.

A linguagem de programação R é útil?

1
A linguagem R é amplamente usada entre estatísticos e mineradores de dados para o desenvolvimento de software estatístico e análise de dados. Se você trabalha nesses campos, é claro que vale a pena aprender. O R possui muitos pacotes para processamento de dados. Caso contrário, o R é uma linguagem de intérprete; se você tiver outras experiências em linguagens de programação, não demorará muito tempo para aprender.

Quanto tempo você levou para aprender R?

1
Para entender melhor algumas das funções básicas, sintaxe, etc., você pode precisar de algumas horas. Levei três dias para aprender R tanto quanto era necessário para fazer o meu projeto. É realmente ótimo trabalhar no R-studio. e análise de dados, você vai adorar R.Obrigado 🙂

2
Ensino as pessoas a usar o R e uso-o há 11 anos e ainda estou aprendendo coisas novas. Em algumas semanas, você pode aprender muito sobre o básico. Eu ensino uma sequência de 2 cursos que leva 15 semanas (2 créditos), e os alunos recebem uma boa introdução ampla sobre várias maneiras de usar R.Minhas aulas estão disponíveis gratuitamente aqui.

3
A chave é obter noções básicas da programação R em cerca de três dias, mas acompanhe-a com ciência de dados com R.Learn Data Manipulation, I / O, Visualização de Dados em R nos próximos dois dias. mais uma semana. Então, esse é o melhor caminho possível para aprender em R;

Qual é a melhor maneira de aprender a linguagem R para análise de negócios?

1
A primeira coisa que você precisa entender sobre R é que ela não é uma linguagem de programação de uso geral como C, JAVA ou dot net. Você pode usar o JAVA para criar basicamente qualquer aplicativo. Você pode usá-lo no setor bancário, gateway de pagamento, varejo. Você pode usá-lo para criar qualquer tipo de aplicação e interface de usuário.R não é assim. Não é uma linguagem de programação de uso geral projetada para fazer qualquer coisa. Ela é projetada por estatísticos para estatísticos. Tem um uso muito específico e é construído especificamente para análise estatística. A análise de dados é apenas uma parte disso. Portanto, a menos que você tenha algum tipo de experiência em estatística, não adianta aprender R. Então, primeiro você precisa ter pelo menos conhecimento básico sobre estatística. você pode ir em frente.Eu posso compartilhar apenas o que fiz para aprender R. Sou um DBA.Eu instalei o R na minha máquina e no R studio.Em seguida, baixei PDFs de diferentes livros relacionados ao R.Em seguida, comecei com programas simples no livro. No início, eu apenas me concentrei em criar diferentes parcelas ou gráficos em R. Eles são visuais e definitivamente aumentam sua confiança assim que você consegue. Depois que eu tive uma noção de parcelas, comecei a trabalhar na modelagem preditiva. Eu passei a maior parte do tempo em regressão linear, regressão logística e árvores de decisão.Agora, se esses termos o assustam, primeiro você precisa aprender sobre eles. Minha experiência com R me diz que R é fácil.Estatísticas são difíceis. porque eu sou um DBA. Talvez um estatístico diga o contrário. Então, para resumir, tenha uma noção das estatísticas, instale o R & R studio em sua máquina, pegue um livro e comece a trabalhar. Essa é a melhor maneira em minha opinião.

2
Se você conhece a codificação R, mesmo o básico, junte-se a alguns sites freelancers como Elance e oDesk. Compartilhe sua experiência e nível de conhecimento honestamente; abaixe suas taxas horárias. Você certamente encontrará algum trabalho relacionado. Existem várias pessoas / potenciais clientes e estudantes que desejam esse tipo de assistência. Então, você aprende enquanto ganha! 🙂 Se você não conhece a codificação R, siga o que Deepanshuc Anand sugeriu.

3
A melhor maneira de começar é através de cursos on-line gratuitos, como o Analytics, no edx, onde eles ensinam através da ferramenta R. Esse é o melhor curso, até onde eu sei, que ensina os conceitos muito claramente