10 termos do Aprendizado de Máquina (Machine Learning) que você deve aprender o quanto antes!

Machine Learning - Penso, logo sou perigoso

Se você é novo no contexto do Aprendizado de Máquina e suas aplicações (como eu), então já se deparou com alguns termos muito técnicos que são muitas vezes difíceis para os iniciantes entenderem.

Por isso, resolvi traduzir os 10 termos de Aprendizagem de Máquina relacionados pelo KDNuggets, num esforço louvável de torná-los mais fáceis de entender.

Vamos a eles.

Aprendizado de Máquina (Machine Learning)


É um subcampo da ciência da computação e inteligência artificial (IA) que incide sobre a concepção de sistemas que podem aprender e tomar decisões e previsões baseadas em dados.

O aprendizado de máquina permite que os computadores possam agir e tomar decisões baseadas em dados ao invés de serem explicitamente programados para realizar uma determinada tarefa. 

Programas de aprendizagem de máquina também são projetados para aprender e melhorar ao longo do tempo quando expostos a novos dados.

O aprendizado de máquina tem estado no centro de muitos avanços tecnológicos nos últimos anos, como carros autônomos, visão computacional e sistemas de reconhecimento de voz.

Aprendizagem Supervisionada


Sempre que o programa é "treinado" em um conjunto de dados pré-definido.

A partir desse treinamento, o programa pode tomar decisões precisas quando recebe novos dados. 

Exemplo: usando um conjunto de treinamento de recursos humanos com etiquetas de tweets positivos, negativos e neutros para treinar um classificador de análise de sentimento.

Aprendizagem não Supervisionada


Quando um programa, dado um conjunto de dados, pode automaticamente encontrar padrões e relações de conjunto.

Exemplo: analisando um conjunto de dados de e-mails e agrupar automaticamente os e-mails relacionados ao tema, com nenhum conhecimento prévio ou de formação que também é conhecido como a prática de agrupamento.

Classificação


Uma subcategoria do aprendizado supervisionado, a Classificação é o processo de tomar algum tipo de entrada e atribuir um rótulo a ela.

Sistemas de classificação são usados ​​geralmente quando as previsões são discretas: ou “sim” ou “não”.

Exemplo: mapeamento de uma imagem de uma pessoa a uma classificação de gênero masculino ou feminino.

Regressão


Outra subcategoria do aprendizado supervisionado usado quando o valor que está sendo previsto difere de um “sim” ou “não” à medida que se encaixa em um espectro contínuo.

Sistemas de regressão poderiam ser usados, por exemplo, para responder às perguntas de "Quanto?" ou "Quantos?".

Árvores de Decisão


Uma árvore de decisão é uma ferramenta de apoio à decisão que usa um gráfico de árvore ou modelo de decisões e suas possíveis consequências.

Uma árvore de decisão é também uma maneira de representar visualmente um algoritmo.

Exemplo:
A árvore de decisão acima mostra a sobrevivência de passageiros do Titanic ("sibsp" é o número de cônjuges ou irmãos a bordo).

Fonte: http://en.wikipedia.org/wiki/Decision_tree_learning

Modelo Generativo


Em probabilidade e estatística, um modelo generativo é um modelo usado para gerar valores de dados quando alguns parâmetros estão ocultos.

Modelos generativos são usados ​​em Aprendizado de Máquina para qualquer modelagem de dados diretamente ou como um passo intermediário para a formação de uma função densidade de probabilidade condicional.

Em outros termos, um modelo P (x, y), a fim de fazer previsões (que podem ser convertidas para p (x | y) aplicando a regra de Bayes), bem como para ser capaz de gerar prováveis pares ​​(x, y), que é amplamente utilizado na Aprendizagem não supervisionada.

Exemplos de Modelos Generativos incluem Naive Bayes, Latent Dirichlet Allocation e Gaussian Mixture Model.

Modelo Discriminativo


Modelos discriminativos ou modelos condicionais são uma classe de modelos usados ​​em Aprendizado de Máquina para modelar a dependência de uma variável Y em uma variável X.

Como esses modelos tentam calcular probabilidades condicionais, isto é, p (y | x), eles são frequentemente utilizados em aprendizado supervisionado.

Exemplos incluem Regressão Logística, SVMs e Redes Neurais.

Aprendizagem Profunda (Deep Learning)


Tema quente nos últimos anos, a aprendizagem profunda refere-se a uma categoria de algoritmos de aprendizado de máquina que muitas vezes usam redes neurais artificiais para gerar modelos.

Técnicas de aprendizado profundo, por exemplo, foram muito bem sucedidos na resolução de problemas de reconhecimento de imagem devido à sua capacidade de escolher as melhores características, bem como para expressar camadas de representação.

Redes Neurais ou Redes Neurais Artificiais


Uma rede neural simples.


Inspirado por redes neurais biológicas, redes neurais artificiais são uma rede de nós interconectados que compõem um modelo.

Elas podem ser definidas como modelos de aprendizagem estatística que são usados para calcular ou aproximar funções que dependem de um grande número de entradas.

As redes neurais são normalmente utilizadas quando o volume de entradas é demasiado grande para as abordagens convencionais de aprendizagem de máquina previamente discutidas.

Conclusão


Aprendizado de Máquina é um dos temas mais importantes para o estudo de Big Data e Ciência de Dados.

Assim, se você pretende seguir carreira nesta área, é bom começar a se familiarizar com estes conceitos o quanto antes.

Para saber mais, confira nossa palestra sobre Big Data e Ciência de Dados.

Mas devo registrar que não sou nenhum especialista neste assunto, sou curioso e tenho lido a respeito, então achei que este é um tema que vale a pena trazer pra você.

Christian Guerreiro

Professor por vocação, blogueiro e servidor público por opção, amante da tecnologia e viciado em informação.


Ensino a distância em Tecnologia da Informação: Virtualização com VMware, Big Data com Hadoop, Certificação ITIL 2011 Foundations e muito mais.


Suporte o Tecnologia que Interessa!

Você acha que as informações compartilhadas aqui são úteis?
Então me ajude a produzir ainda mais e melhores conteúdos!


É muito fácil. Basta divulgar nossos treinamentos pra alguém que conheça!


E se for de Salvador, podemos estruturar um curso presencial para sua empresa!

Eu vou ficar muito grato (e quem fizer os curso também :)!