#FISL 13: Mineração livre de dados

O Mauríco e o Adewale são baianos, estudam na UFBA, e apresentaram o software WEKA - Waikato Environment for Knowledge Analysis, uma ferramenta muito interessante para mineração de dados. Vamos às observações sobre a palestra.
  • Os palestrantes apresentaram a OxenTI, a empresa deles, que fornece serviços em mineração de dados e áreas correlatas;
  • "Lei de Moore" diz que o processamento dobra a cada 18 meses, mas a capacidade de armazenamento dobra a cada 10 meses, o que gera um descompasso entre a capacidade de produzir e tratar os dados;
  • Knowledge Data Discovery (KDD) é o processo de extração de informação de bases de dados e criação de relações de interesse não percebidas "a olho nú";
  • Tarefas envolvidas no processo de KDD
    • Associação de dados - ex:clientes que compram pão também compram leite;
    • Padrões sequenciais - ex: alguém compra um carro, e 6 meses depois compra pneus;
    • Classificação e predição;
    • Análise de clusters - agrupar informações com base em comportamentos;
    • Análise de outliers - identificar informações fora do padrão.
  • Técnicas utilizadas
    • Árvore de decisão - árvore que estabelece um processo evolutivo que leva a uma decisão com base na relação entre as informações;
    • Redes neurais;
  • O WEKA
    • Desenvolvido em Java, pela Universidade Waikato, na Nova Zelândia;
    • É também conhecido como Pentaho Data Mining;
    • Oferece recursos de data mining e machine learning, permitindo realizar análises de dados de forma simples;
    • Possui diversos módulos, e uma interface intuitiva de fácil utilização (abaixo uma tela de exemplo);
    • Há extensa documentação da ferramenta e uma lista de distribuição.
Fiquei bem impressionado com o software, especialmente pela facilidade para importar dados a partir de arquivos CSV ou ARFF, bem como para realizar as análises, bastando selecionar os atributos de interesse e, claro, conhecer os algoritmos (são muitos!) que se aplicam ao conjunto de dados em questão. Pretendo aprofundar os estudos na ferramenta o quanto antes.

Agora você tem uma importante decisão a tomar.

Aprender mais sobre Big Data e Análise de Dados, e se diferenciar no mercado, ou simplesmente fechar esta janela e desperdiçar a oportunidade de crescimento profissional. 

A escolha é sua!

Christian Guerreiro

Professor por vocação, blogueiro e servidor público por opção, amante da tecnologia e viciado em informação.


Ensino a distância em Tecnologia da Informação: Virtualização com VMware, Big Data com Hadoop, Certificação ITIL 2011 Foundations e muito mais.


Suporte o Tecnologia que Interessa!

Você acha que as informações compartilhadas aqui são úteis?
Então me ajude a produzir ainda mais e melhores conteúdos!


É muito fácil. Basta divulgar nossos treinamentos pra alguém que conheça!


E se for de Salvador, podemos estruturar um curso presencial para sua empresa!

Eu vou ficar muito grato (e quem fizer os curso também :)!