O aprendizado de máquina (ML) é um ramo da inteligência artificial (IA) e uma parte essencial da ciência de dados. Emprega métodos estatísticos para classificar ou prever padrões em dados que podem ajudar a reunir perspectivas para business intelligence, experiência do cliente, pesquisa de mercado e outros fatores de tomada de decisão.​​ 

O aprendizado de máquina pode ser supervisionado, não supervisionado e reforçado.​​ 

  • Aprendizado supervisionado: os algoritmos são treinados com dados específicos do setor para obter perspectivas. Esse método costuma ser usado para aplicações de negócios.​​ 
  • Aprendizado não supervisionado: os algoritmos analisam milhões de pontos de dados e começam a reconhecer padrões por conta própria. Costuma ser usado em áreas como agrupamento de dados meteorológicos.​​ 
  • Aprendizado reforçado: ML avançado em que os algoritmos aprendem a perceber e interpretar seu ambiente, e tomam medidas corretivas através de tentativa e erro. Por exemplo, robótica alimentada por IA.​​ 

O aprendizado de máquina é usado em projetos de mineração de dados para classificação de tópicos, recursos e aspectos, análise de texto, agrupamento semântico e outras tarefas. Esses processos são usados em técnicas de IA, como reconhecimento de entidade nomeada (NER), processamento de linguagem natural (NLP), análise de sentimento, pesquisa semântica e outras. Todas elas são essenciais para obter perspectivas a partir do big data.​​ 

Os modelos de aprendizado de máquina aprendem por conta própria graças às redes neurais artificiais (ANNs) programadas neles. As ANNs são algoritmos que compreendem pontos de dados e correlacionam padrões como os humanos, tornando os modelos ML mais inteligentes à medida que processam mais dados.​​ 

Quanto mais camadas neurais os ANNs têm, maior a capacidade de entender semanticamente os dados em milhões de entidades representadas na forma de gráficos de conhecimento. Essa forma avançada de algoritmos ANN se traduz em Aprendizagem Profunda (DL) — um subcampo que pode reconhecer padrões altamente complexos em qualquer tipo de dados para modelagem analítica e preditiva.​​ 

Os modelos de aprendizado de máquina precisam ser treinados para fornecer perspectivas a partir de big data. Quando treinados com dados de qualidade, eles podem ser usados com sucesso para análise de sentimento nas redes sociais e análise de comentários para extrair perspectivas sobre marcas, clientes e mercados.​​