Eu classifico 2017 como o ano da popularização de iniciativas de Data Science no mercado brasileiro, seja pelo surgimento ou melhoria de ferramentas que catalizam as iniciativas (como os serviços e bibliotecas de AWS, Google, Microsoft, IBM, etc.), pelo aumento do número de profissionais engajados e qualificados na área ou pelo aprendizado que a camada de gestão de negócios teve nos últimos anos neste contexto. O fato é que vemos empresas de diversos tamanhos e segmentos “espremendo” dados para extrair valor de diversas formas.

Moises Moisés e seu cajado de METAS dividindo um mar de falácias sobre Data Science.

Os últimos anos de evolução deste mercado também ajudaram a definir melhor os papéis e fundamentos envolvidos. Data Science tornou-se um conceito definitivamente genérico e suas aplicações (AI e Advanced Analytics, por exemplo) e principais ferramentas (Machine Learning, Deep Learning, Engenharia de Dados, etc.) tomaram corpo dentro das empresas e cursos/conteúdo de capacitação. Hoje vemos cursos, vagas e cargos muito mais definidos e o mito dos Cientistas de Dados unicórnios (ou “carregadores de piano”, na minha visão) sendo desconstruído. Além disso, surgiram equipes e empresas com foco em desenvolver tecnologia específica para determinados domínios de dados, enquanto outras se especializaram na integração de stacks de negócios já existentes com tais tecnologias específicas.

Neste mercado “atualizado”, eu vejo um divisor de águas que separa as iniciativas que tem um retorno positivo de seus investimentos das que falham neste sentido: a maturidade em determinar qual o objetivo específico da iniciativa, para os íntimos: metas bem definidas! Como há um amplo universo de possibilidades de exploração e geração de valor, direções bem definidas ajudam a convergir esforços e mentalidade para um objetivo comum e bem estabelecido. Uma iniciativa deve ser construída a partir de um propósito, e não a partir das atividades.

Vou me explicar melhor. Imagine que um Data team — com seus cientistas, engenheiros, estrategistas, etc. — seja uma equipe de arqueologia. De maneira muito macro, as atividades principais de um time de arqueologia são escavar o solo, procurar “objetos” e fragmentos, identifica-los, categoriza-los e reconstituir um objetos. Se um time de arqueologia é montado sem nenhum objetivo bem estabelecido, eles terão que estar preparados para:

  • Ter técnicas e ferramentas para escavar qualquer tipo de solo (arenoso, rochoso, argiloso, etc.);
  • Procurar por todo e qualquer objeto e fragmento, de fósseis a garrafas de vidro;
  • Identificar, categorizar e reconstruir fragmentos de qualquer coisa, exigindo que sejam conhecidas estruturas desde animais em extinção, vasos Astecas e simples rochas;

Dessa forma, será extremamente difícil encontrar profissionais que tenham tamanha amplitude de conhecimento, investir em anos de capacitação que deem tamanho conhecimento para a equipe e adquirir um grande número de ferramentas que viabilize tudo isso. Além disso, há o risco de cada profissional “andar” em uma direção diferente, fazendo com que a equipe e, consequentemente, a iniciativa não cheguem a lugar algum.

Exatamente a mesma situação dos arqueólogos acontece com uma iniciativa data-driven. Se um objetivo não é estabelecido, fica extremamente difícil encontrar profissionais capacitados, manter um time engajado ter um projeto de sucesso e obter retorno de seus investimentos. Devemos também sempre ter em mente que o termo Data Science contempla a abordagem científica de um problema, e a aplicação das metodologias científicas é que levarão a respostas com menor de teor de bias e maior grau de determinismo possível.

Resumindo a ópera em uma sugestão: defina muito bem o propósito e os objetivos detalhados de sua iniciativa de Data Science antes de dar os primeiros passos concretos (contratação de time, alocação de budget, etc.). Isso vai lhe economizar tempo e dinheiro e aumentar a chance de sucesso de sua iniciativa.

Atualizado em: