12 mitos de análise de dados comprometedores

Faculdade de Educação Tecnológica do Estado do Rio de Janeiro

12 mitos de análise de dados comprometedores

Em TI, quanto maior o entusiasmo, maiores os equívocos e a análise de dados não é exceção

Por: Bob Violino

Em TI, quanto maior o entusiasmo, maiores os equívocos, e a análise de dados não é exceção. O Analytics, uma das mais importantes facetas da Tecnologia da Informação, pode resultar em ganhos significativos nos negócios, mas as percepções errôneas podem atrapalhar o fornecimento de recursos analíticos de maneira suave e oportuna, que podem beneficiar os usuários corporativos e, por fim, os clientes.

À medida que as organizações criam ou expandem suas estratégias de análise, há uma dúzia de mitos que eles podem ter em mente e que devem ser desconsiderados.

Mito 1: Análise de dados requer um grande investimento
Atualmente, parece que todo esforço tecnológico deve passar por um filtro de solidez financeira. “Quanto vai custar?” É uma das primeiras perguntas que os gerentes de TI e de negócios precisam responder quando propõem o lançamento de um projeto ou a implantação de uma nova ferramenta.

Alguns supõem que a análise de dados é, por natureza, uma tarefa cara e, portanto, limitada a organizações com grandes orçamentos ou muitos recursos internos. Mas nem todos os esforços de análise de dados exigem um grande investimento, diz Deep Varma, vice-presidente de engenharia da Trulia, fornecedora de serviços imobiliários móveis e on-line.

“Hoje em dia existem muitas ferramentas gratuitas, e outras tantas de código aberto, disponíveis no mercado, e que podem ajudá-lo a começar a mostrar o valor da análise de dados”, diz Varma. “Você precisa ter um bom entendimento do armazenamento interno de dados e qual problema está tentando resolver. A nuvem também está facilitando a análise de soluções para resolver um problema de negócios ”.

A análise moderna “baseia-se em sistemas em nuvem e arquitetura de Big Data, que por definição são bem menos dispendiosos do que os sistemas tradicionais de data warehouse”, acrescenta Beatriz Sanz Saiz, líder global de análise da empresa de consultoria EY.

“Além disso, dados e análises são normalmente aplicados para alcançar três resultados: melhorar a eficiência dos processos, o crescimento da receita e o gerenciamento proativo de riscos”, diz Saiz. “Assim, no geral, a aplicação de análise de dados gera benefícios [de custo] significativos para qualquer empresa”.

Mito 2: Você precisa do tratamento de Big Data para realizar análises
Para muitos, os conceitos de Big Data e Analytics andam de mãos dadas. O raciocínio é que as organizações precisam reunir enormes volumes de dados antes de realizar análises para gerar insights de negócios, melhorar a tomada de decisões, etc.

Certamente, os benefícios da análise de Big Data foram bem estabelecidos e as empresas com os recursos podem, de fato, obter vantagem competitiva significativa aproveitando seus armazenamentos de dados como parte dos esforços de análise. Mas a ideia de que Big Data é uma obrigação para o Analytics não é verdadeira.

“Muitas vezes as pessoas tentam capturar o máximo de dados possível; eles ouvem “Big Data” e ficam animados “, diz Tim Johnson, diretor executivo de inteligência de negócios da Allegis Global Solutions. “É um equívoca pensar que quanto mais dados melhor, e que as máquinas irão resolver tudo.”

Em vez de mais dados, os analistas precisam de dados específicos. “Noventa e cinco por cento dos usuários estão procurando por informações relevantes para seus trabalhos, para apoiar a tomada de decisões e melhorar o desempenho”, diz Johnson. Em vez de se concentrar em mais dados, as organizações devem considerar os usuários de negócios para determinar não apenas quais dados eles precisam acessar, mas como são apresentados.

“Fornecer acesso a todas as informações e em vários formatos pode ser esmagador e realmente sufocar a adoção de Analytics”, diz Johnson. “Em vez disso, descubra o que é importante e como você pode apresentar essas informações no formato mais simples possível.”

Mito 3: O Analytics elimina o preconceito humano
A forma como os sistemas automatizados funcionam não deve ser tendenciosa. Mas a tecnologia é construída por seres humanos. Portanto, eliminar todo o preconceito é quase impossível. Alguns acreditam que a análise e o Machine Learning removem o preconceito humano. Não é verdade. Infelizmente, ambos têm viés.

“Algoritmos e análises são ajustados usando ‘dados de treinamento’ e irão reproduzir quaisquer características que os dados de treinamento tenham”, diz Mike Mason, chefe de tecnologia da ThoughtWorks.

Em alguns casos, isso introduzirá um viés benigno nos resultados da análise; em outros casos, um viés mais negativo, diz Mason. “Só porque ‘o algoritmo disse’ não significa que a resposta seja justa ou útil”, diz ele.

Mito 4: O melhor algoritmo sempre vence
Na verdade, com dados suficientes, “às vezes o algoritmo não importa”, diz Mason. No artigo “The Unreasonable Effectiveness of Data”, os engenheiros do Google argumentam que modelos estatísticos simples, acoplados a quantidades extremamente grandes de dados, alcançam melhores resultados do que um modelo “intelectualmente superior” contendo muitos recursos.

“Em alguns casos, apenas processando uma pilha maior de dados é possível alcançar melhores resultados”, diz Mason.

Mito 5: Algoritmos não são seguros
As pessoas confiam em modelos estatísticos e algoritmos de confiança em alto grau e, à medida que as organizações constroem seus programas de análise, cada vez mais confiam em modelos sofisticados para apoiar a tomada de decisões, diz Johnson.

“Como as pessoas não entendem os modelos, os algoritmos e outras práticas avançadas de ciência de dados, depositam sua confiança neles”, diz Johnson. Os usuários não sentem que têm o conhecimento para desafiar os modelos, então, em vez disso, precisam confiar nas pessoas inteligentes que as construíram, diz ele.

“Nos últimos 50 a 60 anos, ouvimos que a IA assumirá o controle em 20 anos e continuaremos ouvindo as pessoas dizerem isso”, diz Johnson. “Ainda há muito o que cobrir antes que possamos confiar descaradamente no Machine Learning e nos resultados. Até lá, precisamos desafiar as pessoas que criam algoritmos e modelos para explicar como as respostas são alcançadas. Não é que não possamos depender dos resultados; é que precisamos de transparência para podermos confiar e verificar a análise ”.

Mito 6: A Ciência de Dados é um mistério
A disciplina de ciência de dados tem recebido muita atenção nos últimos anos e, às vezes, gera confusão sobre o que é exatamente isso. Basicamente, envolve o uso de algoritmos para encontrar padrões nos dados.

“A Ciência de Dados parece misteriosa porque esses algoritmos são capazes de analisar mais variáveis ​​e conjuntos de dados maiores do que a mente humana pode compreender”, diz Trevor Schulze, CIO da empresa de armazenamento de dados Micron.

“Como o poder de computação e a memória aumentaram nos últimos anos, agora somos capazes de resolver rapidamente problemas que seriam impraticáveis ​​de resolver com qualquer técnica há apenas 10 anos”, diz Schulze. “A Ciência de Dados é a evolução natural das técnicas de inferência estatística que foram bem compreendidas por décadas. Não há mistério na Ciência de Dados, uma vez que você entenda a Matemática ”.

Mito 7: Para fazer mais Ciência de Dados, você precisa de mais cientistas de dados
Os cientistas de dados estão entre os mais procurados profissionais de tecnologia atualmente. Talvez as organizações possam sobreviver com menos desses profissionais se redirecionarem no que estão trabalhando.

“Uma boa parte do tempo dos cientista de dados é gasto em atividades que não agregam valor, como encontrar conjuntos de dados, colocar os dados em um local onde possam ser trabalhados e transformá-los e limpá-los”, diz Mason. “Dado o quão difícil é contratar cientistas de dados, essas tarefas de baixo valor não são no que você quer que eles trabalhem.

” A plataforma Michelangelo, da Uber, permite que os cientistas de dados se concentrem na engenharia de recursos, na extração e na análise, em vez de distribuir dados ao redor e, assim, permite que eles sejam mais produtivos”, diz Mason.

Mito 8: O Analytics demora muito
Hoje em dia, fazer as coisas rapidamente – seja apressar um produto ou serviço para o mercado ou responder a uma consulta do cliente em tempo quase real – é uma grande consideração competitiva para as empresas. O Analytics soa como algo que leva muito tempo para ser executado, contrariando o objetivo de atingir velocidade e agilidade.

“Ainda existe o mito de que esses tipos de projetos demoram muito e são bastante complexos”, diz Saiz. “No final do dia, é tudo sobre talento. Com a mistura certa de habilidades e a aplicação de metodologias ágeis, grandes perguntas podem ser respondidas em dias ou semanas, não em meses.”

Mito 9: A tecnologia é a parte mais difícil
Com o número cada vez maior de tecnologias disponíveis hoje, selecionar a combinação certa de ferramentas para implantar e integrar para obter os resultados desejados da equipe de análise não é um passeio no parque, diz James Burke, diretor de terceirização de TI e serviços de consultoria digital da ISG.

A parte mais difícil, no entanto, é “unir a estrutura organizacional e o modelo operacional para colocar tudo o que é necessário sob a perspectiva de pessoas, processos e tecnologia, juntos”, diz Burke. “Além disso, como você fará isso dentro ou perto de sua organização é o que parece ser mais difícil para as organizações.”

Também é importante não presumir que as ferramentas de análise farão todo o trabalho. “A tecnologia sozinha nunca resolve nenhum problema de negócio”, diz Greg Layok, diretor sênior da consultoria West Monroe. “Na corrida para criar data lakes, as organizações acabam ficando com pântanos, ou um monte de informações difícies de serem descobertas”.

A tecnologia não resolve problemas de análise, diz Layok. “Primeiro, identifique um problema de negócios e pergunte: ‘Quais dados preciso para resolver isso?’”, Diz ele. “Isso ajudará você a identificar as lacunas de dados em sua organização.”

Mito 10: Analytics deve pertencer a um departamento separado
Em algumas organizações, a análise de dados funciona como um departamento independente e, em outros, está profundamente enraizada em uma equipe multifuncional, afirma Steven Mast, presidente e diretor de inovação da Delvinia, uma empresa de consultoria e coleta de dados.

“No entanto, com a explosão de dados em todas as áreas de negócios e a velocidade em que a mudança está ocorrendo, o modelo departamental não funciona”, diz Mast. “À medida que as organizações se tornam mais centradas no cliente, os especialistas em análise orientados por dados devem estar no centro de uma unidade de negócios, não operando como um departamento que dá suporte aos demais.”

Muitos dos problemas complexos que as organizações enfrentam hoje estão dentro das unidades de negócios, e muitas soluções para esses problemas estão escondidas nos dados, diz Mast. “Cientistas de dados e especialistas, trabalhando em estreita colaboração com essas unidades de negócios e usando grandes conjuntos de dados e inteligência artificial, serão fundamentais para incubar a próxima geração de produtos, serviços e experiências de clientes.”

Mito 11: Analytics é apenas para PhDs
É ótimo ter muitas pessoas bem-educadas na equipe de análise, mas isso não é um requisito para o sucesso.

“As empresas tendem a pensar que sem PhDs a bordo, elas não conseguirão realizar a melhor análise do setor”, diz Saiz. “A análise moderna exige uma mistura de habilidades. Construir ‘pods’ com diferentes habilidades [incluindo] arquitetos de Big Data, engenheiros de dados, cientistas de dados, especialistas em visualização de dados e muito mais, é o que faz a diferença. ”

Mito 12: A IA destruirá empregos e arruinará a economia
Historicamente, a introdução de novas tecnologias destruiu muitos empregos e indústrias, e há temores de que a Inteligência Artificial elimine a necessidade de as pessoas executarem certas tarefas.

“As soluções de inteligência artificial são muito melhores do que as pessoas para resolver certos tipos de problemas”, diz Schulze. “A IA pode ler mais rápido, lembrar mais e calcular relações matemáticas complexas melhor que qualquer pessoa. No entanto, a IA não é capaz de lidar com situações verdadeiramente novas, que é onde os humanos se destacam ”.

Para ter certeza, Schulze diz que certos trabalhos já foram perdidos ou encolheram pelo crescimento da IA, e outros seguirão por este caminho. “Ainda assim, nossa capacidade humana de entender e contornar circunstâncias completamente imprevisíveis não será substituída por nenhuma tecnologia de IA atualmente entendida”, diz ele. “No futuro previsível, a abordagem mais eficaz para a IA será aumentar as habilidades humanas com sistemas de Inteligência Artificial que realizam alguns dos ‘trabalhos pesados’, nos quais os algoritmos superam as pessoas. Embora muitos trabalhos mudem como resultado da IA, as pessoas continuarão sendo uma parte crítica desse ecossistema ”.

Fonte: CIO

Texto original:
http://cio.com.br/tecnologia/2018/05/23/12-mitos-de-analise-de-dados-comprometedores/