Organizar dados para análise não é mais uma tarefa demorada

Faculdade de Educação Tecnológica do Estado do Rio de Janeiro

Organizar dados para análise não é mais uma tarefa demorada

Tarefas podem ser agilizadas com funções inteligentes e avançadas de ferramentas apropriadas para tratar arquivos pequenos ou grandes, complexos ou triviais

Por: Marcos Paulo Barreto

Quem precisa analisar diferentes arquivos de informações no dia a dia muitas vezes subestima a tarefa de preparação dos dados. Algumas vezes, isso é até uma necessidade inesperada. Quando nos deparamos com os defeitos, os erros e inadequações dos bancos de dados e arquivos em geral é que começamos a tentar consertar, ajustar, adequar, limpar, remover duplicidades e muitas vezes não medimos o tempo gasto. Em geral, essa percepção só chega quando já se foi uma tarde, um dia, uma semana inteira se dedicando apenas à preparação dos arquivos.

O pior de tudo é que, da próxima vez, faremos tudo igual novamente. Acabamos incorporando esse processo na rotina de trabalho, colocando isso na conta do “não-tem-jeito”. Porém, muitas dessas tarefas podem ser tremendamente agilizadas com funções inteligentes e avançadas de ferramentas apropriadas para tratar arquivos pequenos ou grandes, complexos ou triviais. Algumas das soluções já disponíveis no mercado são fáceis de usar mesmo para pessoas sem conhecimento de informática. E para os especialistas de tecnologia, é um tremendo acelerador.

Além de resolver os problemas de qualidade, preenchimento e formatação dos arquivos de dados, precisamos conectá-los: produtos às suas lojas e fornecedores; potenciais clientes aos segmentos e localidades; conectar indivíduos, endereços, fornecedores, pesquisas, tudo. Uma vez tratados e conectados, os dados se tornam úteis e podem ser analisados e usados para gerar valor. Mesmo quem não entende de programação, já pode fazer tudo isso com softwares prontos, que ainda permitem automatizar o que for feito por meio de scripts automáticos, tornando instantâneo o tratamento a partir da segunda utilização. Isso representa um ganho de tempo impactante.

As empresas podem usar estas ferramentas para cruzar cadastros e limpar listas de clientes, executando em instantes o que levava dias. Pesquisadores conseguem cruzar dados sociais com bases de saúde para identificar causas e efeitos na saúde pública. Consultores podem utilizar para cruzar, integrar e combinar arquivos de contabilidade, finanças e marketing, de forma a avaliar situações de negócio com grande agilidade.

Estas soluções funcionam como uma poderosa planilha que possibilita cruzar fontes de dados de diferentes origens como bancos de dados e planilha Excel em um único ambiente. Em algumas delas, as funções estão disponíveis em menus e botões, sem programação, o que garante grande acessibilidade a diversos perfis de usuários. Ainda assim, é importante que seja possível desenvolver suas próprias funções personalizadas para casos específicos.

O ideal é que a ferramenta tenha poder de processamento para grandes arquivos (Big Data) e ofereça a possibilidade de o usuário interagir e ver o que está sendo feito nos dados à medida que vai executando tarefas. E mesmo com toda esta capacidade de processamento, funcione bem em computadores comuns, seja em estações de trabalho, computadores pessoais ou servidores. Deve ter também a opção de nuvem.

A quantidade de registros e campos que podem ser tratados deve ser grande, da ordem de centenas de milhões, mesmo em um computador pessoal. As melhores ferramentas trabalham com alta compactação e armazenam apenas as mudanças feitas, sem duplicações de tabelas, poupando muito espaço em disco, o que normalmente é um problema grande no tratamento de dados.

Além de economizar tempo e prover um bom ganho de produtividade com tratamento de dados, essas ferramentas são habilitadoras. Isso significa que tarefas antes impossíveis, agora estão ao alcance, permitindo efetivamente transformar dados em valor. Os usuários ficam liberados para fazer as análises e gerar oportunidades. As informações estarão prontas e disponíveis rapidamente e o ciclo de negócio se acelera.

*Marcos Paulo Barreto é analista de dados da Stone Age

Fonte: IT FORUM 365

Texto original:
http://www.itforum365.com.br/analytics/organizar-dados-para-analise-nao-e-mais-uma-tarefa-demorada