Aprendizado de máquina e computação cognitiva

Faculdade de Educação Tecnológica do Estado do Rio de Janeiro

Aprendizado de máquina e computação cognitiva

Aprendizado de máquina e computação cognitiva são as palavras da moda, e existe muita publicidade exagerada sobre elas no mercado. Este artigo é baseado em um recente webinar sobre análise de dados produzido pelo IT Professional, o Journal of Applied Marketing Analytics, a consultoria Technology Business Research (TBR), juntamente com o Content Wrangler; e foi hospedado pelo Earley Information Science (EIS).

Por: Seth Earley (Tradução por: Cassiano Faria).

O vídeo do webinar está disponível no YouTube. O objetivo é ajudar as organizações a entender o que é aplicável e o que é possível nos crescentes campos de aprendizado de máquina e computação cognitiva, e como estes campos estão relacionados à inteligência artificial (IA).

Earley: Vamos primeiro falar um pouco sobre aprendizado de máquina, computação cognitiva, a IA que suporta elas, e como estas áreas tem evoluído. Aprendizado de máquina é uma técnica para detectar padrões e descobrir informações, utilizando muitos mecanismos diferentes baseados em modelos estatísticos e matemáticos. Um bom exemplo é a tecnologia de busca, que fornece extração de entidade, clusterização, e classificação. Os algoritmos de aprendizado de máquina retornam informações que são relevantes para o usuário procurando por padrões, melhorando os resultados da busca. Por exemplo, a Amazon usa algoritmos de aprendizado de máquina para prover sugestões sobre produtos que estão relacionados àqueles que o usuário visualizou ou selecionou.

Computação cognitiva é um novo e emergente campo. Trata-se de tornar os computadores mais amigáveis para o usuário, com uma interface que entenda mais sobre o que o usuário deseja. Ela procura capturar sinais sobre o que o usuário está tentando fazer e fornece uma resposta apropriada. O Siri da Apple, por exemplo, pode responder questões de acordo com o contexto – se o usuário está se movendo rapidamente, então ele deve estar no carro dirigindo, mas se está se movendo lentamente deve estar caminhando. Esta informação contextualiza o intervalo de respostas em potencial, que são portanto mais personalizadas.

IA (Inteligência Artificial) envolve todas estas ferramentas e resolve uma ampla variedade de problemas – desde escrever artigos até dirigir carros, detectar fraudes, e diagnosticar doenças. Uma grande quantidade de decisões que normalmente são tomadas por ser humanos podem agora ser feitas por meio de IA. Logo, existem muitos desenvolvimentos no campo de IA que são práticos e realizáveis. Nesse contexto, quais são seus pensamentos sobre esta tecnologia.

Daley: Os conceitos fundamentais de IA tem em torno de 60 anos, incluindo a ideia de modelar máquinas para simular a inteligência humana. O que realmente mudou nos últimos anos foi a melhoria com o uso de probabilidade e estatística. Os algoritmos de aprendizado em profundidade, em particular – os que são realmente uma forma de redes neurais de encadeamento reverso [um método que utiliza algoritmos de aprendizado para progressivamente inferir um padrão sobre um conjunto de dados iniciando com o objetivo e então determinando as regras que serão inferidas e que podem ser utilizadas para alcançar outros objetivos] – tem avançado de forma significativa. Em segundo lugar, encontra-se a recente descoberta que utilizando placas de unidades de processamento gráfico [GPU] para fazer cálculos em paralelo permite encontrar em algumas horas resultados que poderiam levar semanas para serem alcançados. Finalmente, e eu penso que provavelmente a parte mais significante, está na quantidade de dados que está disponível para treinar os sistemas de IA. Eles precisam de muitos dados, e eles estão disponíveis digitalmente em todas as formas. No famoso experimento do gato do Google, um sistema IA foi exposto para milhões de miniaturas do YouTube, e sem ser supervisionado, o sistemas foi capaz de reconhecer um gato.

Downs: muitas soluções de aprendizado de máquina tem sido desenvolvidas, e elas estão sendo melhoradas de forma contínua. Gastei algum tempo na Microsoft Research fazendo alguns experimentos iniciais em raciocínio bayesiano e aprendizado de máquina. Construímos uma solução para modelagem de tráfego rodoviário que foi transformada na primeira startup originada da Microsoft Research, chamada INRIX, que agora provê informações em tempo real e previsão do tráfego rodoviário ao redor do mundo.
Vejo três níveis de engajamento comercial com estes tipos de tecnologias. Para um grupo de empresas, como o Google, Amazon, Facebook, Microsoft, e Apple, estas tecnologias são estratégicas, e seus investimentos são centuplicados ou mais em relação aos negócios mais convencionais. Em segundo lugar, para algumas empresas, o impacto destas tecnologias poderia ser estratégico, mas elas não podem fazer o investimento em termos de recursos humanos e ferramentas. Finalmente, deparamo-nos com empresas que possuem algumas ferramentas mais acessíveis, mas falta conhecimento para utilizá-las. Algumas delas falam, “Nós tentamos utilizar aprendizado de máquina mas não funcionou.”

Uma das proposições chave do aprendizado de máquina e da computação cognitiva para realmente diminuir o abismo em termos de direcionamento para o valor de negócio é a capacidade de empacotar algumas dessas capacidades, possivelmente com algumas aplicações especificas em mente, que realmente são capazes de adicionar valor sem exigir intervenção manual. As ferramentas podem agir sem experiência humana e fornecer informação sobre o que a tecnologia está descobrindo.

Earley: Como esta tecnologia está sendo aplicada em marketing?

Downs: Sem soluções tecnológicas, marketing é um processo relativamente lento que compromete em nível empresarial e utiliza um grande número de recursos. Não é incomum encontrar entre 50 a 100 pessoas envolvidas em planejar, formular e testar campanhas. Na Globys, permitimos aos profissionais de marketing conduzir a descoberta e otimização contínua da sensibilidade ao preço e comparar componentes automaticamente. O aprendizado de máquina efetivamente descobre e retorna para os profissionais qual o público alvo correto para uma oferta ou um produto novo. Isto torna o processo mais eficiente e menos trabalhoso.

Earley: Claro, não existe solução mágica, nós precisamos iniciar com ofertas e uma hipótese de algum tipo, assim como ter informação inicial de forma clara.

Downs: Sim, está correto. Alguns elementos básicos precisam ser informados.

Earley: Quais cuidados poderia propor para as empresas na utilização do aprendizado de máquina?

Schuster: Aprendizado de máquina é uma ferramenta tremendamente poderosa para extrair informações de dados. Mas como dito por Seth, não é uma varinha mágica. Você não pode simplesmente dizer “aprendizado de máquina” e fazer os problemas irem embora. Há a necessidade de se formular as questões de uma forma que realmente permitam aos algoritmos respondê-las. Os dados precisam ser configurados de maneira apropriada, e isso pode ser complexo. Algumas vezes, os dados necessários para responder às questões podem estar indisponíveis, o que pode ser outra barreira. Uma vez que os resultados foram obtidos, eles precisam ser interpretados. É muito importante entender o contexto. Um algoritmo de marketing pode dizer a profissionais de marketing o que está funcionando melhor, mas estes ainda precisam saber como alavancar a informação.

Earley: Quais preocupações empresas de fornecimento de serviços de aprendizado de máquina possuem?

Heffernan: Vejo alguns níveis de preocupação no campo de aprendizado de máquina; uns são dos fornecedores, uns são da expectativa do cliente, e outros são da equipe de TI. Grandes empresas (como IBM e Accenture) tem receio de ficar para trás em relação aos seus concorrentes. Como compreendem o potencial, não estão certos de que podem fazer um caso de negócio atraente ou que possuem os recursos para fornecer os serviços. Para os fornecedores de serviços de TI que verdadeiramente confiam na TI para o sucesso dos seus negócios, possuir as pessoas certas faz toda a diferença. Sem a equipe adequada, são deixados para trás.

O segundo tipo de preocupação vem dos clientes em potencial, os negócios que podem se beneficiar com o aprendizado de máquina e a computação cognitiva. O receio real aqui é bem simples. Posso investir nisso? Posso não investir nisso? Já estou atrasado em relação à concorrência? Estou investindo dinheiro num projeto desnecessário? Penso que quando você dá um passo para trás, todos realmente apreciam o potencial das tecnologias inovadoras. Todo executivo com poder de decisão tem um iPhone e compreende a importância da TI em nossa vida pessoal e profissional hoje em relação a 15 anos atrás. Não é mais preciso provar o quanto a tecnologia é importante e o que ela pode fazer. Entretanto, o desafio ainda permanece – este é o investimento certo?

O terceiro receio é dos funcionários que se perguntam o que acontecerá com seus empregos quando as máquinas assumirem o controle. Nós temos feito algumas pesquisas na automação de processos de robótica na terceirização de processos de negócio, o que soa mais como uma salada de palavras; mas significa simplesmente robôs fazendo o trabalho em um call center, por exemplo. Temos visto que um robô pode substituir três pessoas e tem um impacto imediato no custo, com uma redução de mais de 25 por cento. Não é simplesmente com a equipe de call center, mas com a equipe de TI também. Temos notado que o pessoal menos qualificado das empresas de serviço de TI (digital, cloud e BI) correm o maior risco.

Earley: E sobre os profissionais mais qualificados? Onde eles se encaixam no aprendizado de máquina?

Heffernan: No topo da escala de habilidades, está o cientista de dados com um MBA e 7 anos de experiência na área – e que algumas vezes os chamamos de “mágicos”. É aquela pessoa que pode transferir as necessidades do negócio em possibilidades de aprendizado de máquina, para então criar as análises, e a partir daí, retornar ao negócio. Esta pessoa é altamente requisitada hoje. Encontrar este talento, retê-lo, e gerenciá-lo é o que faz toda a diferença. Uma empresa que está adicionando computação cognitiva na sua oferta de terceirização de processos de negócio, está de fato demitindo pessoas no nível mais baixo ou elas estão sendo treinadas para assumirem serviços de alto nível. Os funcionários que estão ficando com as ofertas de computação cognitiva para BPO (Terceirização de Processos de Negócio) são os que podem formular a estratégia a ser testada, traduzir os problemas de negócio em análises, e comunicar os resultados. Nós estamos observando uma remuneração crescente da equipe de TI nos níveis mais avançados. A remuneração já estava alta, e a tendência é continuar aumentando. Estas empresas precisam fazer uma escolha. Elas investirão em computação cognitiva? O Watson, da IBM, é um exemplo de um grande investimento. A Wipro vem fazendo da computação cognitiva um importante pilar, e eles estão construindo de verdade seus próprios recursos. Outras empresas estão fazendo parcerias para prover esses consultores altamente qualificados, bem remunerados, de grande retorno e que agregam valor ao negócio e deixando os aspectos mais básicos de TI para as outras empresas. Nós estamos olhando para esta área como sendo a que vai mudar completamente os modelos de negócio existentes e como as empresas sobrevivem.

Earley: Então por onde as empresas devem começar, uma vez que seus modelos de negócio serão mudados de forma tão dramática?

Daley: A primeira etapa é quase sempre reunir as pessoas que possuem problemas de negócio a serem resolvidos para uma discussão sobre suas necessidades. No passado, os líderes dos tradicionais ramos de negócio não se importavam sobre qual a solução de TI seria aplicada – eles simplesmente queriam o problema resolvido. Penso que isso mudou agora, e muitos dos líderes de negócio estão bem familiarizados com as possibilidades tecnológicas. O que eles precisam é de orientação, com o entendimento de como aplicar seus conhecimentos em seus problemas de negócio, e como saber o que de fato pode ser realizado.

Uma estratégia possível é iniciar trabalhando com um pacote de IA de código aberto para compreender a tecnologia. Com soluções de IA proprietárias, você pode não saber o porque alguém teve seu crédito recusado. É simplesmente, “A máquina recusou.” Se o departamento de TI adquire alguma experiência com ferramentas de código aberto, eles podem ter transparência e a capacidade de entender um pouco mais sobre como a IA funciona, e resolver os problemas de como o software funciona no futuro. Existe uma oportunidade lá fora, e pelo menos nesse momento, a utilização de código aberto parece ser o caminho a ser seguido.

Earley: Como prevê o que pode ser alcançado para uma determinada organização?

Shuster: Uma ampla matriz de problemas podem ser resolvidos por aprendizado de máquina. Eu não conseguiria nem ao certo dizer se existe algum problema que não poderia ter a solução auxiliada por esta tecnologia. Trata-se de quais tipos de dados possui e quais tipos de questionamentos quer realizar. As fontes de dados são internas ou externas, e o quanto elas são confiáveis? O quão limpo e organizado estão os dados, e por qual tipo de governança está envolvido? Então, quando faz uma pergunta, pode confiar na resposta, o que penso ser uma barreira em potencial maior do que o tipo de pergunta que está sendo feita.

Earley: Dessa forma as fichas devem ser apostadas numa arquitetura central e dados limpos para se trabalhar. Alguns poderiam argumentar que suas ferramentas trabalham com dados bagunçados; entretanto, não penso que muitos trabalhem bem com dados ruins. A maior parte dos especialistas em IA dirão que não importa o tipo de sistema, ele será melhor executado quando são fornecidos os produtos, serviços, processos, e uma terminologia única de negócio. Um modelo de domínio é uma parte importante do quebra-cabeças. Qual tipo de mudança cultural é necessária para realizar a transição?

Downs: É preciso ocorrer uma mudança no sentido de decidir que o negócio passará a ser conduzido por meio de análises, e um tipo de método “sem desculpas” para entender no mínimo algumas das saídas das análises. Em termos de prosseguir e compreender o que é realizável, eu penso que em muitos casos o esforço da primeira tentativa esbarra na infraestrutura e em outros desafios na obtenção dos dados. Eles podem estar focando muito em obter a eficiência da TI no armazenamento de dados, ao invés de resolver um problema relativamente simples que pode apresentar ROI no mais alto nível, onde as áreas de negócio são impactadas. Este é um melhor método do que simplesmente ter uma atividade tecnológica que impacta apenas nas partes interessadas em TI. É sempre um desafio, porque é preciso ter uma iniciativa conjunta de diversos setores para a execução. Mas dessa forma, o valor para o negócio fica mais aparente para diretoria. Também força a empresa a ser mais analítica em seus negócios, pois engaja várias áreas. Você tende a abraçar a causa porque está realmente agregando valor aos negócios da empresa.

Earley: É verdade. Não podemos entrar no negócio e falar sobre dados e arquiteturas. Precisamos falar dos benefícios e como podemos auxiliar em objetivos específicos e resolver problemas. Como as organizações se qualificam para conseguir resolver os problemas de análises?

Daley: Para ser honesto, não tenho visto muitos gurus na minha carreira que conheçam múltiplas disciplinas. IA é baseada numa fundação matemática forte. Penso que esta é absolutamente indispensável. Mas não estou certo de que exista algum roteiro específico. Certamente uma das coisas que me surpreendeu em minha pesquisa sobre IA é quantos artigos de pesquisa vem sendo escrito – mais de 150.000 sobre redes neurais nos últimos 60 anos. Como resultado, o que vejo é que aplicações estão nascendo em todo o mundo, independentes umas das outras. Algumas terão sucesso, e outras não completamente. As empresas precisam estar preparadas para aceitar as falhas como parte do aprendizado, e iniciar os experimentos.

Earley: Então aprender na prática pode fornecer lições; entretanto, as empresas precisam ter alguma tolerância para a exploração. Em nossa experiência, a exploração pode ser feita no contexto de um problema sendo resolvido, que torna as explorações em resultados reais. Caso contrário, é um projeto de ciências. Tudo bem se possuir um orçamento para pesquisa pura; entretanto, é melhor ter alguma aplicação eventualmente, ou a pesquisa não terá fim. Quais outras aplicações você tem visto onde as empresas tentaram projetos que forneceram boas experiências de aprendizado?

Downs: O Serviço Postal dos Estados Unidos tem uma das mais antigas implementações de aprendizado em profundidade que existe, que é uma parte de hardware dedicada a reconhecer códigos postais escritos a mão. Eles colocaram o sistema em produção em 1987. É claro que agora o aprendizado em profundidade é uma tecnologia em alta, com bastante foco no reconhecimento de imagem, e pesquisadores estão ramificando-se em domínios como medicina, com imagem médica com uma área em desenvolvimento.

Existem muitas aplicações em idiomas, falado e escrito, com aplicações em áreas que possuem bastante ineficiência, como faturamento médico, re-admissão, previsão de contas, e detecção de fraudes.

Algumas das primeiras aplicações de redes neurais eram na área financeira. O mercado de leilão de anúncios é outro bom exemplo. Um anúncio é ofertado em um leilão em tempo real, enquanto a página é renderizada no seu navegador num intervalo de tempo de 300 milissegundos. Algum trabalho adicional tem sido feito pelas leis de privacidade europeias. Isto tem produzido uma onda de inovação sobre como entender as características dos indivíduos sem conhecer as suas identidades específicas. Uma economia de mercado foi desenvolvida ao redor da publicidade de todos os tipos, seja em jogos, em aplicativos para dispositivos móveis, ou online. Uma melhor compreensão do cliente conduz à eficiência na exibição dos anúncios. Estes são altamente focados, particularmente conforme impulsionamos ainda mais através de informações anônimas, o que exige um aumento das análises de forma sofisticada.

Earley: Esta é uma área fascinante. O ROI é claro, e é fácil ver o impacto das análises para os negócios hoje e como a evolução no horizonte continuará com a ruptura. O mercado digital é uma área de aplicação excelente. Em termos do que é necessário possuir para fazer essa tecnologia trabalhar, ainda será preciso o uso de uma arquitetura. Estas tecnologias não são mágicas. É preciso entender a estrutura de dados, quais são as regras, e possuir os componentes certos construídos para atender ao marketing digital. É preciso entender os atributos do seu cliente e ter um mecanismo para obtê-los de múltiplas fontes. As ferramentas fornecem métodos de aprendizado não supervisionados que exibem padrões, mas você ainda precisará saber o que está procurando e quais resultados quer obter. Este aspecto do aprendizado de máquina, em conjunto com outras aplicações em potencial, provê uma grande oportunidade a curto e longo prazo.

Fonte: InfoQ.

Texto original:
http://www.infoq.com/br/articles/machine-learning-and-cognitive-computing