Webcast, Transmissão ao vivo, Comunicaçãoinicialempresa corptvprodutos streamingatendimento streamingCorpTV Engenharia de Transmissão
 

 
  LinkedIn CorpTVLinkedIn Group CorpTV
Twitter CorpTVEmail CorpTV
Facebook CorpTVMSN CorpTV


 
N o t í c i a s

17/11/2011
Entrevista: cientista-chefe da IBM explica futuro da Inteligência Artificial e do Big Data

Apesar do nome comum, Jeff Jonas é um cara excêntrico. Foi o primeiro executivo da IBM a subir no palco durante o Information On Demand 2011, encontro realizado com cerca de dez mil participantes em Las Vegas (Nevada, EUA) no fim de outubro. Até então, tudo bem. Ele seria só mais um cara de negócios de uma multinacional centenária se não fosse por um detalhe: ele não é um cara de negócios. Todo o business que veio em sua carreira, hoje marcada pelo título de cientista chefe da gigante de software, foi motivado por algo que chama a atenção em sua fala e na forma como ele se comporta: sua genialidade inata. E o cara é bom.

Durante o evento, eu e mais alguns jornalistas da América Latina tivemos o prazer – sim, o prazer – de entrevistar Jonas. Extremamente simpático e com uma capacidade sem igual de explicar coisas extremamente complexas, ele comentou os efeitos que o Big Data – esse amontoado de dados que gira pelo mundo com a massificação da web – e a Inteligência Artificial têm e terão em nossas vidas.

Assim como outros gênios da computação, nascido na Califórinia, Jonas largou a faculdade no primeiro semestre de curso. Logo na sequência, abriu uma empresa de software, empolgado com um fato que acontecera poucos anos antes: quando estava no colegial, criou um processador de texto que, posteriormente, foi vendido para o sistema educacional de Los Angeles. “Eu ganhei algum dinheiro e fiquei impressionado. Eu fiz uma coisa por diversão e ganhei dinheiro”, comentou. Depois. O negócio não vingou e Jonas faliu. A saída? Morar em seu carro, espaço que serviu para a criação de centenas de outros sistemas de computador. “Criei sistemas de contabilidade, então aprendi sobre contabilidade. Criei sistemas de inventário, então aprendi sobre inventário. Pesquisei sobre sistemas de esgoto e como se faz modelos de esgoto para que os canos de esgoto suportem crescimento futuro, então aprendi sobre modelos de engenharia. Trabalhei para aeroportos, criando sistemas de lucros. Estudei muitas coisas porque me aproximei delas. Foram centenas de projeto, incluindo sistemas de recursos humanos, sistemas de folha de pagamento”, explicou. Um autodidata que resume suas conquistas em uma frase simples: “eu vim do nada e cresci sozinho”

1. Ouvimos muitas coisas em relação ao tema Big Data e iniciativas da IBM. Queria saber o que você espera sobre o tema para o futuro, com foco também em Inteligência Artificial.

Jeff Jonas - primeiro lugar eu gostaria de falar sobre minhas definições de Big Data. Existem muitas definições. Em minha cabeça, tenho duas. Uma delas, que não é minha favorita ou a que mais uso, é o de uma organização com, digamos, cinco milhões de registros – para eles, isso é Big Data. Mas a definição número um é: o conceito de Big Data é pessoal. Se alguém achava que cinco milhões de registro era muito dado, outra empresa poderia achar que 50 milhões não eram. O que é grande pra você pode não ser tão grande pra mim. É relativo. E agora, quando se pensava que nada poderia ser feito com Big Data, o cenário mudou. A definição diferente do que é Big Data, que me cativa mais, é: alguma coisa muito interessante acontece quando se unem muitos dados, os dados não se tornam seus inimigos, mas seus amigos.

Se você tiver centenas de peças de quebra-cabeça em uma mesa e apenas amontoar mais e mais sem ordem alguma, os dados se tornam seus inimigos. Você fica sobrecarregado, não sabe como lidar: se afoga em dados. Mas se conseguir fazer com que esses pedaços de quebra-cabeça façam sentido e se organizem, você vai perceber que quanto mais dados você tiver, quanto maior o dado, mais clara é a imagem. Parece mágica o que acontece quando se coloca os dados em contexto, quer dizer, deixam de ser peças de quebra-cabeça e se tornam o quebra-cabeça. Sua exatidão aumenta. Sua confiança aumenta. A velocidade com que se compreende onde cada peça se encaixa aumenta. Isso, acredito, é muito interessante e eu comecei a pensar sobre isso quando Peter Norvig, do Google, escreveu um artigo intitulado “The Unreasonable of Data”. Esse artigo fala sobre como quando se une muitos dados e se começa a ver coisas que não se via antes. Então, para mim, Big Data é empolgante, é meu amigo, aumenta meu interesse e minha curiosidade.

Eu penso “se eu conseguir colocar peças amarelas aqui imagine minha habilidade para compreender meus clientes!”. Isso responde metade da sua pergunta. A outra metade: o futuro.

Acho que hoje, quando se escuta o termo Big Data, nove em cada dez pensam “arquivos em lote”. Acho que isso é um erro. Há muita coisa que só se pode fazer em lote, é como quando você chega em casa, no fim do dia, e senta no sofá pensando sobre o que você sabe. É um tipo específico de análise, é uma análise em lote e é importante. Mas eu vejo organizações usando isso para coisas que podem ser feitas em tempo real. Até que o mundo possa produzir bons resultados em lote, não vai demorar até que alguém questione porque não é possível agir enquanto a transação acontece. Algumas coisas ainda terão de ser feitas em lote, mas cada vez que alguém entender aonde quer chegar com um monte de dados, eu pergunto se é algo que pode ser feito em tempo real. Se puder ser feito em tempo real, então você projeta para tempo real. E se não puder, então se faz em lote. Se utilizar sistemas de tempo real em lote, eles jamais irão crescer para ser tempo real. – Eu quero escrever sobre isso, um dia, quando chegar a uma conclusão mais palpável, mas ainda não consigo. – Por que não é possível pegar um sistema de lote, projetado para processamento em lote, e transformá-lo em tempo real, streaming? Eles não são eficientes dessa forma. Mas um sistema de streaming, um sistema que processa dados em tempo real, pode processar lotes com facilidade. Somos todos mecanismos de streaming, vemos o que acontece agora e respondemos agora. Fazemos lotes. Lemos um livro, é um lote. Você escolhe onde colocar seu canudo – seu canudo é seu olho – você pensa: eu quero ler o capítulo 1 e pronto. Então, mecanismos de streaming podem processar lote, mas mecanismos de lote não fazem streaming. Portanto, quando eu penso sobre Big Data e sobre o futuro das análises, eu penso que parte da equação será streaming em tempo real e o que eu chamo de “fazer sentido”, “sentido e resposta”. E acho que isso estará intimamente ligado com a parte dois, que é refletir sobre o que foi aprendido e ter um loop de feedback para sempre que vir. Por exemplo: talvez quando se descobre padrões, em lote, fica provado que se A acontece, então B e C, os clientes lhe abandonam. Em 92% das vezes os clientes te deixam. Se A, B e C acontecerem, em três semanas, 90% dos clientes lhe deixam. Logo que se descobre isso, você quer avisar seu sistema de streaming em tempo real que, cada vez que surgir A, B, C, você vai tentar mudar o futuro. Talvez alguém ligue para o cliente, se ele for importante. Então, nos sistemas em lote, quando acontecem essas descobertas, você quer analisar o que aprendeu para mudar os resultados.

2. Quando você descobriu esses algoritmos para esse sistema de contexto, a descoberta foi feita utilizando matemática ou por intuição?

Jonas – Nada de matemática. Você está me perguntando “Como?”. Especialmente porque não teve matemática envolvida. Então, como? Quando você monta um quebra-cabeça, você usa matemática? Não. Eu vou explicar todo o processo, tentar deixar o mais claro possível. Você tira uma peça do quebra-cabeça de dentro da caixa e ela tem uma parte preta, mas você olha para as outras peças e todas têm essa parte preta. Você não experimenta todas as combinações. Você tira o quebra-cabeça da caixa e procura por características distintas. Algumas características únicas. Você encontra um pedaço que tem partes amarelas e vermelhas. Você, então, olha para a figura inteira e nota que ela não é cheia de amarelo e vermelho, mas que tem partes assim aqui e ali. Esse processo é como se encontra candidatos. Porque não há tempo suficiente para tirar todas as peças do quebra-cabeça e analisar todas elas.

Agora vou contar a mesma história com dados. Um novo dado surge. Vamos imaginar que somos um banco. Quando você vai ao banco e abre uma conta, fornece seu nome, seu endereço, sua data de nascimento e algum documento oficial. Essas são as características. Se o nome for Mark Smith será a mesma coisa que a parte preta na peça do quebra-cabeça. Existem dez mil Mark Smiths. Não é uma característica distinta, portanto, não será usada. Então você olha para o endereço e pensa quantas pessoas estão no sistema do banco e têm o mesmo endereço, e a resposta é sete. Esses são os candidatos. Mesma coisa com número de telefone ou número de RG. Então, a primeira parte, quando um novo dado surge, é a descoberta. Como quando se tem um novo dado, em questão de milissegundos, se encontra todas as peças do quebra-cabeça que podem ser relacionadas a ele. E se transforma em um número pequeno. Agora vou voltar para o quebra-cabeça. Ao montar um quebra-cabeça, após encontrar seus candidatos, você faz o que eu chamo de “avaliação de confiabilidade”. É a parte mais cara. Digamos esses sejam os candidatos, não são dez mil pedaços, aqui está o novo pedaço e aqui estão os candidatos. O que você faz? Você testa. Você os aproxima. E como não são muitos, é muito eficiente. Agora vamos voltar a falar dos dados. Como o endereço e número de telefone encontraram em, digamos, dez candidatos, agora, em memória se faz a avaliação de confiabilidade, você coloca os dois juntos e os nomes são os mesmos ou parecidos e o endereço é o mesmo. Você analisa todas as características para ver se são similares. E no final da avaliação, você chega a duas conclusões: não é nenhuma das pessoas já cadastradas, é uma nova pessoa; ou você conclui que é a mesma pessoa, e coloca na mesma pasta.

3. Não é matemática, mas é estatística?

Jeff Jonas – Sim. Eu trabalhei com matemáticos e teve um trabalho, não vou dizer onde, mas eles me mostraram os resultados, após eu ter dado todas as explicações e eu pedi que eles me explicassem a matemática. Eles me explicaram e eu entendi. E eu encontrei erros nos resultados. E eu expliquei o que eles teriam de mudar, mas eles disseram que o estudo ficaria longo demais e me perguntaram se eu ainda queria ser parte dele, e eu disse que não porque não estava exato. Então, eu acredito que possa ser expressado em matemática, mas seu conceito não é matemático.

E meu último trabalho é o que me empolga mais do que qualquer coisa no momento. Pelos últimos três anos – eis o que aconteceu. Há três anos, um executivo da IBM – onde ninguém acreditou que eu ficaria – me ofereceu um acordo, em que me pagariam mais para ficar por dois anos. Os dois anos passaram, e agora são seis anos. Todos se espantaram. Eu amo inventar coisas. Passei minha vida inteira inventando coisas. É tudo o que eu faço. Não sou pesquisador e não sou acadêmico. Eu crio coisas reais e instalo em clientes reais, e os projetos que escolho fazer realmente me interessam. Eles levam a diferentes realizações de que me orgulho. Três anos atrás, outro executivo me disse “se tiver uma grande ideia, a IBM lhe financia”. Então eu respondi que meu próximo projeto seria tal. E eles: “Você construiria isso para gente?”

Eu poderia criar isso pra mim mesmo. Eu respondi que sim e eles simplesmente me perguntaram quanto eu precisaria (eu estava conversando com o cara pelo telefone). Eu queria tê-lo visto pessoalmente, porque eu disse que não sabia como criar algo para a IBM, que é uma empresa enorme e complexa, então provavelmente precisaria de US$ 50 milhões. Eu queria ter visto a cara dele. Mas tive de imaginar. Houve uma longa pausa e ele me disse “Consegue fazer com seis pessoas?”. Fiquei aliviado. Eu perguntei se eu poderia fazer do meu jeito, se eu poderia escolher o pessoal. Eu queria ser o único que poderia vender até que eu dissesse que estava pronto. Essas eram as regras. E ele disse sim. Então, a IBM me dá apenas duas pessoas.

E eu escolhi, depois das centenas de sistemas que criei na vida, eu escolhi um cara que esteve comigo em 70 projetos. Nós passamos por todo tipo de dificuldade, juntos, 70 vezes. Dormimos no chão de nossos clientes, comemos marmitas, choramos juntos num canto qualquer. Passamos por verdadeiras batalhas juntos. Eu o escolhi. O segundo profissional que escolhi estava trabalhando no centro da minha nova tecnologia, identity insight, na parte mais complexa. Vou te dizer qual era essa parte mais complexa. Uma coisa que estamos fazendo há oito anos e agora estamos levando para um novo nível e eu não acho que nenhuma outra empresa e nenhuma outra tecnologia possam fazer isso. E eu raramente cometo erros como esse, mas eu estou ficando mais ousado porque quero que as pessoas me digam onde estou errado. Eu quero que imaginem isso: você viu 1 bilhão de peças de quebra-cabeças e cada pedaço, você descobre onde se encaixa. Você tomou 1 bilhão de decisões sobre 1 bilhão de pedaços. Mas agora você tem a peça 1 bilhão e um. No momento em que se descobre isso, você precisa pensar: agora que eu sei isso, se eu soubesse no início, antes de ver as 1 bilhão de peças e tomar 1 bilhão de decisões que tomei, algumas delas poderia ter sido diferente? Eu posso dizer que duas pessoas são a mesma porque elas têm o mesmo nome, mesmo endereço e mesmo número de telefone. Mas agora, a peça 1 bilhão e um aparece como nova evidência e, se eu soubesse disso antes, essas pessoas seriam pai e júnior. E eu preciso separá-los. Fazer isso em tempo real, com mais de 5 bilhões de dados, rastreando meio bilhão de coisas, milhares de coisas por segundo, quando uma nova observação reverte certezas anteriores, não é trivial. Quando não se pode fazer isso, então o estado de seu sistema é inconsistente.

Você tem uma decisão de um lado e um fato do outro lado, no dado, que lhe prova o erro. Algumas pessoas se referem a isso como oscilação de dados. Se não puder consertar o passado, então seu banco de dados se torna inconsistente. E a cada mês ou a cada três meses, você precisa recarregar. Imagine dizer a um cliente com bilhões de dados que a cada três meses você terá de recarregar todos os dados. E, aliás, no momento em que surge esse novo dado e você tem a chance de consertar algo errado, você tem a chance de melhores respostas, mas não poderá ver isso até o final do mês. Não importa se for um sistema de banco ou de imigração, ter os dados certos mas só reconhecê-los no final de cada mês ou a cada três meses. Então, era o cara que era responsável por esse algoritmo. Era eu e os dois.

Nós trabalhos nisso, em segredo, por dois anos e meio, sem contar a ninguém. Era tão sigiloso, ninguém sabia de nada. Meus dois engenheiros respondiam a um secretário no departamento de marketing, não a mim. Era um projeto muito sigiloso. Dois anos e meio depois, eu anunciei, no Canadá, em 28 de janeiro, no dia internacional da privacidade e foi a primeira vez que a tecnologia foi disponibilizada, e só eu poderia vender porque eu escolho os clientes pessoalmente. Eu anunciei no dia internacional da privacidade (de dados) porque eu criei mais funções de privacidade por design, mais funções aprimoradas de privacidade e liberdade civil nesse projeto do que em qualquer outro projeto que já criei.

Tenho um post no meu blog sobre isso, é só pesquisar pelo meu nome e a sigla PbD, Privacy By Design, e talvez G2, que é o nome do meu projeto – não é um produto, é meu projeto secreto – será possível ver as descrições de algumas dessas funções. Acho muito importante que essa tecnologia amadureça e fique mais inteligente e que façamos o máximo que pudermos para torná-la mais responsável. Agora já são três anos e eu sou começando a implantá-la e estou selecionando as coisas e é projetada para resposta em 200 milissegundos em Big Data. Quanto mais rápida a transação, mais rápido é possível tomar melhores decisões. Então a propaganda que eu vejo não diz que eu quero xampú, eu não preciso de xampú. Eu quero uma propaganda que diga “Você é um atleta de 47 anos e quer ter um abdominal como esse!?” – SIM! Então mais velocidade para colocar alguma coisa num website, para realizar uma transação online. Cada pedaço de dado, cada pedacinho de dado que chega a uma organização é a questão. Porque organização aprendeu algo novo. Então, cada novo dado encontra seu lugar no quebra-cabeça. Eu chamo isso de “dado encontra dado”. E uma vez que aquela nova peça se encaixa e você pode ver as peças ao redor, é o máximo que se pode saber. E você utiliza essa riqueza para resolver o que fazer em seguida. Devo comunicar alguém ou enviar uma mensagem de volta ao website ou deixar o dado ali? É isso que estou construindo. O codinome é G2, o produto que apenas eu posso vender, no momento, é chamado “InfoSphere Sensemaking”, é sobre como compreender o que está acontecendo para tomar uma atitude a respeito no momento.

Acredito que 80% das pessoas que aproveitarão os benefícios desse produto jamais precisão de qualquer outra coisa.

4. Então, no futuro, nossa qualidade de vida vai melhorar?

Jeff Jonas - O que eu mais gosto sobre o meu trabalho… Eu vou falar sobre alguns projetos em que estou trabalhando no momento porque fica mais fácil explicar. Estou trabalhando em consciência de tempo, para ajudar a lidar com os desafios de quando se tem uma área do mundo por onde passam uma enorme porcentagem das commodities e petróleo mundiais e você precisa saber onde focar a atenção. Ok, isso ajuda a aumentar a confiabilidade de nossa cadeia de suprimento para o mundo. Vamos dizer que esse é um projeto. Outro projeto é a modernização de registro de votos nos EUA. Estou muito feliz com isso. Porque aumenta a confiança das pessoas no sistema eleitoral e ninguém se preocupa em ter alguém votando duas vezes. Por algumas décadas, nos EUA, tivemos projetos para aprimorar os processos registros. Mas estavam parados e uma coisa nova que meu G2 oferece é a capacidade de unir dados de forma que seja humanamente compreensível, como meu nome e endereço, e anônimo, minha data de nascimento e número de documento não compreensível, e isso permite montar o quebra-cabeça com dados que são humanamente compreensíveis e não. Chamado de Anonimato Seletivo. É possível escolher com precisão quais dados serão anônimos e quais serão compreensíveis. O que permite a coleta de dados e fazer previsões eleitorais sem risco de perder mais dados. É uma das funções de privacidade. É muito empolgante talvez ajudar a proteger esses dados e com os mesmo algoritmos e com o mesmo esquema de banco de dados e quase a mesma configuração, ajudar a modernizar esses registros de voto.

5. E você acha que conectado a alguma coisa como supercomputador Watson da IBM, baseado em Inteligência Artificial, por exemplo, no futuro, é possível que as pessoas não tenham mais de tomar decisões? Será o Big Data e todos os dados conectados ao Watson, que tomaria decisões? Enquanto isso, nós estaríamos na praia, nos divertindo. É possível?

Jeff Jonas – Talvez muito depois da minha morte. Quão longe no futuro? Eu tenho algumas ideias sobre isso. Eu não gosto de receber spam. Quero ouvir música sertaneja? Não. Eu gosto do Metallica! É uma banda ótima e eu sei que eles ainda fazem sucesso na América Latina! Então, eu acho que parte do futuro é poder usar minha atenção e meus recursos como uma pessoa. Eu não vou receber coisas que não são relevantes pra mim. E vou gostar disso. Como vou gostar de não ser bombardeado com coisas inúteis. Eu recebo três coisas por dia e cada uma delas é ótima pra mim. “Essa pílula lhe dá abdominais perfeitos em sete minutos!” uau! Eu acho que o mundo não está se tornando um lugar mais perigoso, mas nós nos impressionamos com a mídia e seus terroristas. E quando eu trabalho para governos, por todo o mundo e lhe digo que o mundo não está mais perigoso. Estamos em uma época em que se vive mais tempo do que em toda a história da humanidade.

Entre 1800 e 1900, a expectativa de vida era 37 anos. Hoje, a idade média, incluindo a África, é 67 anos. Em 2050, de acordo com as minhas previsões, as pessoas chegarão a 102 e ninguém vai achar estranho. Então, de modo geral, eu me sinto bem em relação a isso. Vou te falar sobre uma coisa específica que me preocupa demais. Se você puser muita tecnologia nas mãos de uma pessoa má, teremos más notícias. Quanto mais tecnologia é disponibilizada pra os dois lados, mais perto chegamos de uma sociedade transparente. E as tendências nas formas como as pessoas se comunicam hoje, socialmente, e nas formas como se manifestam quando alguma coisa não está certa, acho que a voz de cada um está encontrando seu lugar de uma forma que nunca aconteceu. E, a não ser que alguém consiga nos calar, o mundo melhora de diferentes formas. Eu sou um otimista. Mais transparência! Eu fiz um post sobre isso chamado “Using Transparency as a Mask” (Usando a Transparência como Máscara). O que eu quero dizer com isso é que se tornará mais difícil manter segredos.

Eu penso sobre o que isso significa para o futuro, porque um dos tópicos do meu blog é privacidade. No futuro, se o mundo ficar mais transparente, todo mundo vai ser mediano? Porque todos são estranhos, cada um de sua forma. Todo mundo tem sua particularidade. Será que o mundo vai tornar todo mundo tão igual que ninguém vai se importar em ser diferente? Eu não acho que seria um bom futuro. O oposto seria o mundo se tornar mais tolerante com as diferenças e particularidades de cada um. Diversidade. Eu acho que todo mundo tem o direito de ser diferente. Se alguém usar fio dental e cacarejar como uma galinha ou qualquer outra estranheza, vá em frente! Eu quero que o mundo tolere a diversidade. Essa é minha esperança pro futuro. E existe um evento nos EUA chamado Burning Man, é um evento enorme, realizado no deserto e 50 mil pessoas aparecem e fazem praticamente qualquer coisa que quiserem. É muito estranho. É a maior concentração de criatividade por metro quadrado. Se fizer uma pesquisa por Burning Man, no Google… Eu viajo pelo mundo e em lugar nenhum vi esse tipo de expressão e criatividade. Mas acho no verso do ingresso diz “risco de morte”, e eu acho que na primeira edição, cinco pessoas morreram, porque é muito descontrole. Mas é muito interessante e muito divertido. E o oposto disso, é Cingapura, que como no filme Pleasantville, tudo é extremamente controlado. Acho que um futuro em que ambos existam é bom. Eu acho que diversidade é bom. Acho que o fato de poder escolher – e eu amo Cingapura, sou fascinado pela sociedade e visito o país três vezes por ano - e eu gosto do fato de poder visitar o país, eu gosto do fato de poder ir ao Burning Man e eu posso escolher onde ir. Sou um otimista, que acredita em diversidade e liberdade de escolha.

6. Esta é uma questão sobre privacidade. Sobre gente que está disposto a revelar dados sigilosos em troca de qualquer coisa. Como você lida com isso?

Jeff Jonas – Não lido. Não sei como lidar. Eu acredito que uma sociedade vigiada é inevitável, é irreversível e irresistível. Mas nós estamos vigiando, não o governo. Somos nós.

FONTE: IT WEB


mais notícias

| | | || | | | | | | || | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |

| | | || | | | | | | || | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |
 
 
  Cases
Telefonica

Claro

Accor

Redecard

Oracle

Votorantim

Caixa Econômica Federal

Embraer

Microsoft

Bradesco

Uni-Yoga

PSA Peugeot Citroen

Energia 97FM
 
   
  Copyright © 2007
Engenharia de Transmissão
* Atendimento
(+55 11.2062.6129