Clique Aqui Para Baixar o Arquivo - Artigos
Transcrição
Clique Aqui Para Baixar o Arquivo - Artigos
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – UFRJ INSTITUTO BRASILEIRO DE INFORMAÇÃO EM CIÊNCIA E TECNOLOGIA – IBICT PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA INFORMAÇÃO – PPGCI Cleide Luciane Antoniutti USO DO BIG DATA EM CAMPANHAS ELEITORAIS COMO ESTRATÉGIAS DE INFORMAÇÃO E COMUNICAÇÃO POLÍTICA Rio de Janeiro 2013 Cleide Luciane Antoniutti USO DO BIG DATA EM CAMPANHAS ELEITORAIS COMO ESTRATÉGIAS DE INFORMAÇÃO E COMUNICAÇÃO POLÍTICA Documento de qualificação apresentado ao Programa de Pós-Graduação em Ciência da Informação, como exame de qualificação de Doutorado. Orientadora: Prof. Dra. Sarita Albagli Rio de Janeiro 2013 RESUMO O presente trabalho se coloca diante de um contexto marcado por novas práticas do fazer político, a partir dos usos das novas tecnologias da informação e comunicação (TICs), principalmente da internet marcada pela “explosão informacional”. Esta pesquisa investiga particularmente os usos e apropriações que as campanhas eleitorais têm feito de novas ferramentas para análise de grandes quantidades de dados e informações digitais que circulam pelas mídias sociais e que inaugura a chamada era do Big data. O trabalho tem como foco as campanhas eleitorais que apresentam experiências com o uso do Big Data e particularmente as campanhas políticas brasileiras. O termo Big data é muitas vezes invocado para descrever o grande volume de informações produzidas pela e sobre a atividade humana, tornada possível pela crescente onipresença de dispositivos móveis, celulares, ferramentas de monitoramento, computação e armazenamento barato (em nuvem). O resultado das análises feitas pelo Big data pode revelar informações que antes não se conhecia devido à complexidade de sua captura. Para o desenvolvimento deste trabalho serão realizadas pesquisas bibliográficas em livros, periódicos, publicações institucionais, científicas e jornalísticas, bem como serão realizadas pesquisas de campo a partir das observações de fatos que envolvam os usos do big data em campanhas políticas, com o objetivo de compreender os mais diferentes aspectos desses usos na política eleitoral. Palavras-chaves: Big Data, Informação, Internet, Campanhas Eleitorais ABSTRACT This paper inserts itself into a context emphasized by new practices of policy making, because of new information and communication technologies, especially the Internet – highlighted by the explosion of information. This research investigates uses and appropriations that election campaigns have been doing of the new tools for analyzes large amounts of data and digital information circulating through social medias – and that launches this new era, called Big data. The focus of this work lies beneath electoral campaigns that experience use of Big data and chiefly the Brazilian political campaigns. Big Data is often an expression invoked to describe the sheer volume of information produced by human activity, possible to be gathered and manipulated by the increasing ubiquity of mobile devices, mobile, tracking, computing and cheap storage (cloud) tools. The results of the analysis made by Big data can reveal information that previously was not known due to the complexity of its capture. In order to present this propose, will be conducted bibliographic searches in books, periodicals and other institutional scientific as well as journalistic publications. Field surveys will be also conducted to observe facts involving the uses of Big data in political campaigns, in order to understand different aspects of uses in electoral politics. Keywords: Big Data, Information, Internet, Electoral Campaign. LISTA DE TABELAS Tabela 1- O dado, a informação e o conhecimento ............................................................. 22 Tabela 2- Cronograma de Atividades do Trabalho ............................................................ 68 LISTA DE SIGLAS ANP- Agência Nacional do Petróleo CI – Ciência da Informação CERN- European Organization for Nuclear Research CEO- Chief Executive Officer CDR – Corel Draw DEM - Democratas DNC- Democratic National Committee ECG- Eletrocardiograma EUA – Estados Unidos da América FGV – Fundação Getúlio Vargas HTML- HyperText Markup Language IBGE – Instituto Brasileiro de Geografia e Estatística IBM- International Business Machines IDC – International Data Corporation IEEE- Instituto de Engenheiros Eletricistas e Eletrônicos MGD – Machine Generated Data MIT – Instituto de Tecnologia de Massachusetts NASA – National Aeronautics and Space Administration NSA- National Security Agency PDT - Partido Democrático Trabalhista PMDB – Partido do Movimento Democrático Brasileiro PRISM- Programa de Espionagem do Governo Americano PSDB- Partido da Social Democracia Brasileira PT – Partido dos Trabalhadores RFID- Rádio-Frequency IDentification RSD – Redes Sociais Digitais TICs – Tecnologias da Informação e Comunicação WTCCC- Wellcome Trust Control Consortium Case XML – eXtensible Markup Language UGC- User Generated Content USA – United States of América STEM- Spatio Temporal Epidemiological Modeler SUMÁRIO 1 INTRODUÇÃO .......................................................................................................... 9 2 OBJETIVOS .............................................................................................................. 14 2.1 OBJETIVO GERAL ................................................................................................ 14 2.2 OBJETIVOS ESPECÍFICOS .................................................................................. 14 3 METODOLOGIA...................................................................................................... 15 3.1 PESQUISAS BIBLIOGRÁFICAS .......................................................................... 15 3.2 PESQUISA DE CAMPO ......................................................................................... 15 4 REVISÃO DE LITERATURA................................................................................. 16 4.1 A EXPLOSÃO INFORMACIONAL ...................................................................... 16 4.1.1 Informação e Conhecimento ............................................................................ 18 4.2 A REVOLUÇÃO DOS DADOS E O FENÔMENO DATAFICAÇÃO .................. 21 4.2.1 Conceito de Dado ............................................................................................ 21 4.2.2 Análise Dos Dados Na Sociedade ................................................................... 22 4.2.3 Dataficação Da Informação ............................................................................. 24 4.2.3.1 Quantificação e Representação do Mundo .................................................. 26 4.2.3.2 Interações Sociais Como Dados .................................................................. 27 4.3 BIG DATA .............................................................................................................. 28 4.3.1 Conceito e Evolução ........................................................................................ 29 4.3.2 Características do Big Data ............................................................................. 33 4.3.3 De onde vêm os dados ..................................................................................... 37 4.3.4 Ciclo de vida do Big Data................................................................................ 39 4.3.5 Usos e aplicações do Big Data ........................................................................ 42 4.3.5.1 Big data e empresas ..................................................................................... 42 4.3.5.2 Big data e Saúde .......................................................................................... 43 4.3.5.3 Big data e Governo ...................................................................................... 45 4.3.5.4 Big data e Política ........................................................................................ 47 4.4 MÍDIA, POLÍTICA E MARKETING ..................................................................... 52 4.4.1 Relação entre Mídia e Política ......................................................................... 52 4.4.2 Informação e Marketing na Política ................................................................ 54 4.4.3 Marketing Político e Eleitoral: evolução e diferenças ..................................... 57 4.5 COMUNICAÇÃO POLÍTICA E CAMPANHAS ELEITORAIS ........................... 61 4.5.1 Comunicação Política (Em desenvolvimento) ................................................ 61 4.5.2 Campanhas Eleitorais (Em desenvolvimento) ................................................. 62 4.5.3 Pesquisa e Política (em desenvolvimento) ...................................................... 63 5 ESTRUTURA PRELIMINAR DA TESE ............................................................... 67 6 CRONOGRAMA DE TRABALHO ........................................................................ 68 7 REFERÊNCIAS ........................................................................................................ 69 9 1 INTRODUÇÃO O presente projeto de tese se coloca diante de um contexto marcado por novas práticas do fazer político, a partir dos usos das novas tecnologias da informação e comunicação (TICs), principalmente da internet, como ambiente e fonte de informação. Esta pesquisa investiga particularmente os usos e apropriações de novas ferramentas para análise de grandes quantidades de dados e informações digitais, que inaugura a chamada era do big data. O trabalho se contextualiza sob a perspectiva da sociedade da informação e do conhecimento, a partir da explosão e de novos usos de informações presentes em ambientes das mídias sociais digitais1. Depois da informatização e da digitalização de documentos (textos, imagens, fotografias, etc.) ocorrida a partir da década de 1990, a grande preocupação na atualidade está no gerenciamento da quantidade de informações produzidas em vários segmentos da sociedade, nas mais diferentes estruturas informacionais. Os bancos de dados crescem em diversos domínios devido ao uso crescente de redes de sensores em terra e no espaço, a bordo de satélites, de identificadores de radiofrequências, de outros sistemas de detecção e registro de dados, do uso de equipamentos móveis como smartphones e tablets, e da proliferação e utilização crescente das redes sociais digitais2. O volume global de dados produzidos ou replicados em 2012, por exemplo, chegou a 1,8 zettabyte3, segundo o IDC (International Data Corporation) (SIQUEIRA, O ESTADO DE S. PAULO, 2012). Hoje são produzidas cerca de cinco bilhões de gigabytes de informações a cada dois dias. As mídias sociais digitais (redes sociais) aparecem como ambientes de maior fluxo de informação (SILVA et al, 2010). A previsão é que em 2015 esse número chegue 7,9 zettabytes. Segundo as projeções do cientista italiano Di Bari, em 2020 a sociedade produzirá o equivalente de conteúdo que toda a humanidade criou em 18 mil anos a cada 18 minutos. 1 O conceito de mídias sociais (social media) precede a Internet e as ferramentas tecnológicas - ainda que o termo não fosse utilizado. Trata-se da produção de conteúdos de forma descentralizada e sem o controle editorial de grandes grupos. Significa a produção de muitos para muitos. Mídias sociais se referem aos meios de interação entre pessoas pelos quais elas criam, compartilham, trocam e comentam conteúdos em comunidades e redes virtuais. De acordo com Kietzmann et al, mídias sociais empregam tecnologias móveis e de Internet para criar plataformas altamente interativas por meio das quais indivíduos e comunidades compartilham, co-criam, discutem e modificam conteúdos gerados por usuários. Mídias sociais introduzem mudanças substanciais e permanentes na forma como organizações, comunidades e indivíduos se comunicam. 2 Redes Sociais Digitais são definidas como: Segundo a HowStuffWork, redes sociais são o mapeamento das relações entre diferentes indivíduos, por meio do uso de tecnologias digitais. De acordo com a Wikipedia, redes sociais são os diálogos interativos entre diferentes pessoas, realizados com o apoio de tecnologias web e mobile, capazes de gerar mudanças pervasivas na comunicação entre organizações, comunidades e indivíduos. 3 Um Zettabyte é uma unidade de informação ou memória. Ele corresponde a 1.000.000.000.000.000.000.000 (1021) ou 1180591620717411303424 (2 70) Bytes, dependendo do contexto. Informações retiradas do site do Wikipédia. Acessado em junho de 2013. 10 Joe Hellerstein, cientista da computação na University of Califórnia, em Berkeley (USA), chama isso de “a revolução industrial dos dados”. Para outros especialistas da área de Tecnologia da Informação (TI), o mundo vive a Era do Zettabyte, que traz novos e crescentes desafios. Nessa nova era, a explosão de dados, de todas as origens, ganha o nome de Big Data (SIQUEIRA, O ESTADO DE S. PAULO, 2012). O volume exponencial de dados nos últimos anos tornou-se extremamente difícil de ser mensurado e analisado, mas também passou a ser visualizado por muitos especialistas como novas oportunidades de negócios, sejam eles econômicos ou políticos. Assim, exigiu-se o surgimento de novas soluções tecnológicas, que pudessem mapear o grande volume de dados em tempo real e em alta velocidade. Dessa realidade nasceu o conceito de big data, que segundo o Gartner (BIG, 2013) pode ser caracterizado basicamente por meio dos “3 Vs”: high-volume, high-velocity, high-variety (volume, velocidade e variedade respectivamente). Logo, ao estar diante de dados que possuam essas características em grande escala, o conceito de banco de dados tradicional não atende aos requisitos atuais de uma rápida análise de bilhões de dados em um curto espaço de tempo. Atualmente outras duas características foram adicionadas ao big data, a saber: valor e veracidade (DEMCHENKO, 2013). O big data se constitui na união entre estatística, matemática e arranjo de dados, que por meio de fórmulas complexas gera tendências de dados que podem ajudar, segundo especialistas, a prever comportamentos humanos. O termo é muitas vezes invocado para descrever o grande volume de informações produzidas pela e sobre a atividade humana, tornada possível pela crescente onipresença de dispositivos móveis, celulares, ferramentas de monitoramento, computação e armazenamento barato (em nuvem). O big data promete coletar dados de diversas fontes e diferentes formatos, estruturados ou não, para gerar informações estatísticas. O resultado das análises podem revelar informações que antes não se conhecia devido à complexidade de sua captura. Um dos exemplos mais simples é utilizar o big data para cruzar informações dos usuários de redes sociais para descobrir quais são suas preferências de produtos e serviços, para assim colocar anúncios específicos em sua página. O Facebook e o Google, por exemplo, utilizam dessa tática. O Google refina as buscas que as pessoas fazem em seu buscador na web com informações já pesquisadas anteriormente, ou que condizem com suas preferências. Para os estudiosos do tema na era do big data todos os dados são considerados valiosos e reutilizáveis (MAYER- SCHÖNBERGER; CUKIER, 2013). Esta pesquisa pauta-se no fato de que, com o desenvolvimento das TICs, o uso generalizado da internet, a adoção das mídias sociais e os fluxos crescentes de informação 11 criaram-se novas práticas informacionais e comunicacionais em todos os âmbitos da vida social. E isso tem atingido também as práticas políticas, em especial as eleitorais. A partir dessa premissa, este estudo pretende focar a investigação no uso do big data como um suporte de análises de grandes volumes de informações presentes nas redes sociais digitais, tentando entender como a análise desses dados, que vêm a partir do big data, são aplicados como estratégias informacionais na comunicação política, especialmente em campanhas eleitorais. A pesquisa busca, ainda, verificar se as novas possibilidades oferecidas pelo big data (cruzamento de informações de usuários de redes sociais digitais) têm sido exploradas na área política também no contexto brasileiro, assim como foram experimentadas na política norte-americana, principalmente na última campanha política de Barack Obama, ocorrida em 2012. O recorte desta pesquisa será direcionado para as campanhas políticas norteamericanas, com foco na disputa de 2012 do atual presidente Barack Obama e nas campanhas políticas brasileiras, que tiveram alguma experiência com o tema. O olhar da pesquisa será direcionado também para as próximas campanhas eleitorais brasileiras de 2014. A presente pesquisa em CI insere-se neste ambiente porque parte da premissa que cada vez mais políticos e candidatos deverão fazer uso das novas tecnologias em suas estratégias de informação e comunicação, principalmente em campanhas eleitorais. Como observa o especialista em uso de tecnologia na política e fundador do site Personal Democracy Media, Andrew Rasiej, falar o idioma da web será fundamental para qualquer candidato conseguir se eleger num mundo cada vez mais hiperconectado. Com o surgimento e expansão da internet e das mídias sociais digitais, os princípios democráticos acabaram sendo afetados de alguma forma pelo uso intensivo de informação em que a velocidade passou a ser sinônimo de eficiência. Dessa forma, toda e qualquer mensagem política precisa ser meticulosamente planejada sob todos os ângulos, a fim de atender os desejos e necessidades dos eleitores. As mídias sociais digitais, pelas suas características interativas e democráticas, se tornam para os políticos, importantes ambientes de comunicação e fontes de informações, que podem ser valiosas para as suas estratégias políticas. O conceito de big data aliado a explosão informacional também leva a uma tendência na busca da humanidade por quantificar e compreender o mundo. O processo em que os dados podem ser registrados, tabulados, analisados e organizados é chamado de “dataficação” (MAYER- SCHÖNBERGER; CUKIER, 2013). A fim de captar informações quantificáveis, de dataficar, é preciso saber como medir e registrar essa mediação, o que exige um conjunto certo de instrumentos, além do desejo de quantificar e registrar. 12 Este trabalho passa por uma proposição central de que o uso de tecnologias para coleta e análises de grandes volumes de dados e informações produzidas nos últimos anos, principalmente em mídias sociais digitais, reflete-se em novas formas de se fazerem campanhas políticas e elaborarem estratégias eleitorais segmentadas, a partir da dataficação de informações de eleitores. Levantam-se as premissas que isso leva a promessas de que os políticos poderão conhecer melhor seus eleitores a partir dos usos das informações e dados encontrados em ambientes de redes sociais, bem como de que o uso do big data, como uma opção às pesquisas eleitorais tradicionais, pode trazer possíveis inovações para as campanhas políticas. Para pesquisadores das áreas de informação e de comunicação, em especial, o forte crescimento de sites de redes sociais, como Facebook e Twiter, tem fornecido um “oceano de dados”. A utilização e a análise estatística das enormes bases de dados das redes sociais têm cada vez maior importância e valor do ponto de vista social, econômico e principalmente político. Este desenvolvimento tem criado novas oportunidades de abordagens e pesquisas em ciências sociais (LAZER et al, 2009), mas ao mesmo tempo desperta a intenção para as questões de privacidade e ética. Assim, o uso do big data no âmbito político também faz pensar sobre os limites e eficácia destes procedimentos, bem como a ética no uso das informações dos eleitores, principalmente as de ambientes das redes sociais digitais. É essencial um questionamento ético sobre as possíveis consequências da coleta, armazenamento e dos usos dessas informações com finalidades eleitorais. Este é um tema pertinente e emergente no âmbito da Ciência da Informação (CI) entendida como ciência interdisciplinar dedicada à investigação das propriedades e do comportamento da informação, das forças que governam o fluxo e uso da informação, e das técnicas de processamento para o armazenamento, recuperação e divulgação da informação (BORKO, 1968). A importância da informação é resumida por Sagan (1977) em uma única frase: “informação e alimento [ar, aí compreendido] são as condições necessárias à sobrevivência do ser humano”. Para a construção conceitual e teórica em torno do tema desta pesquisa recorreu-se a outras áreas do conhecimento, buscando assim, uma interdisciplinaridade com a área de CI. Como aponta Saracevic (1990) “os problemas básicos de se compreender a informação e a comunicação, suas manifestações, o comportamento informativo humano e os problemas aplicados ligados ao “tornar mais acessível um acervo crescente de conhecimento”, incluindo as tentativas de ajustes tecnológicos, não podem ser resolvidos no âmbito de uma única disciplina” (SARACEVIC, 1990, p. 48). Assim, este trabalho transita por conceitos e visões 13 das áreas de Comunicação, Tecnologia da Informação, Marketing, Ciência Política, entre outras, a partir também das considerações de Morin (1996) que sugere uma nova postura para as ciências, fazendo o conhecimento progredir através das áreas, comunicar não apenas informações, mas estruturas de pensamento entre comunidades científicas. Para o desenvolvimento deste projeto buscaram-se pesquisas na CI relacionados ao tema big data, mas deparou-se com deficiências bibliográficas, por ser tratar de um assunto recente. Até o presente momento nenhum trabalho foi encontrado em CI no Brasil que discuta o conceito de big data com enfoque na política eleitoral. Apesar de não haver publicações em abundância, sendo que as existentes em sua maior parte são provenientes do inglês, avaliouse ser possível abordar o assunto como pesquisa de doutorado. Assim, diante da falta de pesquisas e bibliografias, este trabalho se mostra relevante, buscando contribuir para a discussão e compreensão do conceito de big data, despertando o interesse para novas pesquisas em outras áreas de conhecimento. Nesse contexto, é importante pesquisar e questionar pressupostos, valores, tendências e implicações do uso do big data, particularmente na área política, ainda que seu uso nessa área ainda esteja apenas começando. Diante do exposto, a pesquisa pretende responder às seguintes questões: a) Quais as possibilidades e limites de quantificação e do aproveitamento dos usos das informações das mídias sociais? b) Que tipo de mudança o big data traz no uso de dados e informações em campanhas eleitorais? Quais os limites desses usos? c) Como esses usos se refletem nas estratégias de comunicação política? d) Que questões éticas têm sido levantadas no uso do big data, a partir das apropriações das informações públicas de usuários das redes sociais? e) Que repercussões o uso do big data têm nas estruturas tecnológicas e profissionais nas campanhas políticas? f) Em que medida e de que maneira isto tem sido sentido no Brasil? g) Quais são os pontos comuns nas experiências no uso do big data no âmbito brasileiro e em outros países? No que estas experiências se diferenciam? 14 2 OBJETIVOS Para responder às questões deste trabalho, neste item são descritos os objetivos geral e específicos. 2.1 OBJETIVO GERAL Investigar como o big data tem sido usado em campanhas eleitorais e de que modo isso tem sido aplicado no Brasil. 2.2 OBJETIVOS ESPECÍFICOS a) Observar como o big data tem sido usado no plano internacional em campanhas políticas, identificando as possibilidades, os limites e riscos desse uso; b) Observar que estratégias informacionais e comunicacionais podem ser aplicadas no campo político a partir do uso do big data. c) Apresentar as mudanças ocorridas na comunicação política a partir do uso do big data; 15 3 METODOLOGIA Neste trabalho serão utilizados os seguintes procedimentos: 3.1 PESQUISAS BIBLIOGRÁFICAS Serão levantadas bibliografias e referências pertinentes aos temas da pesquisa. As pesquisas serão realizadas em livros, revistas, jornais, publicações especializadas, artigos científicos, bem como serão coletadas informações a respeito do tema Big Data de universidades, institutos de pesquisa internacionais por meio da internet como: sites, blogs, redes sociais, entre outros. A pesquisa bibliográfica tem por objetivos: a) ampliar o marco teórico sobre a discussão no campo da Ciência da Informação e áreas afins e dos conceitos de big data; b) situar o contexto geral da pesquisa; c) levantar e conhecer experiências do tema big data fora do Brasil. d) apresentar antecedentes, contexto do surgimento, evolução e diferentes usos do conceito de big data; 3.2 PESQUISA DE CAMPO Pretende-se realizar entrevistas semiestruturadas com profissionais de comunicação, marketing, tecnologia da informação, cientistas de dados e políticos, envolvidos em campanhas eleitorais brasileiras e estrangeiras. Além desses profissionais, pretende-se identificar ao longo da pesquisa, estudiosos, jornalistas, observadores e outros profissionais destas novas práticas. As entrevistas serão realizadas de forma presencial e também por email e em outras alternativas tecnológicas, principalmente com profissionais envolvidos em campanhas eleitorais no exterior (especialmente nos EUA) com experiências em big data. A pesquisa tem por objetivos: a) conhecer experiências de uso de big data em campanhas eleitorais no exterior, sobretudo nos EUA; b) identificar se já existem experiências no uso de big data ou em abordagens análogas em campanhas eleitorais no Brasil; c) buscar saber se já está em gestação o uso do big data nas próximas campanhas eleitorais, principalmente as que acontecerão em 2014. 16 4 REVISÃO DE LITERATURA A revisão de literatura apresentada a seguir aborda os temas da pesquisa deste trabalho de forma ainda preliminar. A discussão teórica será aprofundada ao longo da investigação desta tese. Para situar a pesquisa, é apresentada no decorrer deste capítulo alguns dos temas que serão abordados durante a elaboração da tese. 4.1 A EXPLOSÃO INFORMACIONAL Neste item discutem-se os conceitos em torno da revolução e explosão da informação, a partir dos teóricos da Ciência da Informação e de outras áreas do conhecimento. A discussão começa por lembrar os apontamentos de Saracevic (1995). O autor recorda que “a explosão da informação é um problema social que teve seu início com o desenvolvimento das ciências, e hoje se estende para todas as atividades humanas” (SARACEVIC, 1995, p.42). Cabe aqui entender como se dá a explosão informacional. Desde o advento da escrita, a comunicação passou por muitas transformações, que resultaram, dentre outras consequências, na multiplicação da informação com cópias de manuscritos, imprensa, fotocópia, permitindo assim exteriorizar, primeiro nas bibliotecas uma das funções do cérebro humano, que é a memória (LE COADIC, 1996). Essas operações de multiplicação e memorização explicam uma boa parte do que se costumou chamar de explosão da informação, ou seja, mais exatamente a explosão da quantidade de informações. Para Le Coadic: O advento da eletrônica, que se traduziu pela transição dos suportes materiais para suportes imateriais, seguido da informática e do desenvolvimento da comunicação de informações à distância (telecomunicações) só fez reforçar essas tendências. De multiplicação, amplificação e armazenamento de enormes volumes de informações ocorrem sem cessar e, às vezes nos fazem duvidar da cordialidade da nova sociedade da informação (LE COADIC, 1996, p. 6-7). O surgimento da internet no final do século XX levou a uma série de indagações e em particular na Ciência da Informação. O advento da rede sem dúvida foi o grande fenômeno informacional desse período. Barreto (1999b), por exemplo, resume essa inquietação ao reconhecer que ainda temos mais perguntas que respostas, e que as transformações que ocorrem com a passagem para a cultura eletrônica e a realidade virtual só irão se delinear ao longo do tempo (BARRETO, 1999b). 17 A expansão da Internet, desencadeada pelo aumento do número de usuários conectados, tornou-se um fenômeno amparado pelo desenvolvimento tecnológico. “Esse crescimento da web foi favorecido pelo avanço de equipamentos tais como: satélites, roteadores, servidores, switches, backbones entre outros” (SCHONS, 2007, p.2) Lévy (1993) considera que, no mundo da internet, trabalhamos com quatro pólos fundamentais: o da produção ou composição de dados, o da seleção, recepção e tratamento dos dados, o da transmissão e o do armazenamento dos mesmos. Para estudiosos, a chegada do computador no meio social e a evolução da tecnologia, principalmente a móvel, contribuíram na última década para a acumulação dos dados. O mundo não apenas está mais cheio de informação como também a informação está se acumulando com mais rapidez. (MAYER-SCHÖNBERGER; CUKIER, 2013). A mudança quantitativa levou a uma mudança qualitativa. A verdadeira revolução na era da informação não está nas máquinas que calculam os dados, e sim nos dados em si e na maneira como a sociedade os usa. A facilidade de acesso e publicação de documentos na rede desencadeou novas possibilidades quanto à construção de um grande acervo informacional (SCHONS, 2007). Para Schons: Tal fenômeno a princípio é positivo, mas no decorrer do tempo esse processo originou um grande problema na rede pelo fato de conduzir e fomentar o processo de explosão informacional gerando grandes conflitos, uma vez que o excesso de informações parece ser pior que a sua falta (SCHONS, 2007, p 04). Para Schons (2007) o excesso de informações na rede excede a capacidade humana de explorá-las, ocasionando assim uma grande tarefa temporal para o indivíduo acessar e processar a informação que deseja. Terra (2000) diz que o excesso de informação está associado à perda de controle sobre a informação e à imobilidade em usar efetivamente essa informação. Da mesma forma Chons (2007) observa que hoje as atenções estão voltadas para o desenvolvimento de tecnologias visando à busca e recuperação eficiente das informações, já que as dificuldades de selecionar e escolher informações relevantes em meio a um espaço não estruturado crescem na mesma proporção que o aparecimento delas. Lévy, assim como os demais autores, observa que o dilúvio informacional na internet é fluida, virtual e ao mesmo tempo reunida e dispersa. Para ele “essa biblioteca de Babel não pode ser queimada. […] As águas deste dilúvio não apagarão os signos gravados: são inundações de signos” (LÉVY, 1999, p.16). 18 No cerne dessa discussão, as atenções, principalmente, dos profissionais da informação voltam-se mais para a organização, o armazenamento e a análise das informações que se dispõem, e não propriamente para como obter novas informações (SCHONS, 2007). A percepção de muitos pesquisadores a respeito do constante aumento no volume de dados como apontada anteriormente não é recente. Por volta de 1940 o escritor americano Arthur Fremont Rider publicou em seu livro “The Scholar and the Future of the Research Library: a Problem and Its Solution” (PRESS, 2012) uma pesquisa na qual estimou que as bibliotecas americanas dobrariam de tamanho a cada dezesseis anos e, continuando nessa taxa de crescimento, a biblioteca situada na cidade de Yale teria aproximadamente duzentos milhões de volumes armazenados até o ano de 2040. Esse volume ocuparia, então, cerca de dez mil quilômetros em prateleiras. Para servir como referência, a distância entre os extremos norte e sul do Brasil, não chega a cinco quilômetros (ÁREA, 2013). De fato, a previsão de Arthur Fremont só não acontecerá devido à digitalização de livros e documentos, recurso não existente na época da pesquisa. Caso contrário, devido ao elevado aumento das publicações, essa previsão seria superada bem antes de 2040. A expansão no que tange à criação de dados é devida principalmente ao avanço da internet e à facilidade de colaboração on-line entre pessoas geograficamente dispersas, duas das forças planificadoras do mundo apresentadas por Friedman (2006). Por planificação mundial, Friedman se refere à redução de barreiras impostas pela distância, de modo a garantir uma capacidade de colaboração, em escala mundial, aos indivíduos. O avanço da web ocasionou também a proliferação das redes sociais e a difusão dos dispositivos móveis como formas de acesso à rede mundial de computadores. A partir de todas essas origens (dispositivos) e meios (internet), são criados e espalhados enormes e variados conjuntos de dados. Este fenômeno de criação e compartilhamento de dados em grande volume, velocidade e variedade, tornou-se conhecido como big data, que posteriormente será discutido neste trabalho a partir do item 4.3. 4.1.1 Informação e Conhecimento Nesta subseção serão apresentados os conceitos de informação e conhecimento, a partir do levantamento feito em fontes não especializadas e na Ciência da Informação (CI). O conceito de informação pode ter diversas definições. Para muitos a informação pode ser definida como mensagem, conteúdo, dados, sendo às vezes confundida com conhecimento. Entre definições, conceitos e abordagens utilizados por pesquisadores de diferentes áreas e culturas são encontradas inúmeras discussões em torno do fenômeno 19 informação. A discussão neste trabalho em torno do conceito não tem a intenção de esgotar todos esses conceitos e nem apresentar as considerações de todos os autores, apenas escolher e situar aqueles que são julgados, neste momento, interessantes do ponto de vista desta pesquisa. Etimologicamente o termo informação é proveniente do verbo latino “informare” que significa colocar em forma, criar, representar ou construir uma ideia ou uma noção de algo podendo ser compreendida como processo de atribuição de sentido (ARAÚJO, 2001, p. 1). Na sociedade da informação, a informação é utilizada intensivamente como elemento da vida econômica, social, cultural e política (MORE, 1999). O termo informação vem atuar como elemento importante em todos os setores da atividade humana, constituindo-se como dados organizados e comunicados. É importante destacar que: … a informação é a mais poderosa força de transformação do homem. O poder da informação, aliado aos modernos meios de comunicação de massa, tem capacidade ilimitada de transformar culturalmente o homem, a sociedade e a própria humanidade como um todo. (ARAÚJO, 1989, p.01) A informação é vista por Araújo (1989) e por Barreto (1994) com poder de modificação da sociedade. Barreto (1994, p. 3) qualifica informação “como um instrumento modificador da consciência do homem e de seu grupo”, sendo que, quando assimilada de forma adequada, “produz conhecimento, modifica o estoque mental de informações do indivíduo e traz benefícios ao seu desenvolvimento e ao desenvolvimento da sociedade”. Outra definição é de que a informação são dados organizados ou matéria informacional potencialmente significativas, que servem para a tomada de decisão (URDANETA, 1992; MIRANDA, 1999). Já a informação como estratégia é abordada por Choo (2003), que observa que quem lidava ou lida melhor com a informação e dela sabe tirar proveito consegue levar vantagem, através de uma melhor tomada de decisões, com inteligência, criatividade e, ocasionalmente, esperteza. Essas discussões se aproximam muito da discussão estabelecida neste trabalho em torno dos usos e aplicações das informações coletadas dos ambientes da internet e que podem ser aproveitadas a partir da teoria do big data. Em que dados são extraídos de grandes volumes de informações, para finalidades estratégicas, comunicacionais na área da política eleitoral. 20 No entanto, no contexto informacional em que pesquisa se insere, a informação está relacionada também ao conhecimento. O conhecimento, por sua vez, é um conjunto de declarações organizadas sobre fatos e ideias, apresentando um julgamento ponderado ou resultado experimental que é transmitido a outros por intermédio de algum meio de comunicação (CASTELLS, 1999). Assim, informação e conhecimento são as principais fontes de produtividade e competitividade na nova economia informacional e esta dependerá basicamente da capacidade de gerar, processar e aplicar eficientemente a informação baseada em conhecimento. Lévy (1996) aborda a relação entre informação, conhecimento (e saber) como um ato de criação. [...] Quando utilizo a informação, ou seja, quando a interpreto, ligo–a outras informações para fazer sentido, ou, quando me sirvo dela para tomar uma decisão, atualizo–a. Efetuo, portanto um ato criativo, produtivo. O conhecimento, por sua vez, é o fruto de uma aprendizagem, ou seja, o resultado de uma virtualização da experiência imediata. Em sentido inverso, esse conhecimento pode ser aplicado, ou melhor, ser atualizado em situações diferentes daquelas da aprendizagem inicial. Toda aplicação efetiva de um saber é uma resolução inventiva de um problema, uma pequena criação (LEVY, 1996, p. 58-59). Portanto, para localizar a informação relevante na imensidão de dados disponibilizados nesse espaço, é necessário ter um conhecimento básico do que se deseja, assim como conhecer estratégias de busca que possibilitem a identificação de fontes confiáveis. O acesso a grandes quantidades de informação não necessariamente garante a possibilidade de transformá–la em conhecimento. O conhecimento não viaja pela internet (MATÍNEZ, 2004). Da mesma forma, Calvo (2004) diz que a informação não é conhecimento. A produção em massa de dados e fatos e números não significa nada se não houver produção do conhecimento. O conhecimento é criado por pessoas, individualmente, a partir de experiências individuais, eliminando-se o “ruído” e só então é socializado, construindo-se redes de conhecimento (individuais e sociais), e que estamos continuamente atualizando (CALVO, 2004, p.1). Para Barreto (1997), o conhecimento, portanto, pode ser visto como toda alteração provocada no estado cognitivo do indivíduo, isto é, no seu acervo mental de saber acumulado, proveniente de uma interação positiva com uma estrutura de informação, o que nos levaria à concepção de ideias de informação como processo e um meio para se atingir determinado fim. “É também desenvolvimento, de uma forma ampla e geral, como um acréscimo de bem estar; 21 um novo estágio de qualidade de convivência que seria alcançado através da informação” (BARRETO, 1997)4 4.2 A REVOLUÇÃO DOS DADOS E O FENÔMENO DATAFICAÇÃO Neste item apresentam-se discussões em torno da importância que os dados passaram a ter, mostrando discussões em torno do fenômeno inaugurado com a chegada da era do “big data”, chamado de dataficação da informação. A revolução dos dados está ligada ao aparecimento do big data (grandes dados), que posteriormente é discutido em detalhes neste trabalho. Inicialmente são apresentados conceitos em torno do termo dado e a sua importância na sociedade contemporânea até chegar no processo de quantificação e análise. 4.2.1 Conceito de Dado À luz da Ciência da Informação o dado é definido como uma sequência de símbolos quantificados ou quantificáveis. Assim dados podem ser além de textos, imagens, sons, animações, pois todos podem ser quantificados a ponto de alguém que entra em contato com eles ter eventualmente dificuldade de distinguir a sua reprodução, a partir da representação quantificada, com o original. É muito importante notar-se que qualquer texto constitui um dado ou uma sequência de dados, mesmo que ele seja ininteligível para o leitor. Como são símbolos quantificáveis os dados podem obviamente ser armazenados em um computador e processados por ele. Em nossa definição, um dado é necessariamente uma entidade matemática e, desta forma, puramente sintática. Isto significa que os dados podem ser totalmente descritos através de representações formais, estruturais. Dentro de um computador, trechos de um texto podem ser ligados virtualmente a outros trechos, por meio de contiguidade física ou por "ponteiros", isto é, endereços da unidade de armazenamento sendo utilizada. Ponteiros podem fazer a ligação de um ponto de um texto a uma representação quantificada de uma figura, de um som, etc. A palavra “dado” tem origem latina e pode ter o sentido de “fato”. Segundo MayerSchönberger e Cukier (2013), dado se tornou título de um trabalho clássico de Euclides, no qual ele explica a geometria como a palavra é conhecida e pode ser demonstrada. Hoje, no contexto do big data, “dados se referem a algo que permite ser registrado, analisado e reorganizado” (MAYER SCHÖNBERGER; CUKIER, 2013, p. 54). 4 Citação retirada do artigo A oferta e a demanda da informação: condições técnicas, econômicas e políticas. Disponível em: http://www.scielo.br/pdf/ci/v28n2/28n2a09.pdf 22 A diferença entre dado, informação e conhecimento como conceitos presentes nesta pesquisa, ficam mais claros a partir da tabela5 1 que se segue: O dado, a informação e o conhecimento Tabela 1 Dado Simples observações sobre o estado do mundo Informação Dados dotados de relevância e propósito Facilmente estruturado Requer unidade de análise Facilmente obtido por máquinas Exige consenso em relação ao significado Freqüentemente quantificado Exige necessariamente a mediação humana Facilmente transferível Conhecimento Informação valiosa da mente humana Inclui reflexão, síntese, contexto De difícil estruturação De difícil captura em máquinas Freqüentemente tácito De difícil transferência FONTE: Davenport, Prusak (1998 p.18) As palavras informação e dados são intercambiáveis em muitos contextos. Todavia, não são sinônimos. Por exemplo, de acordo com a observação de Gadomski (1993), dados é tudo que pode ser processado e as informações são dados que descrevem um domínio físico ou abstra(c)to. Considera-se como dado qualquer elemento ou símbolo que por si só não possui nenhum significado. “Fatos que descrevem os objetos de informação (eventos e entidades). Os dados referem-se a mais de um fato. Um determinado fato é referido como item” (GOUVEIA, 1996, p.17). Com as definições até aqui apresentadas fica claro que para se ter informação é preciso necessariamente que se tenha dados. 4.2.2 Análise dos Dados na Sociedade A análise de dados não é um processo moderno, os seres humanos analisam dados há milênios, como demonstra Mayer- Schönberger e Cukier (2013) numa breve discussão histórica. A escrita foi desenvolvida na antiga Mesopotâmia porque os burocratas queriam um instrumento eficiente para registrar e manter o controle de informações. Desde os tempos bíblicos, os governos organizam censos para reunir dados sobre os cidadãos. O registro de 5 <http://pt.wikipedia.org/wiki/Dados > 23 dados mais antigos remonta a 8000 a. C., quando comerciantes sumérios usaram continhas de barro para denotar os bens comercializados. Os seres humanos há muito tempo usam dados para aprender mais sobre o mundo seja no sentido informal das observações diárias ou, principalmente nos últimos séculos, no sentido formal de unidades quantificadas que podem ser manipuladas por potentes algorítmos. Os exemplos usados por Mayer- Schönberger e Cukier (2013) se referem aos conceitos de censo e estatística, respectivamente a coleta e análise de informações da sociedade. Esses conceitos são muito utilizados nos dias de hoje com finalidades diversas tanto para governos quanto para a sociedade. Desde remota antiguidade, os governos têm se interessado por informações sobre suas populações e riquezas, tendo em vista, principalmente, fins militares e tributários. O registro de informações perde-se no tempo. Confúcio relatou levantamentos feitos na China, há mais de 2000 anos antes da era cristã. No antigo Egito, os faraós fizeram uso sistemático de informações de caráter estatístico, conforme evidenciaram pesquisas arqueológicas. Desses registros também se utilizaram as civilizações pré-colombianas dos maias, astecas e incas. É conhecido de todos os cristãos o recenseamento dos judeus, ordenado pelo Imperador Augusto. Os balancetes do império romano, o inventário das posses de Carlos Magno, entre outros. Há indícios na história de que 3000 anos A.C. já se faziam censos na Babilônia, China e Egito e até mesmo o 4º livro do Velho Testamento faz referência a uma instrução dada a Moisés, para que fizesse um levantamento dos homens de Israel que estivessem aptos para guerrear (Bíblia Sagrada:Livro dos Números: 1, 1-3: p.175). Usualmente, estas informações eram utilizadas para a taxação de impostos ou para o alistamento militar. Um outro registro da Bíblia, informa que o Imperador César Augusto, ordenou que se fizesse o Censo de todo o Império Romano (Bíblia: Lucas: 1, 1-3: p.1530) (MAYER- SCHÖNBERGER; CUKIER, 2013). No passado, a tarefa de coletar e analisar informações só cabia a instituições mais poderosas, como a igreja e o Estado. Ao longo de milênios, os governos tentaram manter o controle da população coletando informações. O censo é citado por Mayer- Schönberger e Cukier (2013) como um exemplo disso. Segundo os autores, conduzir um censo na época era caro e demorado, exemplo da demora de se concretizar o processo é exemplificado pelo livro Domesday, de 1086, um dos mais venerados tesouros britânicos. Essa obra foi uma contagem abrangente – e sem precedentes em seu tempo – dos ingleses, suas terras e propriedades. Mayer-Schönberger e Cukier (2013) contam que funcionários se espalharam pelo interior 24 coletando informações para inscrevê-las no livro. Os resultados deste Censo foram publicados em 1086 no livro intitulado "Domesday Book" e serviram de base para o cálculo de impostos. O livro era chamado de “fim dos dias” porque o processo era como o Juízo Final bíblico, no qual todas as vidas eram contadas. O Rei Guilherme I, que encomendou o livro, não viveu para vê-lo completo, e mesmo depois de todo o tempo e dinheiro investidos, as informações não eram precisas, eram apenas aproximadas, já que os funcionários não podiam contar todos os dados com perfeição. A palavra "censo" é derivada da palavra "censere", que em Latim significa "taxar". Outro exemplo que ilustra esse item diz respeito ao aparecimento do conceito de estatística. A origem da palavra estatística está associada à palavra latina status (Estado). Há mais de 300 anos, um comerciante britânico chamado John Graunt teve uma ideia considerada inovadora para a época. Ele queria saber a população de Londres na época da peste negra (1665)6. Segundo Mayer- Schönberger e Cukier (2013) em vez de contar todas as pessoas, Graunt inventou uma abordagem que lhe permitiu estimar a população, hoje chamada de estatística. Com uma abordagem simples, ele estabeleceu a ideia de que uma pessoa podia extrair conhecimento da população em geral a partir de uma pequena amostra. Essa prática tem sido continuada nos tempos modernos, por meio dos recenseamentos que são realizados a cada 10 anos pela Fundação IBGE (Instituto Brasileiro de Geografia e Estatística), órgão responsável pelas estatísticas (dados estatísticos) oficiais brasileiras. 4.2.3 Dataficação da Informação A era do big data tem chamado a atenção para um novo fenômeno, para além da digitalização7: o da dataficação (datafication) (MAYER- SCHÖNBERGER; CUKIER, 2013). Esse fenômeno que vem sendo experimentado principalmente pela área comercial consiste em transformar informações em dados, ou seja, é a tendência de transformar um negócio existente em um negócio de dados. Dataficação se refere à coleta de informações de tudo o que existe, seja no mundo digital ou analógico, transformando tudo em dados que possam ser quantificados. Esse conceito permite usar as informações de novas maneiras, como análise 6 A Grande Praga de Londres foi um surto de peste bubônica. Houve outros antes dela na Inglaterra e ao redor do mundo. O mais conhecido foi a pandemia chamada de Peste Negra, no século 14. Especialistas apontam que ela possa ter dizimado 1/3 da população europeia na época, aproximadamente 75 milhões de pessoas. A Grande Praga matou um número estimado de 100 mil pessoas, equivalente a 20% da população da capital britânica em 1665. Acredita-se que os focos da doença só tenham sido eliminados em 1666, com o Grande Incêndio, que destruiu grande parte das favelas e lugares mais pobres da cidade. 7 Digitalização é o processo de converter informações analógicas nos zeros e uns do código binário, de modo que os computadores possam usá-las. A digitalização não foi o primeiro recurso dos computadores a ser utilizado. A era inicial da revolução digital foi computacional (MAYER- SCHÖNBERGER E CUKIER, 2013) 25 privisível. Seria, assim, um processo sistemático de extração e tabulação desses dados dispersos e aparentemente irrelevantes. As mídias sociais digitais são exemplos de dataficação (MAYER- SCHÖNBERGER E CUKIER, 2013). O Facebook datafica a rede de amigos, o Google tem dataficado a busca e recuperação de informações. Twitter é um dataficador de notícias e de informações em tempo real, o LinkedIn, por exemplo, tem “dataficados” os contatos profissionais. A ideia da dataficação é a espinha dorsal de várias empresas de mídias sociais. As plataformas de redes sociais não apenas oferecem uma maneira de encontrar e manter o contato com amigos e colegas, mas usam elementos intangíveis do cotidiano e os transformam em dados que podem ser usados para outros fins. O Facebook é um exemplo de dataficação de relacionamentos. Por meio do gráfico social, as informações são definidas como dados. O Twitter também permite a dataficação de sentimentos ao criar uma maneira simples das pessoas registrarem e compartilharem pensamento. Assim, segundo especialistas, cada uma dessas empresas busca aproveitar essa grande quantidade de dados não estruturados (big data) para armazenar, analisar e rentabilizar a informação em torno das suas atividades e negócios. Cada processo de negócio agora é “dataficado”. Com isso é possível monitorar, armazenar e começar a identificar padrões de uso e, portanto, ter recomendações de como melhorar ou monetizar os negócios. Os executivos de diversos segmentos da indústria têm tentado analisar e “dataficar” vendas, aquisição de clientes, rentabilidade de produtos e custos da cadeia de suprimentos há anos. A novidade é que, agora, esse processo tem velocidade rápida e ferramentas adequadas para armazenar, manipular e analisar determinadas informações. Para entender o fenômeno da dataficação em tempos de explosão de informações, é necessário buscar uma discussão teórica na Ciência da Informação acerca dos conceitos de dado. O termo “dado” é usual na literatura da área de Ciência da Informação, Sistemas e Tecnologia da Informação e Comunicação. É definido como um “conjunto de registros qualitativos ou quantitativos conhecido, que, organizado, agrupado, categorizado e padronizado adequadamente se transforma em informação” (MIRANDA, 1999, p.284-290). A dataficação transforma a hierarquia informacional até agora adotada na Ciência da Informação. Na perspectiva da CI, os dados se transformam em informações e conhecimento. Já na era do big data, as informações coletadas em diferentes ambientes é que se transformam em dados com valor estratégico. Para Davenport e Prusak (1998) dados, informações e conhecimento estão intimamente relacionados formando uma hierarquia entre eles. Esses autores explicam que o conhecimento é decorrente da informação, que por sua vez, deriva de 26 um conjunto de dados. Davenport e Prusak (1998) consideram dados como registros sem significados, que se transformam em informações ao adquirirem algum significado. Da mesma forma, a hierarquia reversa também pode ser considerada, o conhecimento ao ser explicitado, difundido através de meios físicos ou virtuais, se torna uma informação ou um conjunto delas, que ao serem desmembradas se tornam um conjunto de dados. Nesse sentido, Davenport e Prusak (1998) afirmam que o conhecimento está relacionado ao uso inteligente da informação, podendo ser avaliado pela qualidade das ações ou das decisões a que leva. O big data tem a ver com a percepção e compreensão de relações entre informações que, até recentemente, tinha-se dificuldade para entender. O especialista em big data da IBM, Jeff Jonas, segundo Mayer-Schönberger e Cukier (2013), diz que é preciso deixar que os dados “falem com você”. As análises não causais ajudam a compreender o mundo ao perguntar primeiramente o quê, e não o por quê (MAYER- SCHÖNBERGER E CUKIER, 2013). 4.2.3.1 Quantificação e Representação do Mundo O processo de dataficação, como abordam os autores Mayer- Schönberger e Cukier, (2013), não é sinônimo de digitalização. Digitalização é apenas um processo de representação numérica por meio de codificação binária. O ato de digitalização, ou seja, a transformação de informações analógicas no formato que os computadores possam ler, em si não datafica. Um exemplo usado por esses autores quanto a essa diferença é da digitalização de livros a partir do Google Books: a página digitalizada, é transformada em uma imagem ou similar, mas isso não torna o texto em si um dado. É necessário que se façam outros processos (como o reconhecimento textual) para que as palavras em si e a coerência que elas mantêm possam ser reconhecidas como dados. A Google8 digitalizou os textos: todas as páginas foram escaneadas e transformadas numa imagem de alta resolução armazenadas nos servidores da empresa. Cada página foi transformada numa cópia digital que podia facilmente ser consultada na internet. Para recuperá-la, contudo, era preciso saber em que livro estava a informação ou ler muitas páginas até encontrá-la. Não era possível procurar determinadas palavras no texto, nem analisá-lo, porque o texto não fora dataficado. Tudo o que o Google tinha eram imagens que apenas os seres humanos podiam transformar em informações úteis – isto é, lendo. (MAYER- SCHÖNBERGER E CUKIER, 2013, p.57-58) Para além dessa necessidade, Mayer-Schönberger e Cukier (2013) sublinham a importância da medição e do registro como facilitadores de criação de dados. Sem a invenção 8 A Google é referida aqui no texto no contexto feminino porque se refere a empresa. 27 da escrita, como instrumento de catalogação, e a adoção dos algarismos, voltados ao cálculo, seria inviável qualquer processo de captura e aglutinação de dados. Passando a vista por um breve histórico da Matemática e das variadas formas de registro (como os livros comerciais), os autores mostram a importância de se ter uma abordagem padronizada e objetiva diante da manutenção e dos cálculos de tais dados. A dataficação permitiu a indexação e a busca nos textos, além de um fluxo infinito de análise textual. Estima-se que 130 milhões de livros tenham sido publicados desde a invenção da imprensa no século XV. Em 2012, o Google já havia escaneado mais de 20 milhões de títulos, mais de 15% de toda a herança escrita do mundo. Mayer- Schönberger e Cukier (2013) destacam que a transformação de palavras em dados gera inúmeros usos. Os dados podem ser usados pelos seres humanos para a leitura e pelas máquinas para a análise. Para esses autores (MAYER-SCHÖNBERGER; CUKIER, 2013, p.57) “o surgimento dos computadores gerou aparelhos de medição e armazenagem digitais que tornaram a dataficação muito mais eficiente. Eles também permitiram que a análise matemática dos dados revelasse seu valor oculto”. 4.2.3.2 Interações sociais como dados O fenômeno da dataficação, já apresentada anteriormente neste trabalho, também está atingindo o âmbito mais pessoal (relações, experiências e estado de humor). A ideia da dataficação é uma das características de várias empresas de mídias sociais. “As plataformas de redes sociais não apenas nos oferecem uma maneira de encontrar e manter contato com amigos e colegas, mas usam elementos intangíveis do cotidiano e os transformam em dados que podem ser usados para outros fins” (MAYER- SCHÖNBERGER E CUKIER, 2013, p 63). Apesar disso, a utilização de dados de redes sociais ainda é embrionária. Segundo Mayer- Schönberger e Cukier (2013), no caso do Facebook, a empresa ainda está ajustando seu modelo de negócio (e política de privacidade) de acordo com a quantidade e tipo de dados que deseja coletar de seus usuários. Segundo dados do Comitê Gestor da Internet (2013), o Facebook tinha por volta de um bilhão de usuários em 2012, conectados por meio de 100 bilhões de amizades. O gráfico social (Graph Search)9 - relações entre objetos em um conjunto 9 Gráfico Social é considerado o terceiro pilar do Facebook. Tem por finalidade facilitar a vida de quem usa a rede, oferecendo o resultado direto das buscas - feitas com base nas conexões e dados dos usuários - e não apenas os links. O sistema permite buscas por conteúdos curtidos e compartilhados pelos usuários, como músicas, lugares, fotos, vídeos e interesses. 28 - resultante representa mais de 10% de toda a população mundial, dataficada e disponível para uma única empresa. O Twitter também tem usado amplamente os dados de seus usuários. Em 2012 foram enviados em torno de 400 milhões de tweets todos os dias, por mais de 140 milhões de usuários mensais. A empresa permite a dataficação dos pensamentos, do estado de espírito e das interações das pessoas. O Twitter fez negócios com duas empresas, a DataSift e a Gnip, para vender acesso aos dados. A partir disso, muitas empresas analisam os tweetts e às vezes usam uma técnica chamada “análise de sentimentos”, a fim de reunir opiniões de consumidores ou de julgar o impacto de campanhas de marketing. Dessa forma, entende-se que os grandes bancos de dados das empresas de mídia social formam a base de novos empreendimentos que vão muito além do superficial compartilhamento de fotos, atualizações de estatus e botões de “curtir”. São importantes ambientes de informações que podem ser transformados em dados com valores estratégicos, que podem ser aplicados para diversas finalidades, inclusive em estratégias de informação e comunicação política. Por isso, destaca-se esse ambiente da internet, para o estudo do presente trabalho. 4.3 BIG DATA O presente item tem como finalidade discutir o conceito e aplicabilidade do big data (grandes dados) na sociedade contemporânea. Inicia-se pela discussão da origem e evolução do conceito, características – os chamados 5 Vs-, ciclo de vida e em seguida apresentam-se os usos e algumas experiências do big data em diversas áreas, e por fim destaca-se as experiências em campanhas políticas eleitorais. Além disso, são apresentadas as primeiras iniciativas de big data eleitoral. Para a construção deste item recorreu-se a grande parte da literatura advinda de autores e especialistas da área de Tecnologia da Informação (TI). A obra mais utilizada para descrever o big data foi do professor de Controle e Regulação da Internet no Oxford Internet Institute, em Oxford University, Viktor Mayer- Schönberger e o editor da revista Economist, Kenneth Cukier, que são considerados autoridades em big data nos EUA. Entre esses autores, outros foram pesquisados por meio de blogs, sites e artigos de referência internacional e publicações em veículos impressos brasileiros como O Globo, Revista Veja e em veículos científicos como Revista Ciência Hoje e demais periódicos internacionais. É importante ressaltar que o termo big data recebe diversas referências. Durante as pesquisas ele apareceu de várias maneiras como: fenômeno, Era, tecnologia, ferramenta. 29 Buscou-se inicialmente dar uma dimensão do que seja o conceito big data que está sendo discutido por diversos autores que foram selecionados neste trabalho. 4.3.1 Conceito e Evolução É importante ressaltar que o conceito de big data (grandes dados), apesar de estampar as principais revistas e jornais nacionais e internacionais nos últimos tempos, não é algo novo. Como assinala Manovich (2013)10 o termo big data é frequentemente usado em meios de comunicação, empresas, ciência da computação e da indústria do computador11. Big data é um termo de mercado já sendo discutido desde o final da década passada, mas só em 2013 foi que o conceito extrapolou de vez os limites da academia e dos setores de Tecnologia da Informação (TI). Na imprensa especializada, o termo big data desde 2008 vem chamando a atenção para a “Era do Big Data”. Por exemplo, em junho de 2008, a revista Wired abriu sua seção especial sobre "A Era Petabyte", afirmando: "Nossa capacidade de captar, armazenar, e compreender grandes quantidades de dados está mudando a ciência, medicina, negócios e tecnologia. Como a nossa coleção de fatos e números cresce, assim será a oportunidade de encontrar respostas para as questões fundamentais. "Em fevereiro de 2010, The Economist começou seu relatório especial" Dados, Dados Everywhere "com a frase" a revolução industrial de dados "(cunhado pelo cientista da computação Joe Hellerstein). Na observação de Monovich (2013) o efeito está sendo sentido em todos os lugares, de empresa para a ciência, por parte do governo para as artes. No Brasil, a revista Veja (2013) e Ciência Hoje (2013) publicaram recentemente reportagens apresentando o conceito de big data como a “revolução dos dados”, ressaltando a suas aplicações, principalmente na área comercial e empresarial. O jornal O Globo também vem explorando o tema desde O que desde 2008 pela imprensa vem sendo chamada de “era do big data”12 só se materializou com a confluência de alguns fatores como a queda do custo de armazenar dados. Há 20 anos estocar um gigabyte custava cerca de 1000 dólares, hoje sai em média seis 10 Nessa perspectiva, uma das principais referência no campo de pesquisa dos software sutdies, o russo Lev Manovich tem desenvolvido, desde 2009, um projeto ambicioso de coleta desses conteúdos, capazes de gerar um grande banco de dados no qual é possível a visualização de modo sistemático de um conjunto de rastros dos indivíduos em ambientes da internet. Trata-se do Cultural Analytics, um novo conceito de análise de dados oriundos de usuários. 11 http://cio.uol.com.br/tecnologia/2013/07/24/do-big-data-ao-big-brother/ 12 Revista Veja. Edição 2321. ano 46. n°20 – 15 de maio de 2013. p. 70-81. 30 centavos. Os processadores tornaram-se velozes, os programas ficaram mais inteligentes e a quantidade de dados cresce exponencialmente. Os especialistas otimistas observam que o big data tem ganhado proporções diferenciadas em diversos ambientes de discussão. O termo tem se tornado tão importante que no World Economic Forum de 2012, foi citado como uma nova classe de ativo econômico comparado ao petróleo. Ginni Rometty, CEO da IBM ressaltou que, da mesma forma que o petróleo foi o recurso natural que potencializou a última revolução industrial, dados serão os recursos que farão a diferença em termos de competitividade, inovação e até mesmo sobrevivência nesta revolução industrial que estamos vivendo – a era da informação (LEONARDI, 2013). Prova do alcance do conceito foi último Fórum Econômico Mundial. O austero encontro de Davos abriu espaço em sua agenda de debates sobre mercados financeiros e conjuntura macroeconômica para discutir diversos aspectos do mundo da informação. Ao fim, o fórum publicou o estudo "Big Data, grande impacto: novas possibilidades para o desenvolvimento internacional", que mostra como o big data pode ser uma arma contra os problemas sócio-econômicos13. Big data é um termo muito utilizado atualmente, principalmente em empresas de comunicação e tecnologia, mas diferentemente do que a princípio possa parecer, big data não é uma tecnologia, mas sim um novo paradigma a respeito da geração e manipulação de dados, bem como seu crescimento exponencial. Em outras palavras, uma “explosão de dados” em uma proporção que nunca havia ocorrido antes. Em 1997, durante conferência do Instituto de Engenheiros Eletricistas e Eletrônicos (IEEE) sobre virtualização, dois pesquisadores da NASA (National Aeronautics and Space Administration – Administração Nacional da Aeronáutica e do Espaço) publicaram o artigo Application-controlled demand paging for outof-core visualization (COX, 2004) em que anteviam os novos desafios na área de computação ao ter que lidar com grandes volumes de dados. Pelo que se tem conhecimento, foi nesse artigo o termo big data foi usado pela primeira vez. O big data no meio comercial nasceu da necessidade de empresas como a Google e Yahoo de criarem uma arquitetura escalanável para analisar um gigantesco volume de dados variados e que se acumulam rapidamente. O Machine learning, em português o aprendizado de máquina, é considerado o grande aliado do tema big data. Ele possibilita aos computadores 13 < http://oglobo.globo.com/tecnologia/de-moneyball-davos-big-data-se-abre-para-mundo-4460918> 31 aprenderem a contar, qualificar e predizer infinitos aspectos da vida dos indivíduos e da natureza. É importante destacar que, com o grande universo originado ao redor do assunto nesses últimos anos, hoje o big data pode ser considerado como uma região de conhecimento transversal e que abrange diversas áreas produtivas e pesquisas científicas. É um campo focado em gerar conhecimento e inteligência a partir de grandes quantidades de dados complexos. Ferramentas desse tipo surgiram no fim da década passada, mas este ano o conceito extrapolou de vez os limites da academia e dos setores de TI. Isso porque o preço para armazenamento de dados está despencando e diversas ferramentas baratas ou gratuitas para lidar com as informações estão surgindo. Um exemplo é o Hadoop, software de código aberto surgido dentro da Google que permite tratar grandes volumes de dados em tempo real14. O projeto genoma é considerado um exemplo de big data e da evolução da computação científica. Afinal, o primeiro mapeamento humano (menos de uma década atrás) custou US$ 1 bilhão, dada à complexidade de captura e processamento dos dados. Hoje, o processo está para se tornar rotineiro e custa menos de US$ 5mil, ou seja, o big data não só possibilitou o crescimento do conhecimento do genoma como também a democratização do processo de geração desse conhecimento. Especialistas apontam o Social Security Act15 — programa instituído pelo presidente dos EUA Franklin Roosevelt em 1937 — como o primeiro grande projeto de captação e catalogação de informações. Por meio de um sistema de cartões perfurados, idealizado e implantado pela IBM, o governo computou informações de 26 milhões de americanos. Hoje, para se ter uma ideia, só a cadeia de lojas Walmart processa informações de transações de mais de 1 milhão de clientes por hora (ARRIGONI, 2013) Mas afinal o que é big data? O big data descreve um conjunto de problemas e suas soluções tecnológicas em computação aplicada com características que tornam seus dados difíceis de tratar. Na informática, o big data tem um significado mais preciso. O termo é originário de tecnologia da informação e é aplicado a conjuntos de dados, cujo tamanho é 14 Leia mais sobre esse assunto em http://oglobo.globo.com/tecnologia/de-moneyball-davos-big-data-se-abrepara-mundo-4460918#ixzz2lSND5bXF 15 A segurança social é um conceito consagrado no artigo 22 da Declaração Universal dos Direitos Humanos que afirma que toda pessoa, como membro da sociedade, tem direito à segurança social e tem direito à realização, pelo esforço nacional, pela cooperação internacional e de acordo com a organização e recursos de cada Estado, dos direitos econômicos, sociais e culturais indispensáveis à sua dignidade e ao livre desenvolvimento de sua personalidade. Em termos simples, os signatários concordam que a sociedade em que vive a pessoa deve ajudálos a desenvolver e tirar o máximo partido de todas as vantagens (cultura, trabalho, bem-estar social ), que são oferecidos a eles no país. Informações retiradas do http://en.wikipedia.org/wiki/Social_security_system 32 além da capacidade de ferramentas de software utilizadas para capturar, gerenciar e processar os dados dentro de um tempo decorrido tolerável (ADAMI, 2013). “Devido ao modelo econômico adotado pela globalização, o termo just in time, totalmente dependente da necessidade de uma expansão virtual, se tornou a palavra de ordem das negociações e forçou a ampliação de estrutura para armazenamento de dados”16. Segundo Manovich (2013) grandes volumes de dados têm variado de algumas dezenas de terabytes para muitos petabytes de dados em um único conjunto de dados. Já para Recuero17 (2013), uma das pesquisadoras da área de internet, do ponto de vista social, o big data se refere à imensidão de dados sobre indivíduos e grupos que hoje são gerados na Internet por esses atores. Recuero (2013) diz que, ...coletar dados de pessoas sempre foi um problema para a pesquisa. Pessoas mentem, inventam, são subjetivas e, o "pior", esses dados ainda eram "traduzidos" pelo pesquisador. Análise de redes sociais, por exemplo, era feita como no tempo do Moreno: perguntando às pessoas. Eis que com a Internet, centenas de milhares de pessoas passaram a criar e espalhar "rastros digitais". Passaram a deixar por aí registros de suas falas, seus gostos, seus pensamentos, seus amigos e etc. Centenas de milhares de dados passaram a ser gerados e publicados por todos nós. E o uso desses dados é o que "Big Data" se refere. É a primeira vez na História que cientistas têm acesso a dados brutos humanos "não subjetivos" e que essas análises podem ser feitas de forma quantitativa e em grande escala. E mais do que isso, de dados que são gerados em outras plataformas especialmente para isso (como dados de consumo, dados de comportamento e etc.) (RAQUEL, 2013)18 Resumindo, para Recuero (2013), big data é sobre todos nós e as informações que publicamos/concedemos a outros. Big data é sobre análise dos dados de milhares de consumidores. É sobre padrões. Com o big data Existem várias formas de extrair valor dessa quantidade de dados disponíveis, de modo a facilitar a vida das pessoas, melhorar a prestação de serviços, pautar decisões mais assertivas e consequentemente aumentar a receita das empresas. Em linhas gerais, big data é a análise de vastos banco de dados, tanto estruturados (planilhas e tabelas) como não estruturados (linguagem natural, imagens, etc), em sua totalidade, sem recorrer a amostras, e sempre em busca de padrões e correlações. Para os especialistas em marketing o big data é considerado uma técnica avançada de análise de dados dos indivíduos. Já no âmbito da política eleitoral o big data tem se 16 Citação retirada da página da infoescola da autora Anna Adami. Disponível em: <http://www.infoescola.com/informatica/big-data/> 17 RECUERO, Raquel. Big Data: apontamentos e limitações. Postagem em 14.05.2013. Blog acessado em junho de 2013 < http://www.raquelrecuero.com/arquivos/2013/05/big-data-apontamentos-e-limitacoes.html> 18 Citação retirada do blog http://www.raquelrecuero.com/ 33 transformado numa ferramenta alternativa de survey (pesquisa) para revelar atitudes e preferências de eleitores, que podem ser utilizados por candidatos e políticos de forma estratégica na conquista do voto (OLIVEIRA, 2013). 4.3.2 Características do Big Data O big data é constituído por três principais características, os chamados três 'Vs': highvolume (volume), high-velocity (velocidade) e high-variety (variedade). (BIG, 2013; XEXÉO, 2013). A outras duas características foram adicionadas atualmente ao conceito que trata-se do valor e veracidade (DEMCHENKO, 2013). Com isso, também será encontrado na literatura o termo 5 Vs, definindo melhor a abrangência do conceito de big data. Mas do que, afinal, se trata os 5 Vs do big data? 1.Volume: esta característica se refere à grande quantidade de dados digitais a serem analisados. Porém, não há uma definição precisa da medida, em bytes, da quantidade necessária para afirmar que alguma organização está lidando com um volume grande de dados. Para o analista e pesquisador da IDC (International Data Corporation), Carl W. Olofson (TRÊS, 2013) essa questão do volume depende do caso e da natureza do dado. “Algumas centenas de gigabytes podem muito bem caracterizar big data por causa da terceira dimensão, que é a da velocidade ou tempo necessário para processamento”. Assim, pode-se verificar que a questão da “grande quantidade de dados” é um aspecto relativo; depende de outros fatores. A partir de informações divulgadas pela Intel (2012), é possível ter uma “visão telescópica” sobre o que vem acontecendo com os dados que são gerados diariamente, principalmente na Internet. A pesquisa revela que desde o início da era civilizada até 2003 foram gerados 5 exabytes de informações. Atualmente, em dois dias é gerado o mesmo volume. A estimativa, calculou que o planeta chegaria a um volume de 2.72 zettabytes em 2012 e dobraria a cada dois anos até chegar a 8 zettabytes em 2015. Outros exemplos ilustram essa característica do big data. Os experimentos no Large Hadron Colider no CERN (Laboratório de Física de Partículas na Europa) geram 40 terabytes de dados por segundo, mais informação do que pode ser armazenada ou analisada pelas tecnologias atuais (muitos destes dados são simplesmente descartados, dada a incapacidade de armazená-los). Esta informação foi extraída da revista semanal The Economist de 2013, na qual é afirmado que exemplos de manuseio de grandes quantidades de informação como este também são encontrados em outros cenários, como nos bancos de dados do Wallmart, de 34 tamanho estimado em torno de 2,5 petabytes, o equivalente a 167 vezes o conteúdo dos livros na biblioteca do Congresso Americano. Estes e outros exemplos mostram como a criação de dados cresceu nos últimos anos. Estima-se que do início da civilização até 2003, a humanidade criou 5 hexabytes de informação; atualmente esse mesmo volume é criado a cada dois dias (VILLELA, 2013). Xexéo (2013) observa que muitas vezes somos obrigados a escolher que tipos de dados queremos guardar. “O restante acabamos descartando. Cabe aí saber o que guardar. E guardar cada vez mais rápido é o desafio de hoje”. (XEXÉO, CIÊNCIA HOJE, 2013, p.19) 2.Velocidade: de acordo com o Gartner (BIG, 2013), velocidade significa tanto o quão rápido os dados estão sendo produzidos quanto o quão rápido os dados devem ser tratados para atender à demanda. Etiquetas RFID e contadores inteligentes estão impulsionando uma necessidade crescente de lidar com torrentes de dados em tempo quase real. Reagir rápido o suficiente para lidar com a velocidade é um desafio para a maioria das organizações. Na computação, por exemplo, toda vez que o volume de dados a ser analisado aumenta, consequentemente é consumido mais tempo de processamento para obter o resultado da análise. Essa relação, inversamente proporcional, ocorre independentemente da tecnologia utilizada. Assim, quanto mais lentamente o resultado for divulgado, maior será a probabilidade de que a necessidade da informação já esteja expirada. Assim, de acordo com Carl W. Olofson realizar-se a análise de uma grande massa de dados consumia uma hora de processamento e, com o aperfeiçoamento desse processo, foi possível realizar em um segundo, altera-se muito a perspectiva do que se pode “fazer com os resultados gerados, agregando mais valor ao dado”. Dessa forma, entende-se que avaliar isoladamente essas características não satisfaz a compreensão do que seja big data. Nesse aspecto, a velocidade no processamento é um fator fundamental para possibilitar a análise de um grande volume de dados no menor intervalo de tempo que seja possível. 3.Variedade: de acordo com uma pesquisa realizada pela empresa TATA Consultancy Services (TCS) (WHITCH, 2012), 51% dos dados nas empresas estão organizados de forma estruturada. Portanto, estão definidos em esquemas ou tabelas de um banco de dados em que a estrutura possui atributos que dão significado ao dado e utilizam algum tipo de indexação para determinar uma identidade única para cada registro. Os 49% restantes estão distribuídos em não estruturados ou semiestruturados. Em outras palavras, estão catalogados através de 35 planilhas, documentos de texto, e-mail, recados em mídias sociais, imagens, vídeos, arquivos de áudio, XML, HTML, entre outros. Assim, variedade significa que os dados aparecem em formas diferentes. Os sistemas tradicionais são otimizados para processar dados que podem ser facilmente descritos na forma de tabelas, como uma planilha eletrônica, onde cada coluna tem tamanho constante ou previsíveis, mesmo que a quantidade de linhas seja muito grande. Muitos dos novos tipos de dados têm formatos mais livres (textos, imagens, etc) ou com estruturas específicas (redes, por exemplo). (XEXÉO, Ciência Hoje, 306, Agosto, 2013, p. 19) A partir desses três ‘Vs’, outros autores propõem ainda mais dois conceitos, como veracidade, variabilidade ou valor. São outras preocupações importantes, como garantir que o dado seja verdadeiro e ainda válido no tempo. 4. Veracidade: Lorena (2013), a respeito dos problemas de comunicação nas empresas, observa que um em cada três líderes de negócios frequentemente toma decisões importantes com informações incompletas ou de fontes não confiáveis, um em cada dois líderes de negócios não tem informação suficiente vinda através de sua organização para executar suas tarefas. 5. Valor: Segundo Norvig (VEJA, 2013, p. 8) diretor de pesquisa do Google, “com o big data, se gasta muito mais tempo coletando dados do que chegando a resultados”. Segundo ele mais de 90% da informação armazenada sempre aparenta ser dispensável. Então, a pergunta que se faz, qual seria o sentido de empenhar tanto esforço e investimento para recuperar um número tão pequeno de informações úteis, ou seja, cerca de 10%? O esforço empenhado na análise desses dados só passa ter utilidade, ou valor, quando são selecionados corretamente os dados que devem ser analisados. Norvig (2013) observa que “o real diferencial está no que é considerado lixo”. Mayer-Schönberger e Cukier (2013) também discutem essa característica do big data, dizendo que o valor dos dados, no mundo do big data, passa do uso primário para o uso potencial no futuro, o que gera profundas consequências: afeta a forma como os negócios valorizam seus dados e a quem conferem acesso a eles. Segundo os autores, “isso permite, e talvez até obrigue, as empresas a mudar seus modelos de negócios e altera a forma como elas enxergam e utilizam os dados” (MAYER-SCHÖNBERGER; CUKIER, 2013, p. 70). 36 Os autores chamam a atenção particularmente para as empresas de informação, como a Farecast ou o Google – nas quais, segundo eles, os fatos brutos entram num lado da linha de produção e saem do outro como informação processada. Com isso, os dados estão começando a parecer um novo elemento de produção. O valor imediato da maioria dos dados é evidente para os que o coletam. As lojas registram dados de vendas para realizar um adequado balanço financeiro. As fábricas monitoram a produção para garantir que esteja adequada à demanda e a seus padrões de qualidade. Os sites registram cada clique dos usuários para analisar e otimizar o conteúdo que fornecem aos visitantes. Ao contrário das coisas materiais, o valor dos dados não diminui com o uso; ele pode ser continuamente reprocessado, reagregando valor a cada novo uso. “Os dados são o que os economistas chamam de bem “sem concorrente”: seu uso por uma pessoa não impede o uso por outra, e a informação não se desgasta como as coisas materiais”. (MAYERSCHÖNBERGER; CUKIER, 2013, p 71). Como os dados podem ser usados várias vezes com o mesmo objetivo, o mais importante é que podem ser utilizados com vários objetivos também. Mas afinal que tipo de possibilidades temos com o emprego do big data? Dentre outras formas de se criar valor com big data, é possível, segundo as perspectivas dos especialistas da IBM19: Identificação de padrões: que podem auxiliar na tomada de decisões. Por exemplo a percepção de que um grande número das pessoas sofre de um problema comum gera o insight em relação às carências que as empresas podem preencher. Personalização: o armazenamento de dados relativos aos hábitos e interações das pessoas permite que elas tenham atenção personalizada, o que torna o atendimento e a resolução dos seus problemas muito mais efetiva. Planejamento estratégico: as empresas podem planejar suas ações com base em informações previamente mapeadas direcionando suas decisões com base em dados. Inovação: o uso de big data possibilita um conhecimento maior dos clientes e do mercado como um todo, facilitando o processo de criação de novos produtos e serviços. Assim segundo as expectativas dos especialistas da IBM, o big data torna-se viável e rentável, emergindo formas de “domar” dados massivos, pois, dentro desses dados existem padrões e informações valiosas, previamente ocultos devido à sua extração complexa. Por 19 Informações retiradas do site da IBM. 37 exemplo, em empresas como a Google ou a Walmart, este poder é por vezes atingido, mas a um custo exorbitante. Contudo, hoje em dia, o hardware, as arquiteturas cloud (nuvem) e o software open source oferecem o processamento big data a um menor custo, possibilitando, aos iniciantes na área, alojar um servidor na cloud com custos mais reduzidos. 4.3.3 De onde vêm os dados Xexéo (2013) aponta que os dados estão presentes no comércio e na indústria. Segundo o autor as informações são geradas a partir de cada venda em uma rede de supermercados, por exemplo. E se essas informações forem cruzadas com mensagens em redes sociais sobre mercados, produtos, receitas e notícias na mídia ou com as regiões geográficas, em que acontecem, os sistemas que analisam toda essa informação permitem aos donos dessas lojas obterem tanto dados de perfis de consumo individualizado quanto da experiência de compra do cliente e seus gastos. Já na indústria, Xexéo (2013) destaca que um dos fatores que aumenta a quantidade de dados é a multiplicação dos sensores de vários tipos, de câmeras de alta definição a simples contadores ou termômetros. O autor exemplifica, dizendo que uma empresa pode colocar sensores não só em sua fábrica para analisar o processo produtivo, mas também em seus produtos, que enviam ao fabricante, dados sobre sua localização geográfica, seu uso e desempenho. A maioria das coisas hoje, até aqueles equipamentos que temos em casa, já oferecem informações e dados sobre seus estados. Geladeiras, por exemplo, ligadas a internet oferecem dados sobre o estado e ritmo de consumo dos produtos que estão guardadas nelas. Esse fenômeno é identificado por muitos pesquisadores como a “internet das coisas”, em que s ão utilizadas várias tecnologias em conjunto, tais como sensores, RFID, redes wireless e outras. Ainda sobre os dados, Xexéo (2013) observa que no Brasil, em especial, a indústria de petróleo é grande criadora de dados, que vão da pesquisa sísmica inicial e monitoração eletrônica de poços até a venda de combustível na bomba dos postos de abastecimento. Os dados dos bancos de dados da Agência Nacional do Petróleo (ANP) são usados por várias empresas de petróleo, que produzem ainda mais informações. A partir deles, são gerados imagens e filmes que são analisados e geram textos e relatórios, que, por sua vez, geram investimentos financeiros, movimentos da bolsa e notícias na mídia. Assim, entende-se que os dados gerados circulam por diversos ambientes e diversos formatos o tempo todo. Como observa Arrigoni (2013) a geração dessa massa informacional está em todo lugar. 38 Nas suas interações na web, quando você busca algo no Google — o pai do big data — no seu celular, no seu exame médico, na previsão do tempo, na compra da sua passagem aérea e até no cinema. Por toda essa grandiosidade, um data scientist precisa entender de matemática, probabilidade, programação, às vezes linguística (NLP) e até de análise de redes sociais (SNA) (ARRIGONI, 2013) É importante lembrar, que nem todos os dados são necessariamente úteis para análise de big data. No entanto, alguns tipos de dados são particularmente maduros para análise, segundo as perspectivas dos analistas de dados David Reinsel e John Gantz (2012), do IDC Group apresentadas no site do grupo20: Imagens de vigilância. Normalmente, os metadados genéricos (data, hora, local, etc) são automaticamente ligado a um arquivo de vídeo. No entanto, como as câmaras IP continuam a proliferar, há uma maior oportunidade para incorporar mais inteligência na câmara (na extremidade) de modo que as imagens podem ser capturadas e analisadas e marcado em tempo real. Este tipo de marcação pode agilizar investigações de crimes, melhorar a análise de varejo para os padrões de tráfego de consumo, e, claro, melhorar a inteligência militar como vídeos de drones em várias geografias são comparados para as correlações teste padrão, emergência multidão e resposta, ou medir a eficácia de contra-insurgência. Incorporado e dispositivos médicos No futuro, os sensores de todos os tipos (incluindo aqueles que podem ser implantados no corpo) irá capturar a biometria vitais e não vital, a eficácia da medicina rastrear, correlacionar a atividade física com a saúde, monitorar potenciais surtos de vírus, etc - tudo em tempo real. Entretenimento e mídia social. Tendências com base em multidões ou grupos enormes de pessoas pode ser uma grande fonte de grandes volumes de dados para ajudar a trazer ao mercado a "próxima grande coisa", ajudar a escolher vencedores e perdedores no mercado de ações, e sim, até mesmo prever o resultado das eleições tudo baseado em usuários da informação publicar livremente através de lojas sociais. Imagens de consumo. Nós dizemos muito sobre nós mesmos quando postamos fotos de nós mesmos ou nossos familiares ou amigos. A imagem usada pode valer mais que mil palavras, mas o advento do Big Data introduziu um multiplicador significativo. A chave será a introdução de algoritmos sofisticados de marcação que pode analisar as imagens, quer em tempo real quando as fotografias são tiradas ou enviados ou em massa depois que eles são agregados a partir de vários sites. (REINSEL; GANTZ, 2012) Zeferino (2013) aponta a evolução histórica do big data, a partir de três níveis fundamentais de produção: A produção de dados em regime de Input - Situação que retrata os primórdios dos primeiros computadores pessoais, sobre os quais existia a necessidade de armazenar dados diretamente em cada PC, e que marcou uma viragem determinante na vida tecnológica das empresas. A produção de dados em regime de User Generated Content (UGC) – Situação que abrange a realidade da chamada Web 2.0, na qual se evidencia o papel preponderante 20 <http://www.emc.com/leadership/digital-universe/iview/index.htm> 39 do próprio utilizador na criação e geração de conteúdos em regime colaborativo e de partilha. A produção de dados em regime de Machine-Generated Data (MGD) – Situação que retrata o processamento automatizado de dados sem intervenção humana e que se refere ao funcionamento de complexos sistemas integrados em ambiente de computação contínua. Para Simon Szykman21, diretor de informática do Departamento de Comércio Norte- americano, os desafios do big data em relação aos dados podem ser divididos em: como adquirir; armazenar; processar; transmitir e disseminar; gerenciar e manter; arquivar por longo prazo; garantir a segurança; treinar pessoas para usá-los; pagar por tudo isso. Além disso, a preocupação está como entender os dados de forma isolada e como relacioná-los. Para isso, a sociedade precisa de novas teorias e tecnologias. Uma das principais aplicações de ter à disposição uma grande quantidade de dados é descobrir algo novo. Isso, segundo Xexéo (2013) pode se dar por detecções de padrões, levantamento de regras ou aprendizagem de máquina. 4.3.4 Ciclo de vida do Big Data Para por em prática os conceitos referentes aos 5Vs do big data, como já foram descritos anteriormente neste trabalho no item 4.3.2, é necessário desenvolver uma visão crítica sobre os dados a serem analisados. Esta visão é apoiada pelo conhecimento do ciclo de vida ou fases que norteiam o big data a partir das considerações da área de Tecnologia da Informação (TI). Lastori (2013) divide em quatro fases o ciclo de vida do big data: acquire, organize, analyze, decide, ou seja, aquisição, organização, análise e decisão respectivamente. Aquisição: é a fase em que os dados são coletados através de diversas fontes possíveis; podem ser através da web ou até mesmo de fontes de dados estruturadas. Esta fase precede o armazenamento dos dados. Organização: é o processo em que os dados são modificados para se adaptarem à estrutura de análise e, também, é o momento de classificação desses dados antes de seu armazenamento físico no banco de dados. 21 Informações retiradas da Revista Ciência Hoje, agosto de 2013. 40 Análise: também conhecida como analytics, é a parte do ciclo em que são aplicados algoritmos matemáticos sobre os dados já classificados e armazenados. Esses algoritmos são definidos a partir das regras de negócio, obtendo-se ao final do processamento, resultados estatísticos. Algoritmos é conceituado como uma sequência finita de instruções bem definidas com a finalidade de resolver um determinado problema computacional. As informações se inserem nesse contexto como os dados de entrada, o algoritmo executa o processamento dessas informações e o resultado são as informações. Segundo o dicionário Aurélio um algoritmo é um: “processo de cálculo, ou de resolução de um grupo de problemas semelhantes, em que se estipulam, com generalidade e sem restrições, regras formais para a obtenção de resultado ou solução de problema”. Analytics é definido como inteligência analítica, é a palavra-chave que encerra o ciclo de vida do big data (NAFFAH, 2012). Isso porque, em essência, análise “...dá a idéia de que se pode entender melhor uma situação ou ideia quando as suas diversas partes se encontram como que soltas, separadas entre si para contemplação” (CONSULTAS, 2005). Com big data, a diferença é que essa capacidade de se “entender melhor uma situação” se tornou exponencial, uma vez que é possível realizar análises sobre dados volumosos e caóticos, tais como os encontrados na internet, principalmente em ambientes de redes sociais. No que se refere a fase de análise, os resultados estatísticos são os elementos mais esperados para a conclusão da última fase do ciclo; o processo de tomada de decisão e, consequentemente as ações a serem realizadas. O fenômeno big data oferece às organizações novas possibilidades de obtenção de importantes informações sobre seus mercados, competidores e seu negócio (VILLELA, 2013). Através do uso de analytics (i.e. Ferramentas de análise de dados), estas organizações conseguem acessar, gerenciar e cruzar estes dados à procura de insights de informações contidas neles. Assim, tais organizações podem, por exemplo, conseguir conhecer um possível nicho consumidor emergente, identificar gargalos operacionais a fim de reduzir os custos envolvidos na produção de algum bem ou desempenho de algum serviço. Através do uso de analytics pesquisadores conseguem analisar informações de milhares de pessoas e compreender o comportamento humano a um nível de população (The Economist, 2013). Este tipo de entendimento do comportamento de grupos humanos tem grande valor para as organizações modernas, pois fornece uma nova força motora para seus negócios. Através deste entendimento, podem-se definir melhores estratégias de venda e produção de bens de consumo, de forma a melhorar o desempenho e aumentar a competitividade da organização. Este aumento de desempenho e competitividade representa 41 algumas das formas de geração de valor a partir da informação, valor este que é intangível se comparado a outras forças motrizes dos negócios, como dinheiro e trabalho. Intangível, pois não gera um valor direto para a organização (com dinheiro compra-se matéria prima, com trabalho produzem-se bens e serviços), mas aplicado em conjunto com outros recursos representa uma excelente ferramenta para o mundo dos negócios. Uma demonstração prática desse poder de análise pode ser observada através dos resultados do projeto Social Genome da rede de supermercados Wallmart. O objetivo do projeto é melhorar seu sistema para recomendação de compras através de inteligência analítica. As informações disponíveis pelo Wallmart (SOCIAL, 2013) mostram como é possível realizar as recomendações através do cruzamento de informações postadas no twitter. Através do recebimento da simples mensagem “I love Salt” postada pela usuária Hanna, o sistema automaticamente enviou um e-amil para Juliana, também usuária do twitter, sugerindo um presente de aniversário para sua amiga Hanna. Para que seja possível realizar minimamente essas quatro fases que compreendem o ciclo de vida do big data, no entanto, são necessários diversos componentes de hardware e software. Além disso, são necessários especialistas na área de dados a fim de formar uma arquitetura completa. Na área de TI esses especialistas, também são chamados de Data Scientists (Cientista de Dados), são profissionais escassos e, portanto, muito valorizados nessa área. Eles são capazes de interagir com sucesso entre todas as fases de suma importância no tratamento de dados. São profissionais focados na obtenção dos resultados de valor, imprescindíveis na garimpagem de petabytes de dados. Por sua polivalência, os cientistas de dados têm a capacidade de atender a uma vasta gama de nichos. Esta versatilidade só é possível mediante formações, especializações e pesquisas em áreas tais como estatística, computação, programação, ciências sociais, entre outras. Em poucas palavras, a arquitetura necessária para tratar big data é dividida em três categorias: softwares para coleta de dados, infraestrutura de armazenamento de dados e análise de dados. Algumas empresas tais como Amazon, Google, Yahoo, Facebook e IBM, estão entre as maiores empresas que desenvolvem e utilizam essa arquitetura (BARBOSA, 2013). Para coletar o grande volume de informações essas grande companhias têm criado centros de pesquisa de informação (DRAGLAND, 2013). A vantagem de tais empresas é que seus serviços, por natureza, produzem grandes quantidades de informações sobre o comportamento das pessoas, extraídos das pesquisas que fazem, das páginas que visualizam. No entanto, mesmo pesquisadores que não estejam alocados nestas companhias conseguem ter acesso aos dados. Ferramentas como o Wisdom, uma ferramenta de análise de dados 42 sociais de usuários do Facebook, garantem a seus usuários acesso a dados de enormes grupos de indivíduos. 4.3.5 Usos e aplicações do Big Data Hoje, várias áreas são guiadas por programas desenvolvidos a partir da análise de informações a partir do emprego do big data. O big data se aplica a qualquer área em que haja enormes desafios para extrair informações a partir de dados não convencionais ou sobre dados extremamente volumosos que não podem ser atendidos pela estrutura tradicional. Para Mayer-Schönberger e Cukier (2013), os usos do big data se aplicam tanto ao setor público quanto às empresas privadas. Estudo realizado pelo Gartner (2013) mostra que as três principais aplicações de big data do mercado são em marketing e vendas, performance operacional e financeira, e inovação. Neste item busca-se apresentar alguns exemplos práticos dos usos e aplicações do big data presente em diferentes segmentos, para o desenvolvimento deste item foram buscadas informações em sites e blogs de especialistas que discutem o tema. 4.3.5.1 Big data e empresas No âmbito comercial, a empresa americana FedEx, a mais famosa transportadora de cargas do mundo, é pioneira no uso do big data22. A empresa desde a sua fundação em 1973, quando operava em 25 cidades, monitorava os pacotes que transportava, o que resulta em um enorme banco de dados. Nos anos 1980, a empresa tornou-se uma das primeiras companhias privadas a escanear cada encomenda. Hoje algoritmos23 permitem aos computadores da FedEx processar em tempo real e sem interrupção cerca de 2,5 milhões de transações diárias realizadas em 220 países por 90 mil veículos e 690 aviões. A FedEx usa sensores que medem a temperatura, a localização e a exposição à luz de pacotes. Esses dados são transmitidos diretamente ao cliente. 22 Informações retiradas da revista Veja 2013. Disponível em: http://ufmggei2013.files.wordpress.com/2013/08/veja-big-data.pdf 23 Na definição clássica, algoritmos são uma sequência de instruções, que permite que chegue a uma conclusão sobre que tipo de ação tomar. Temos aquela definição clássica do Algoritmo sendo uma receita de bolo, que nada mais é do que uma sequência de passos para chegar ao bolo pronto. A origem do termo remonta ao matemático persa do século IX cujo nome entrou na corrente do pensamento ocidental pelo árabe clássico como Al-Khwarizmi. A idéia de uma sequência algorítma foi inspirada na vida cotidiana. O conceito de um algoritmo foi formalizado em 1936 pela Máquina de Turing de Alan Turing e pelo cálculo lambda de Alonzo Church, que formaram as primeiras fundações da Ciência da Computação. Informações retiradas do site do Wikipédia. 43 No e-banking, o big data combina fonte de dados para detectar padrões de atividade fraudulenta, como lavagem de dinheiro, fraude de cartões de crédito, entre outros. No marketing de relacionamento, o conceito usa os dados para fidelizar clientes, conquistar prospects, bem como informações transacionais e demográficas para maximizar o relacionamento com os clientes e as margens de lucros (VEJA, 2013). Com o volume de informações e dados gerados pela sociedade muitos setores passaram a dar mais atenção para isso nos últimos tempos. Um exemplo é o da Zappos, um site de compras americano, que lançou um serviço que recomenda produtos com base no comportamento de seus usuários, tendo por objetivo identificar as tendências de compras dos clientes/usuários. Outras empresas também fazem mineração de dados de redes sociais em tempo real. Ford Motor, PepsiCo, e Sudoeste Airlines por exemplo, analisam postagens de consumo sobre suas empresas em sites de mídia social como o Facebook e Twitter para avaliar o impacto imediato de suas campanhas de marketing e para entender como o sentimento do consumidor sobre suas marcas está mudando24. No Brasil a loja de departamento Renner é considerada também um exemplo de uso do big data. Ela usa a tecnologia do big data para monitorar o fluxo de mercadorias de suas filiais em todo o país, o que é feito em tempo real. Com isso é possível cruzar os dados de localização dos caminhões com o nível de estoque das lojas e ainda reorganizar a mercadoria entre as lojas com base em dados. 4.3.5.2 Big data e Saúde Na área da saúde, o big data tem sido usado e contribuído para criar novos medicamentos, tratamentos personalizados e entender a diversidade genômica de um país. Por exemplo, usando o WTCCC25 (Wellcome Trust Control Consortium Case) foi identificada uma variante genômica relacionada ao câncer que estratifica a população japonesa e chinesa, seus perfis de expressão de genes associados e subtipos específicos de tumores gástricos. 24 < http://www.experienceclub.com.br/site/artigos-reader/items/brasil-big-data-e-grandes-oportunidades.html> A Wellcome Trust Caso Controle Consortium (WTCCC) é um grupo de 50 grupos de pesquisa em todo o Reino Unido, que foi fundada em 2005. Os objetivos WTCCC estão na exploração do progresso na compreensão dos padrões de variação da seqüência do genoma humano, juntamente com os avanços nas tecnologias de genotipagem de alto rendimento, e para explorar a utilidade, design e análise de estudos de associação ampla de genoma (GWA).O WTCCC aumentou substancialmente o número de genes conhecidos por desempenhar um papel no desenvolvimento de alguns dos nossos doenças mais comuns e, até à data identificado, aproximadamente 90 novas variantes através de todas as doenças analisadas. Bem como confirmar muitas das associações conhecidas, cerca de 28 no total, a WTCCC identificou também muitas novas variantes que afetam a susceptibilidade à doença. (www.wtccc.org.uk/) acessado em 16 de outubro de 2013. 25 44 Na área médica, pesquisadores do Instituto de Tecnologia de Massachusetts (MIT), da Universidade de Michigan, do Hospital Brigham, de Boston, e da Escola de Medicina da Harvard desenvolveram uma ferramenta que determina com mais precisão a possibilidade de ataques cardíacos e até risco de morte em pacientes que já sofrem do coração 26. Eles estudaram os eletrocardiogramas (ECG) de um grupo de risco e encontraram indicadores sutis, até então escondidos, que antecipam crises cardíacas. Ao observar fragmentos de dados de ECG, médicos e enfermeiros jamais conseguiriam chegar a uma determinante para o comportamento dos pacientes. Essa tarefa só foi possível ao enxergar o quadro todo, em grande escala, através de técnicas de data mining27 e machine learning. Também na área médica, um hospital de Santa Clara (Kaiser Permanente Santa Clara Medical Center, Califórnia, EUA) comprou um software que armazena os dados dos pacientes ainda na triagem, junto dos futuros diagnósticos destes mesmos pacientes. A partir do cruzamento com informações e comportamentos de novos pacientes, o software consegue antecipar diagnósticos, sintomas e sugerir tratamento, internações e exames complexos. O sistema custou US$ 4 milhões e foi intregrado aos 37 hospitais da rede Kaiser. Hoje, ajuda médicos e enfermeiros a chegarem a diagnósticos mais precisos e rápidos. Ainda na saúde podemos citar a potencialidade do big data no caso da pandemia do vírus H1N1 ocorrido em 2009 em todo o mundo. O exemplo é citado por Mayer-Schönberger e Cukier (2013). Segundo os autores, essa nova forma do vírus da gripe se disseminou rapidamente em diversos países. Os centros de prevenção e controle dos EUA, por exemplo, tiveram dificuldade em realizar diagnósticos de forma rápida, pela demora dos pacientes em procurar um médico ou pelo tempo necessário para realizar o processamento das notificações dos casos. No mesmo período, um artigo publicado na revista Nature apresentou algumas possibilidades de uso de recursos do sistema de buscas Google para previsão de ocorrência do vírus por localizações determinadas como estados ou regiões. A análise não levou em conta apenas os termos buscados pelos usuários, mas uma grande quantidade de modelos matemáticos, construídos a partir de combinações entre a frequência de certos termos e a disseminação do vírus através do tempo e regiões geográficas. A pesquisa processou 450 milhões de modelos matemáticos diferentes, comparando-os com casos de gripe registrados entre 2007 e 2008. O resultado foi a combinação de 45 termos de pesquisas que, quando 26 Informações retiradas do site: http://www.adnews.com.br/tecnologia/uma-entrevista-didatica-sobre-big-data Prospecção de dados ou mineração de dados (também conhecida pelo termo inglês data mining) é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados. (Wikipédia, http://pt.wikipedia.org/wiki/Minera%C3%A7%C3%A3o_de_dados) 27 45 utilizados nesses modelos matemáticos, mostravam uma forte relação entre as previsões e os dados oficiais posteriores. Portanto, a análise rápida de grandes volumes de dados, a partir de uma estrutura rápida e com alto poder de processamento, poderia ser utilizada para prever eventos. Um hospital no Canadá usou tecnologia da IBM e da Universidade de Ontário para monitorar em tempo real dezenas de indicadores de saúde de bebês prematuros. O cruzamento permitiu aos médicos antecipar ameaças às vidas das crianças28. E mais recentemente, temos os exemplos de aplicação do big data em doenças como dengue e malária. A IBM29 fez uma parceria com pesquisadores da Universidade Johns Hopkins e da Universidade da Califórnia para usar a análise de big data para prever a eclosão de doenças, como a dengue e a malária. A pesquisa teve como objetivo compreender a propagação de doenças em tempo real, a fim de utilizar os recursos da saúde pública da melhor maneira possível. Mas ao invés de apenas prever a propagação de uma doença, os pesquisadores da IBM e das universidades estão aplicando a análise de grandes conjuntos de dados para ver como as mudanças na precipitação, temperatura e até mesmo a acidez do solo podem afetar dramaticamente as populações de animais selvagens e insetos que carregam as doenças. Os pesquisadores também estão fundindo essas informações com outros dados, como os de aeroportos e tráfego nas estradas, para tentar entender melhor os surtos. Para isso, a IBM criou um aplicativo open-source chamado Spatio Temporal Epidemiological Modeler (STEM), que permite que qualquer tipo de dado seja rapidamente combinado e correlacionado com dados de doenças. 4.3.5.3 Big data e Governo Outro exemplo de aplicação do big data citada por Mayer-Schönberger e Cukier (2013) são as “cidades inteligentes” (Smart Cities), que atualmente, segundo os autores, estão sendo planejadas em diversos países e visualizam para um futuro próximo espaços urbanos altamente intensivos no uso de por tecnologias de informação e comunicação. Sensores disseminados em equipamentos de infraestrutura urbana, informações produzidas por dispositivos pessoais de comunicação, redes sem fio, apps inteligentes, posts em mídias sociais baseadas em geolocalização, serviços de computação em nuvem. Todos esses elementos vislumbrados como parte essencial das cidades inteligentes – pelo menos do ponto de vista tecnocrático das grandes empresas de TI – poderiam produzir e alimentar grandes 28 O Globo. Como funciona o Big Data. < http://oglobo.globo.com/infograficos/bigdata/> Matéria completa está disponível no site: http://canaltech.com.br/noticia/saude/IBM 29 46 bases de dados, com o objetivo de reagir de forma rápida a demandas individuais e mudanças no ambiente urbano. Projeto como Cidades 202030 também são baseadas em estudos a partir do uso do big data. Com o objetivo de desenvolver um novo modelo de cidade inteligente sustentável, ecológica e economicamente por meio da análise das necessidades dos cidadãos aliada às oportunidades de comunicação oferecidas pela internet e cada vez mais numerosos dispositivos conectados à rede, o projeto pretende identificar as necessidades de usuários com serviços públicos. Além de integrar diferentes âmbitos e tecnologias, o principal atrativo e diferencial do projeto Cidades 2020 é que a análise de dados obtidos em grande escala do comportamento urbano do cidadão, mediante a integração dos grandes dados digitais, promete melhorar e definir os serviços oferecidos, em áreas como, transporte, energia, meio ambiente e comunicação31. Além disso, já existem projetos mais ambiciosos de aproveitar as informações de cidades inteligentes para gerar receita proveniente de anunciantes, levando a questões sobre privacidade e uso ético da informação. Imagine o seguinte: e se uma telecom cruzar dados demográficos e de geolocalização de seus assinantes e oferecer para empresas que desejam saber onde seu público alvo circula na cidade, a fim de escolher o melhor ponto para uma loja. Outra aplicação do big data foi registrada em 29 de Março de 2012, em que o governo dos EUA lançou a Big Data Research and Development Initiative, dotada de um orçamento inicial de 200 milhões de dólares, com o objetivo de acelerar o ritmo do desenvolvimento da ciência e tecnologia, de fortalecer a segurança nacional e de transformar o processo de ensino e aprendizagem. Antes dessa iniciativa o governo dos EUA já utilizava o big data para atividades de espionagem à escala global, mas de forma clandestina32. O projeto PRISM, conduzido pela National Security Agency (NSA), funcionou desde 2007 de forma secreta até junho de 2013, momento em que os jornais britânicos Guardian e norte-americano Washington Post revelaram as atividades daquela agência, com base em depoimentos feitos por Edward Snowden, um ex-analista contratado pela NSA que abandonou os EUA, se exilou na Rússia. O PRISM é capaz de registrar os conteúdos de todas as formas de comunicação 30 As smart cities do futuro deverão partir das pessoas e das comunidades onde vivem e trabalham. É um novo paradigma na forma de fazer cidades, que exige repensar estratégias, tecnologias, modelos e processos urbanos para responder aos atuais desafios ligados à qualidade de vida, ao equilíbrio do ambiente e eficiência dos recursos naturais, às desigualdades e à exclusão social. 31 32 Revista IMasters Disponível: http://issuu.com/imasters/docs/revistaimasters5 Informações retiradas do site: http://issuu.com/telaviva/docs/ti_93/9?e=1344148/4817402 47 eletrônica a nível mundial, incluindo todos os emails, todas as chamadas de celulares, todas as navegações feitas na Internet, todas as imagens e dados obtidos em satélites, bem como toda a espécie de dados pessoais, empresariais, institucionais e governamentais que estejam sob forma digital e circulem nas redes de telecomunicações. Segundo Washington Post o que é preocupante sobre o PRISM não é a coleta de dados, mas sim o tipo de dado coletado33. É importante destacar os projetos que estão em andamento também no Brasil. Em setembro de 2013, foi anunciado que o big data irá monitorar população por meio do registro celular. A Fundação Getúlio Vargas (FGV) está desenvolvendo um projeto de big data para o monitoramento da população da Região Metropolitana do Rio de Janeiro a partir dos CDR das ligações de usuários das operadoras celulares. Segundo Alexandre G. Evsukoff, professor da FGV, o projeto vai identificar os padrões de mobilidade de um universo de 2 milhões de pessoas e poderá ser utilizado para o desenvolvimento de politicas públicas e planejamento na área de transporte e controle de epidemias34. O projeto conta com apoio da Fundação de Amparo a Pesquisa do Rio de Janeiro (Faperj) e parceria com a Coppe-UFRJ e o Massachusetts Institure of Technology (MIT). O seu objetivo é gerar informações relevantes sobre o deslocamento das pessoas, permitindo o desenvolvimento de modelos preditivos que poderão ser usados pela prefeitura que também apoia o projeto. 4.3.5.4 Big data e Política Neste item busca-se apresentar as experiências do big data no âmbito da política eleitoral, que se constitui no recorte de investigação sugerido no trabalho. Os exemplos pioneiros são oriundos principalmente da política norte-americana. No Brasil pouco ainda se discute sobre o emprego do termo em estratégias de marketing e comunicação política, em processos eleitorais. Até o presente momento, nenhuma bibliografia ou pesquisa acadêmica e científica deram conta da temática. A proposta deste item é de aprofundar as pesquisas ao longo do desenvolvimento deste trabalho. A priori apenas é apontada e caracterizada, a partir das pesquisas iniciais feitas na internet, sobre o uso do big data na campanha presidencial de norte-americano Barak Obama em 2012. Cabe ressaltar, que as campanhas políticas de Obama são consideradas pioneiras nos usos das tecnologias como mídias sociais e big data, em estratégias informacionais, comunicacionais e de marketing. 33 < http://gizmodo.uol.com.br/o-que-e-prism/> 34 O Globo.<http://oglobo.globo.com/projetos/tirio_2013/mat2.asp> 48 4.3.5.4.1 Usos do Big data em Campanhas Eleitorais: a experiência americana As campanhas do presidente norte-americano Barack Obama35 são consideradas verdadeiros “case” de marketing político com o uso do big data. Os usos de tecnologias e também das mídias sociais digitais contribuíram para a sua vitória nas duas disputas à Casa Branca. A campanha nas redes sociais em 2012 se transformou no evento político mais tuitado da história dos EUA36. Exemplo disso foi a foto do presidente abraçado à mulher, Michelle Obama, comemorando a vitória que teve mais de 630 mil retweets, com mais de 20 milhões de mensagens, confirmando a influência das redes sociais na opinião pública. A foto foi postada acompanhada da frase "Four More Years" (em português- Mais Quatro Anos). No Facebook e teve 3 milhões de ‘curtir’, pulverizando todos os recordes da maior rede social do mundo (STIVANIN, 2012). Ainda em 2012, a campanha presidencial de Barack Obama contou com o uso da tecnologia de informação, colocando em prática o conceito de big data para a conquista de votos. Segundo Greenwald da Mit Technology Review (2013), durante os 18 meses finais da campanha do presidente Obama, um grupo de análise de dados coletou e combinou milhares de dados sobre todo o público votante dos Estados Unidos. A partir do resultado desta análise foi possível determinar políticas e campanhas de marketing para influenciar o público mais propício para ir às eleições e votar no atual presidente norte-americano. Na campanha um gigantesco banco de dados foi estruturado, com registros de eleitores, suas preferências, reações a abordagens de campanha já realizadas, além de publicações em mídias sociais como Facebook e Twitter. Mais e mais dados foram adicionados por empresas especializadas em hábitos de consumo. Essa base de dados foi utilizada para gerar microsegmentações que então deram origem a aplicativos, ferramentas de campanha e estratégias de atuação diferentes para uma infinidade de perfis de eleitores. A campanha de Obama foi coordenada pelo especialista em dados Dan Wagner, que respondia como diretor de segmentação do Diretório Nacional do partido (DNC). Wagner tornou-se responsável pela coleta e análise de informações dos eleitores individuais por mala direta e telefone. O especialista pediu ao departamento de tecnologia do DNC para 35 Em 6 de novembro de 2012, Obama ganhou 332 votos no colégio eleitoral, superando os 270 votos necessários para que ele fosse reeleito como presidente. Com 51% de votos populares, Obama tornou-se o primeiro presidente democrata desde Franklin D. Roosevelt a ganhar duas vezes a maioria dos votos populares. (Informações retiradas do Wikipedia. < http://pt.wikipedia.org/wiki/Barack_Obama>) 36 Informações retiradas do site: <http://www.portugues.rfi.fr/americas/20121107-obama-o-tuiteiro-mais-curtidodo-mundo> 49 desenvolver software que poderia transformar em tabelas, o que ele chamou de Gerente de Pesquisas (Survey Manager). Na avaliação do especialista em uso de tecnologia na política e fundador do site Personal Democracy Media, Andrew Rasiej37, falar o idioma da web será fundamental para qualquer candidato conseguir se eleger num mundo cada vez mais hiperconectado. Segundo Rasiej, os internautas pensam em rede, não confiam em hierarquia e questionam instituições e até a ideia de Estados Nacionais. Uma das maneiras de alcançar esse público é pelo uso intensivo da tecnologia, como ocorreu na última campanha de Obama em 2012. Para derrotar Mitt Romney, a equipe democrata investiu muito em big data, ou seja, reuniu a maior quantidade possível de dados de eleitores americanos e criou algoritmos e aplicações para lidar com esse conteúdo coletado. O banco de dados da campanha era abastecido com informações sobre os modos como as pessoas abrem o e-mail, tuítam ou publicam no Facebook e sobre mudanças demográficas. Os dados vieram de campanhas passadas, empresas especializadas (como Experian e Acxiom), redes sociais, assinantes do aplicativo Obama for America38 e etc. Um volume gigantesco de dados, chegando a 4gb processados por segundo, 8,5 bilhões de requisições ao banco de dados e 180 tb de armazenamento em três data centers. Toda a captação de dados na campanha de Obama em 2012 foi integrada. Enquanto Romney trabalhava com o tradicional método de pesquisa, sabendo em termos gerais a opinião de seus eleitores, Obama tinha dados fundamentais certeiros (ROSSI, 2012). Todas as informações serviram para adaptar as estratégias da campanha de um modo detalhista, a fim de comunicar mensagens diretamente de acordo com as necessidades de cada grupo de eleitores americanos. Um exemplo do uso dos dados verificou-se que havia em Nova York um público interessado por um tipo de programa noturno peculiar, um possível jantar com celebridades, especialmente com a atriz Sara Jessica Parker. Esse grupo existia e, verificou-se que tinham poder aquisitivo grande. Daí nasceu um concurso de doação para a campanha. Quem doasse poderia jantar com ela e Obama. A estratégia também foi aplicada com o ator George Cloney, em que mulheres de 40 a 42 anos manifestavam interesse em um jantar na companhia da celebridade. A aplicação das técnicas de análise de dados apresenta-de como potencialmente decisiva para os resultados da eleição. A campanha de Obama utilizou os insights 37 Informações retiradas do site http://www.hexans.com.br/noticia/big-data-ajudou-obama-a-ganhar-eleicoes.html , acessado no dia 16 de outubro de 2013. 38 http://barackobama.tumblr.com/ 50 conquistados para ações one on one, ou seja, a campanha foi baseada em ferramentas do marketing relacional e do marketing individualizado (O2O), muito utilizado também por grandes empresas de sucesso na conquista de clientes. Assim, toda estratégia de marketing da campanha de Obama foi extraída do marketing que já se pratica no âmbito comercial. Marketing é visto como a ciência que se fundamenta na identificação e interpretação de anseios do mercado para atendê-los, satisfazendo as necessidades identificadas. O candidato americano buscou trabalhar a sua campanha eleitoral, a partir do uso das informações coletadas e análise dos dados com a ajuda da ferramenta do big data. Foi, portanto, a partir das últimas eleições norte-americanas em 2012 que se colocou como um desafio e tendência o conceito de big data empregado no âmbito da política Os vários blogs39 e sites que tratam de política eleitoral, especificamente da americana, abordam que os dados em grande volume provenientes de redes sociais, sistemas e emails e outras ferramentas representam um desafio tanto pela capacitação operacional de manejá-los e armazená-los de maneira estratégica para potencializar o negócio ou uma ação, com as estratégias de campanhas dos candidatos americanos. Os dados mostram que, antes do dia da votação, cada convenção dos partidos gerava em torno de 1 terabyte de dados em e-mails, twitters, streaming de vídeo e pelo uso de internet móvel. Durante o último debate entre o democrata Barack Obama e o republicano Mitt Romney, quando mencionada a intenção do republicano de extinguir as transmissões públicas de televisão, devido aos autos custos para o governo, 10,3 milhões de mensagens no Twitter foram geradas. O aumento de seguidores de perfis favoráveis ou contrários a essa medida, que foram de igual tamanho, indica o quanto a disputa acirrada entre os dois candidatos. Episódios como este - última campanha eleitoral (2012) do presidente norte-americano Barak Obama -, mostram o poder de influência de organizações que podem analisar o grande volume de dados gerado pelo fenômeno big data sobre os indivíduos. Isso fortalece ainda mais a proposta de investigação desta pesquisa de doutorado de pesquisar se há uma tendência de usos do big data também no Brasil, principalmente nas próximas eleições. 39 Informações retiradas do blog disponível em <http://www.globalweb.com.br/2012/11/eleicoes-americanasevidenciam-tendencia-de-big-data/> 51 4.3.5.4.2 Big data eleitoral: conceito e primeiras iniciativas Com o aparecimento de novas tecnologias e com o advento das redes sociais e do reconhecimento de seu papel nas decisões dos eleitores, novas ferramentas de pesquisas surgem com o objetivo de desvendar o comportamento humano. As manifestações dos usuários nas redes sociais estão sendo frequentemente monitoradas com o objetivo de identificar e decifrar suas opiniões. As pesquisas tradicionais e o monitoramento das redes sociais combinados, além de técnicas estatísticas adequadas, formam o big data eleitoral, utilizado para melhor compreensão do comportamento do eleitor. O cientista político e professor Adriano Oliveira (2013) define big data eleitoral como “um conjunto de dados específicos para entender os fenômenos eleitorais” (OLIVEIRA, 2013). Oliveira assinala que são quatro as fontes de informação para entender uma conjuntura política: pesquisas, estratégias, comunicação e imagem. Sem elas nenhum candidato pode desenvolver uma boa campanha eleitoral. Ainda sobre isso, Oliveira (2013) diz que as tradicionais pesquisas qualitativas e quantitativas continuam a contribuir para a interpretação do comportamento das pessoas, em particular, das suas escolhas. Entretanto, com o advento das redes sociais e do reconhecimento de que emoções e sentimentos incentivam as decisões dos eleitores, novas ferramentas de pesquisas surgem com o objetivo de desvendar o comportamento humano e que de forma alguma devem ser desconsideradas nas estratégias de comunicação numa campanha eleitoral (OLIVEIRA, 2013). 4.3.5.4.2.1 Primeiras iniciativas Vislumbrando a era do big data, já apontada e discutida anteriormente nesse trabalho, iniciativas mercadológicas brasileiras têm buscado aprimorar as suas técnicas de coleta e análise de dados e informações para finalidades eleitorais. Exemplo disso é a E.life, considerada líder na América Latina em Inteligência de mercado e gestão de relacionamento nas redes sociais, e a Contexto Estratégica, empresa especialistas em estratégias políticas, que lançaram no início de novembro de 2013 em Brasília, o Big Data Eleitoral. Trata-se de uma base de dados crescente e contínua, com milhões de informações classificadas e analisadas por diferentes tipos de hábitos e padrões de comportamento de eleitores e políticos brasileiros nas redes sociais. Oliveira (2013) afirma que o Big Data Eleitoral é um instrumento de aproximação entre os políticos e a sociedade, pelo conceito de “tribos de interesse”. O serviço incorpora a 52 infraestrutura de big data e as ferramentas de business intelligence e que são aplicadas as análises de pesquisas quantitativas e qualitativas tradicionais para traçar estratégias políticas. A proposta do serviço Big Data Eleitoral é coletar, classificar e analisar os desejos da sociedade, o comportamento de eleitores e políticos e os movimentos sociais que tenham quaisquer relações com o tema. A metodologia utilizada pelo Big Data Eleitoral envolve indicadores como pesquisas eleitorais quantitativas, pesquisas qualitativas e dados agregados das redes sociais. Faz parte, também, do Big Data Eleitoral o monitoramento do Twitter de alguns políticos brasileiros com o objetivo de analisar suas principais citações, participações e interações nessa rede social. O monitoramento está sendo feito desde 11 de setembro de 2013 até as eleições de 2014. Entre os politicos monitorados pelo serviço estão a presidenta Dilma Rousseff (PT), o governador do Rio de Janeiro Sérgio Cabral Filho (PMDB), o profeito do Rio Eduardo Paes (PMDB), Aécio Neves (PSDB), Marina Silva (Rede PSB), Antônio Carlos Magualhães Neto (Dem), o governador do Paraná Beto Richa (PSDB), o prefeito de Curitiba Gustavo Fruet (PDT). 4.4 MÍDIA, POLÍTICA E MARKETING Antes de adentrar numa discussão em torno da informação, comunicação e marketing político, é necessário uma pequena introdução do tema mídia e política. Sabe-se que numa sociedade cada vez mais mediática e tecnológica, os usos que a política faz dos meios de comunicação disponíveis, se tornam primordiais em práticas políticas, principalmente em campanhas eleitorais. 4.4.1 Relação entre Mídia e Política Percebe-se que não é de hoje que a comunicação mantém um importante diálogo com a política. O surgimento das mídias eletrônicas – como o rádio, a televisão e o computador -, importantes meios de divulgação em massa de ideias das campanhas eleitorais, contribuem para que as informações atinjam maior número de pessoas. Influenciar nas decisões dos eleitores é o objetivo fundamental das estratégias de comunicação adotadas pelos assessores de comunicação e políticos nas campanhas eleitorais. Para Miguel (2002) é necessário o reconhecimento de que a mídia é um fator central da vida política contemporânea. “É ocioso alimentar a nostalgia de “tempos aureos” da política, quando imperava o verdadeiro debate de ideias sem a preocupação com a imagem ou a contaminação pelas técnicas da publicidade comercial” (MIGUEL, 2002, p. 158). 53 O desenvolvimento dos meios de comunicação, segundo Veiga e Godim (2001) possibilitaram que as pessoas dirigissem sua atenção para um único assunto. Esses meios, assim, detêm grande penetração social, pois submetem as pessoas a uma homogeneização de opiniões. É bastante visível que o desenvolvimento dos meios de comunicação de massa, particularmente o rádio e a televisão, imprimiu um novo ritmo aos processos sociais e políticos. Uma de suas maiores conseqüências foi a de aproximar o candidato à realidade cotidiana de seu eleitorado, minimizando o papel do partido nesta mediação. (VEIGA, GODIM, 2001. p.4). De acordo com Almeida (2002), o poder da mídia está na sua capacidade de irradiação política que torna o Estado e os políticos mais visíveis e mais vulneráveis às negociações necessárias para a obtenção desta visibilidade. Assim, hoje, existe praticamente um consenso entre os pesquisadores de que em todas as formas de regimes políticos, especialmente os democráticos, o papel da mídia na política tem sido de grande importância (ANTONIUTTI, 2004). Antoniutti (2004) observa também que de acordo com as pesquisas realizadas na área de comunicação política, as transformações tecnológicas e a realidade sóciopolítica têm levado à redefinição de estratégias informativas e comunicativas, buscando o máximo de eficácia de seu uso. A revista Comunicação & Política fundada em março de 1983 foi fundamental para dar visibilidade e destacar os estudos de comunicação política (RUBIM e AZEVEDO, 1998). Rubim e Azevedo (1998) em seus estudos apontam que, a temática mídia e política, no Brasil passou a ser discutida no início da transição democrática, envolvendo a mobilização da sociedade civil e a participação da mídia na campanha das diretas. Depois, os estudos voltamse ao processo eleitoral de 1989, marcado pelas campanhas políticas de Fernando Collor de Mello e Luís Inácio Lula da Silva, enfocando a análise dos discursos, a composição e o perfil do eleitorado brasileiro e suas predisposições quanto às instituições políticas, a participação da mídia na construção dos cenários de representação política, as estratégias de comunicação das campanhas eleitorais, com destaque para o horário eleitoral gratuito. Esses autores observam que sem dúvida, a eleição presidencial de 1989, realizada depois de 29 anos sem eleições diretas para presidente, aparece como acontecimento detonador de um boom imediato e posterior de reflexões sobre o enlace mídia e política. Pode-se afirmar que este acontecimento eleitoral, ao fazer emergir em toda sua potência estas novas conexões entre mídia e política, começa verdadeiramente a conformar um campo de estudos sobre comunicação e política no país, perpassado por olhares sintonizados com esta nova circunstância de sociabilidade acentuadamente midiatizada (RUBIM; AZEVEDO, 1998). 54 A partir de 2000, estudos de comunicação e política passaram a ter a internet como principal ambiente de discussões acadêmicas e científicas. Pesquisadores procuram compreender fenômenos como representação e participação política on-line, democracia digital, campanhas virtuais e influência da web no contato com a diferença politica, entre outros temas (GOMES et al., 2009; MAIA, GOMES, MARQUES, 2011). Campanhas políticas contemporâneas têm apostado na internet como meio alternativo para veiculação eleitoral e que são próprios do ambiente virtual (GOMES et al., 2009). Porém numa pesquisa inicial, nenhum estudo foi encontrado, explorando mesmo na Ciência Política ou Comunicação, o tema da pesquisa proposta neste trabalho. Isso só reforça a importância da discussão em torno da apropriação do big data em campanhas eleitorais. Para o entusiasta da política na rede, Canavilhas (2009) é graças a Internet que a política parece ter encontrado uma forma de retomar o contato direto com o eleitorado, evitando assim intermediários, como por exemplo, a imprensa. O autor observa que os políticos americanos desde 2004 apostam nas potencialidades comunicativas e informacionais da Internet. A blogosfera foi um fenômeno em foco, com Howard Dean, candidato à nomeação democrata, na época ele foi o primeiro a criar um blogue. Esta aposta na Internet permitiu-lhe abrir vias diretas no contato com o eleitorado e arrecadar 15 milhões de dólares para apoio à campanha. Da mesma forma, na corrida à Casa Branca, Bush e Kerry também apostaram no meio, criando diários de campanha na blogosfera. Mas foi a partir da campanha de Barack Obama em 2008, que a Internet passou a ser vista como um novo elemento importante na manobra de um candidato. Obama utilizou quase todas as aplicações online disponíveis no momento. Além disso, criou espaços nas redes sociais, como, por exemplo, Obama Everywhere e só no Facebook chegou aos 320 mil utilizadores. Obama arrecadou ainda 28 milhões de dólares de apoio, o que lhe permitiu manter alguma distância em relação aos adversários. Desde a experiência do presidente norte-americano Barack Obama, campanhas políticas têm apostado na Internet como meio alternativo para a aplicação do marketing político e eleitoral. 4.4.2 Informação e Marketing na Política O marketing é uma das mais antigas estratégias utilizadas no mundo, para divulgação e interesse de vendas e produtos, ou do que se pretende realizar. Mas, foi somente no século XX é que se tornou sistematizado, em razão da grande concorrência enfrentada pelas empresas. Nessa época os empreendedores passaram a entender que, para criar novos mercados, seria necessário desenvolver novos produtos e serviços, oferecendo maior 55 variedade, se opondo às técnicas da época de simplesmente abastecer o mercado com o que já era produzido. Após a segunda metade do século XX com a obra “Prática de Administração de Empresas”, de autoria de Peter Drucker, o marketing passou a ser visto como filosofia, vindo a ser estudado e aplicado por empresários, executivos, consultores e acadêmicos. Marketing pode ser definido como uma área do conhecimento que “engloba todas as atividades concernentes às relações de troca, orientadas para a satisfação dos desejos e necessidades dos consumidores visando alcançar determinados objetivos de empresas ou indivíduos e considerando sempre o ambiente de atuação e o impacto que essas relações causam no bem estar da sociedade” (LAS CASAS 2006 p.10). O conceito de Marketing evolui de acordo com as mudanças e necessidades da sociedade. Um entendimento bem aceito, pelos principais autores é aquele publicado pela American Marketing Association, que esporadicamente revê a sua definição. A última revisão feita pelo organismo foi em 2007, quando definiu marketing da seguinte forma: “Marketing é a atividade, conjunto de instituições e processos para criar, comunicar, distribuir e efetuar a troca de ofertas que tenham valor para consumidores, clientes, parceiros e a sociedade como um todo” (tradução livre do autor). Até então, a AMA utilizava a definição que afirmava que “Marketing é uma função organizacional e um conjunto de processos para criar, comunicar e distribuir valor aos clientes e para administrar o relacionamento com clientes de forma que beneficie a organização e os seus Stakeholders” (AMA 2008) As contínuas mudanças ambientais influenciam a maneira de exercitar a política, principalmente em tempos de mídias participativas, como as redes sociais digitais. Assim, entendemos que a tarefa do marketing no segmento da política torna-se extremamente complexa, arriscada e cada vez mais necessária para reduzir os riscos do processo político. A informação sempre foi o condutor de todos os processos eleitorais, principalmente na aplicação de estratégias de comunicação e marketing político. Ao lançar a discussão sobre a necessidade de se buscar informações para se trabalhar o marketing político, busca-se algumas considerações e aportes no marketing de relacionamento, considerado por muitos especialistas como o marketing do futuro. A constatação de que a informação é condição imprescindível à prática do marketing é consistente. Amaral (1998) contribui para a ratificação dessa constatação, ao afirmar que a informação é um fator imprescindível para impulsionar o desenvolvimento da sociedade constituindo-se em um insumo de fundamental importância de geração de conhecimento que, por sua vez, possibilitará, de modo eficiente, a satisfação das diversas demandas da população (AMARAL, 1998, p 17) 56 Para entender a necessidade da informação na construção de estratégias de marketing em vários segmentos, apresenta-se uma pequena discussão histórica e evolutiva do marketing. Para Dantas (2006) até 1925, o que prevalecia no ambiente de negócios era uma orientação para a produção, cuja concentração era na eficiência de fabricação. Entre 1925 e 1950, a orientação para a produção deu lugar à orientação para vendas, em que a concentração era sobre a venda de produtos. Entre 1950 e 1990, a orientação prevalecente foi a orientação para marketing, cuja concentração era sobre as necessidades e desejos dos clientes. Nessas três orientações, o que se buscava era, essencialmente, a conquista de novos clientes para as organizações. Até que a pesquisa realizada pelo TARP mostrou que manter clientes era mais barato do que conquistar novos. Essa pesquisa parece ter sido uma espécie de “divisor de águas” no marketing, já que gerou uma quebra de paradigma na postura adotada até então. Dantas (2006) afirma que a conquista de novos clientes, que marcava tão intensamente a cultura de marketing até 1990, deu lugar à retenção de clientes, em que a segmentação baseada no conhecimento do cliente passou a ser de singular importância. A partir dessa nova postura, novo valor passou a ser atribuído aos sistemas de informação de marketing. As organizações passaram a perceber que a obtenção de informação de qualidade sobre o cliente podia gerar diferencial competitivo. Este novo ponto de vista deu origem ao que se convencionou chamar de marketing de relacionamento que além de ser aplicado no âmbito empresarial também ganhou destaques na política, principalmente em períodos eleitorais. Regis McKenna foi o primeiro autor a divulgar o marketing de relacionamento ao mundo corporativo, como uma forma de atender os relacionamentos necessários entre a empresa e seus clientes. Na obra de 1993 definiu Marketing de Relacionamento ou pós-marketing (como ousou chamar) ” como a construção e sustentação da infra-estrutura dos relacionamentos com os clientes. “Surgido na década de 90, o Marketing de relacionamento inverteu o papel das empresas no que concerne ao atendimento de seus clientes. Se até então o Marketing tentava atender os desejos dos consumidores, hoje em dia o Marketing tenta ouvir as suas demandas antes de atendê-las. MCkenna afirma que a mudança no Marketing após os estudos de relacionamento com os clientes foram “impulsionados pelo enorme poder e pela disseminação onipresente da tecnologia” (MCKENNA 1993). O marketing de relacionamento deve ser utilizado com o objetivo de conquistar e fidelizar os clientes, seja aqueles que compram um determinado serviço, produto ou até mesmo elegem um político. Esse tipo de marketing inclui desde a reunião com eleitores até a análise de dados sobre eleitor individual, o que facilita uma comunicação recíproca contínua, 57 preservando desse modo os eleitores e enfatizando a sua fidelidade. Os profissionais do marketing de relacionamento devem ser abertos para transferir informações e construir capacidades individuais, grupais e organizacionais. Marketing Político e Marketing Eleitoral podem unir-se com o Marketing de Relacionamento, construindo estratégias focalizadas num público-alvo, tornando-o fiel até a hora de ir para as urnas votar (ANHAI, 2007). 4.4.3 Marketing Político e Marketing Eleitoral: evolução e diferenças A migração de conceitos e práticas do universo empresarial para a política tem-se tornado, no mundo todo, a tendência predominante nas últimas décadas. Kotler (1975) considera que o marketing político é comparável ao marketing comercial seja através de seus conceitos e ferramentas, seja através dos modelos de comportamento do consumidor. O marketing político engloba ferramentas de publicidade, jornalísticas, técnicas teatrais, musicais, sensoriais, humorísticas e de psicologia. Além disso, são usadas pesquisas, análises estatísticas e qualitativas ao máximo. Tudo é planejado e unido a um profundo entendimento do ser humano e seus anseios. O marketing político surgiu em 1952 e pode ser definido como um conjunto de técnicas e procedimentos cujo objetivo é avaliar aspectos psicológicos do eleitorado, visando embasar estratégias para aumentar a aceitação do candidato junto à população. Basicamente centra-se: i) na imagem dos candidatos, dos partidos políticos e dos adversários, ii) nos aspectos psicológicos dos eleitores e, por fim, iii) no acompanhamento de todo o processo eleitoral, intervindo de modo ativo conforme os objetivos pretendidos (FIGUEIREDO, 2000). Na versão oficial, a primeira vez que um candidato utilizou uma grande empresa de comunicação numa campanha presidencial foi em 1952, nos EUA com o general Dwight Eisenhower (1890-1969). O general contratou a agência publicitária BBDO para auxiliá-lo na campanha presidencial americana daquele ano. A principal função da empresa de comunicação era adaptar a linguagem de Eisenhower a mídia eletrônica – rádio e televisão -, afinal os meios ganhavam uma importância cada vez maior no jogo democrático. Também na campanha de Eisenhower foi feita a primeira pesquisa de boca de urna, processada por um computador Univac I, do tamanho de um apartamento de tamanho médio e divulgada 45 minutos depois de encerrada a votação, dando a vitória ao general, fazendo ingressar o marketing político. No Brasil, Prudente de Morais em 1884, terceiro presidente do Brasil, foi quem inaugurou o conceito de comunicação e marketing político no Brasil. Uma das suas ideias 58 iniciais foi usar jornais para alcançar a população e mostrar aos eleitores seu trabalho já desenvolvido como “presidente de São Paulo” - governador da época -. Morais elaborou cartões de boas festas de fim de ano e distribuiu para os eleitores. Além disso, também usava o telégrafo e uma lista de eleitores para se aproximar do eleitorado. Suas ações de comunicação eram baseadas no seu carisma para atrair eleitores. Além disso, visitava várias cidades a cavalo. Isso lhe rendeu uma imagem de político preocupado com o país e com as cidades além das capitais. Os EUA, berço da difusão dos meios de comunicação e propaganda eleitoral, na década de 60, teve Kennedy como um presidente da era da televisão, que venceu o seu oponente Richard Nixon num debate. Já no Brasil Getúlio Vargas, por sua vez, foi o primeiro ex-presidente a ter um profissional de marketing, o jornalista Lourival Fontes, que foi a Itália fazer um estágio para aprender com os assessores do ditador fascista, Benito Mussolini, como fazer campanhas eleitorais e programas de comunicação ideológica, que redundaram depois na criação do Departamento de Imprensa e Propaganda (DIP) e do programa de rádio “A hora do Brasil”. Jucelino Kubitschek40, o JK como era conhecido na época, foi outro político que usou estratégias do marketing político. As suas campanhas eleitorais tiveram como premissa a máxima “para ser político, é preciso tornar-se conhecido”. JK construiu com a ajuda do marketing uma imagem de trabalhador incansável e modernizador (QUEIROZ, TAVARES, 2007). Mas, foi na campanha eleitoral de 1989 que o marketing político brasileiro ganhou notoriedade até mesmo nos estudos acadêmicos e científicos. Esse ano foi muito importante para a história política do Brasil. Depois de 21 anos de ditadura militar e cinco anos de mandato do Presidente Jose Sarney, eleito pelo Colégio Eleitoral, o país passa a ter a sua primeira eleição presidencial desde 1962. A disputa se deu em torno de Fernando Collor de Mello e o petista Luís Inácio Lula da Silva. A campanha de Fernando Collor foi a que mais chamou atenção dos pesquisadores porque contava com um importante instrumento de diferenciação que era o seu programa de televisão. Pela primeira vez na historia de uma campanha política no Brasil um candidato explorava de forma inteligente a tecnologia e efeitos especiais disponíveis na preparação dos programas de televisão. A respeito dessa campanha Figueiredo e Figueiredo Jr. (1990) argumentam que Collor escolheu um caminho totalmente novo, usando, pela primeira vez, a televisão de forma competente em uma 40 Durante todo o seu mandato como presidente da República (1956-1961), o Brasil viveu um período de notável desenvolvimento econômico e relativa estabilidade política. Com um estilo de governo inovador na política brasileira, Juscelino construiu em torno de si uma aura de simpatia e confiança entre os brasileiros (WIKIPÉDIA, 2013). 59 campanha presidencial. Enquanto os grandes partidos ainda estavam discutindo quem seriam os seus candidatos, Collor já estava enviando a sua mensagem aos brasileiros. O fenômeno Collor representou um grande exemplo de sucesso do uso de marketing político e inteligência de marketing. Para os especialistas, o marketing político no Brasil passou a existir no Brasil graças às práticas e inovações introduzidas pela campanha presidencial de 1989 do candidato Collor de Mello. Nos dias atuais a era de democracia, o papel da mídia na política torna-se importante a cada dia, pois a sociedade experimenta um novo mundo de informações e inovações que propiciam o uso das ferramentas de comunicação. Todos esses políticos sabiam da importância da mídia, e sempre procuravam alguma forma de estar perto do povo, muitas vezes até usaram o marketing como aliado das campanhas eleitorais. É válido dizer que assim como o norte-americano Barack Obama em 2008 e 2012 inaugurou novas formas de se fazer campanhas políticas na atualidade com o uso intensivo das tecnologias (redes sociais digitais) e dos instrumentos do big data, Collor de Mello em 1989 representava para Brasil uma grande inovação em campanhas eleitorais mediáticas. Esses fatos representam maneiras diferenciadas de figuras públicas comunicarem ao grande público suas mensagens. Elas o faziam da forma que lhes era acessível e, assim, construíram suas imagens e se diferenciaram da maioria da população ao ostentar publicamente sua capacidade de poder, força e liderança. Nos dias de hoje estudiosos como Figueiredo (1994) e Kotler (1998) tomam como ponto de partida do marketing político as necessidades e os desejos da população, apresentadas pelo político, de forma que poderão ser melhores divulgadas por um profissional de comunicação ou marketing. E para entender isso, o marketing político conta com diversos recursos de monitoramento da opinião pública tais como pesquisas survey e qualitativas, que informam os políticos sobre necessidades, expectativas e visões dos eleitores (RIBEIRO, 2002; KOTLER, 1999) Ele possibilita, aos candidatos, adaptar, rever, modificar ou reforçar suas estratégias de apresentação, seus discursos e suas práticas, na cena pública. Para Figueiredo: O marketing político é um conjunto de técnicas e procedimentos cujo objetivo é avaliar, através de pesquisas qualitativas e quantitativas, os humores do eleitorado, para, a partir daí, encontrar o melhor caminho para que o candidato atinja a maior votação possível (FIGUEIREDO, 2000, p.14). A partir do conjunto de informações disponíveis, o marketing manipula os dados e os políticos se esforçam, através do marketing político, para estabelecer um elo simbólico com o 60 eleitorado, recorrendo a saberes, normas, valores e universos de referência supostamente partilhados. Uma questão central, portanto, nessa discussão, é entender como as práticas de marketing estão sendo desenvolvidas na política, principalmente a partir do uso que se faz do big data. Assim como nas empresas, tais técnicas podem buscar objetivos de longo prazo através da construção de relacionamentos, satisfação e, consequentemente, maior interesse e confiança por parte do eleitor/cidadão. Cabe aqui nessa discussão estabelecer relações e diferenças entre os tipos de marketing empregados na política. Gomes (2001) relata que o emprego de formas publicitárias na comunicação política é justificado pela introdução dos chamados “marketing político” e “marketing eleitoral”. No Brasil, os dois termos vêm sendo usados indiscriminadamente, porém, há diferenças semânticas entre eles: quando falamos em marketing político, estamos tratando de uma estratégia permanente de aproximação do partido e do candidato com o cidadão em geral. O marketing eleitoral trata de uma estratégia voltada para o eleitor, com o objetivo de fazer o partido ou candidato vencer uma determinada eleição. A união das duas estratégias deve ser entendida como uma técnica de reflexão dirigida a procurar, criar e desenvolver as satisfações necessárias que se complementam a curto, médio e longo prazo. O autor salienta ainda, por exemplo, que o conceito de marketing político é mal empregado. Este se refere às ações estratégicas de marketing de longo prazo por parte dos partidos e políticos. Na prática, o que ocorre geralmente é que as ações de marketing restringem-se ao processo exclusivamente eleitoral e perduram apenas até o momento do voto do eleitor. Assim, o marketing eleitoral se aplica integralmente à eleição, a aplicação do marketing às técnicas eleitorais no período eleitoral, a imagem que o candidato irá passar a seus eleitores para a consecução dos votos. É somente um instrumento de comunicação em campanhas. Abrange todas as técnicas de comunicação disponíveis no mercado. É uma estratégia mais global, que inclui – além da comunicação – a pesquisa, o planejamento estratégico, o uso de especialistas e a articulação de um conjunto de decisões e ações necessárias para a atuação política de modo geral, além da eleitoral estrito senso (RICHERS, 2007). O objetivo do marketing eleitoral consiste em implantar técnicas de marketing político e comunicação social integrados, de forma a angariar a aprovação e simpatia da sociedade, construindo uma imagem do candidato que seja sólida e consiga transmitir confiabilidade e segurança à população elevando o seu conceito em nível de opinião pública. 61 O marketing eleitoral preocupa-se, portanto, com a formação da imagem em curto prazo. O fato crucial é o tempo. Assim, os candidatos precisam desenvolver um trabalho contínuo e sistemático de formação de imagem, objetivando aumentar seu poder de influência sobre o eleitor na decisão de voto. O tempo que é destinado a essa atividade não ultrapassa os limites que envolvem os pleitos eleitorais, acabando, portanto, no dia da votação e não passando de um processo de comunicação áudio visual que busca ofertar a imagem de um candidato em busca do poder. Pode-se afirmar que o marketing eleitoral é um serviço de venda enquanto marketing político é um serviço de pós-venda. Pacheco (1994) afirma que o marketing eleitoral descende de Maquiavel, pois parte da aceitação do "Homem como ele é", e não de "como gostaríamos que ele fosse". “De essência realista e fenomenológica, o marketing "inveja" as ciências exatas, às quais se inclina. Daí, seu apreço à quantificação e ao uso da pesquisa científica como seu instrumento principal: "Marketing é Pesquisa”” (PACHECO, 1994, p.147). 4.5 COMUNICAÇÃO POLÍTICA E CAMPANHAS ELEITORAIS Neste item busca-se uma discussão inicial sobre o que se entende por comunicação política e campanhas eleitorais, bem como o papel das pesquisas na política, levando-se em considerações as informações de eleitores presentes em diversos ambientes, principalmente nas redes sociais digitais. O objetivo deste item, durante a investigação deste trabalho, é apresentar as mudanças e transformações nas campanhas eleitorais a partir do uso do big data. 4.5.1 Comunicação Política (Em desenvolvimento) A comunicação política moderna associada às campanhas eleitorais ocorre num contexto de forte incorporação de saber, com aplicação dos esforços comunicativos em torno das lideranças, e utilização significativa de recursos financeiros em terrenos dominados pelos meios de comunicação de massas com destaque para a televisão e particularmente a internet. A comunicação política é uma área vasta em expansão quer sob o ponto de vista da reflexão teórica estudada por diversos pesquisadores, quer sob o ponto de vista da sua prática em numerosos domínios da vida cívica. Hoje em dia é importante destacar que a comunicação política engloba o estudo do papel da comunicação na vida política em sentido amplo, integrando tanto os meios, como as pesquisas. O marketing político e a publicidade, com um interesse particular nos períodos eleitorais. Afinal, a comunicação política designa qualquer comunicação que tenha por objeto 62 a política. Esta definição demasiada extensiva tem, contudo, a vantagem de ter em conta duas grandes características da política contemporânea: o alargamento da esfera política e o lugar crescente concedido à comunicação, com o peso dos meios e da opinião pública através das pesquisas. Assim, o conceito de comunicação política se torna apropriado para uma investigação na área da Ciência da Informação, que consiste numa ciência interdisciplinar, que busca em outras áreas metodologias e conceitos para suas investigações. O que se entende por comunicação política? Canavilhas (2007) observa que a comunicação política tem evoluído ao longo dos tempos. Do estudo das relações entre governos e eleitorado, o seu objeto progrediu para um campo mais vasto que inclui tudo o que está relacionado com o papel da comunicação na vida política. 4.5.2 Campanhas Eleitorais (Em desenvolvimento) Norris (2000) diz que as campanhas eleitorais constituem um dos momentos mais intensos do processo de competição política. O seu formato moderno associa-se às transformações da democracia e dos partidos, bem como ao desenvolvimento das técnicas e tecnologias de comunicação, instrumentos que obedecem a uma gestão profissionalizada, largamente dominada por consultores externos às máquinas partidárias. A autora destaca ainda que o modo de organização das campanhas eleitorais não deixou de acompanhar as mudanças operadas no setor dos meios de comunicação de massas. A reconfiguração da imprensa, o forte desenvolvimento da indústria televisiva e a contribuição de novos instrumentos de comunicação interpessoal, pela via da Internet e de outros meios, consolidam a sociedade da informação por onde se traçam, também, as estratégias de comunicação política e eleitoral (NORRIS, 2000). Ao se referir sobre as campanhas eleitorais em sua pesquisa Massuchin (2013) observa que: O processo denominado como modernização das campanhas diz respeito há uma série de práticas tradicionais que foram sendo substituídas por outras ‘modernas’ e que marcam o final do século XX e início do século XXI, sendo neste contexto de mudança e transformação que emerge a internet como uma nova ferramenta midiática apropriada pelos partidos e candidatos para colocar em prática estratégias de campanha. Associado a isso também está a menor partidarização dos eleitores e o enfraquecimento das bases ideológicas. Dessa forma, emerge também um novo tipo de partido juntamente com novos meios de comunicação e de campanhas mais elaboradas tecnicamente (MASSUCHIN, 2013, p. 04) No que se refere às campanhas eleitorais é interessante contextualizar neste trabalho como elas vem se evoluindo ao longo do tempo para posteriormente entender como elas se configuram hoje diante das novas tecnologias da informação e no contexto do big data. Para 63 contextualizar esse item usam-se as considerações de vários autores da Ciência Política, que se dedicam a estudar a comunicação e o marketing político (NORRIS, 2000; ALBUQUERQUE, 1999; MANCINI, SWANSON, 1995) Norris (2000) em seu trabalho subdivide as campanhas ocidentais em três grandes períodos que marcam seu desenvolvimento. O primeiro momento é definido como prémoderno e marca as campanhas realizadas até 1950. Esse momento se distingue bastante das fases posteriores, pois aqui ainda há formas mais diretas de comunicação entre eleitores e candidatos e uma forte tendência de identificação e adesão aos partidos. Já em uma segunda fase que marca a segunda metade do século XX, o auge das campanhas é a televisão que substitui a campanha face a face e se transforma no cenário de competição eleitoral. Este é o marco da profissionalização da campanha abordado por Mancini e Swanson (1995) onde há pessoas específicas para produzir as campanhas eleitorais. Neste momento também já há uma menor identificação dos partidos. No caso brasileiro, segundo Albuquerque (1999) essa fase só ganha destaque, tratando-se de regimes democráticos e campanhas eleitorais, no final da década de 1980 com o retorno da democracia. Norris (2000) caracteriza uma terceira fase das campanhas chamada de pós-modernas, pois se trata de uma total profissionalização de todas as atividades da campanha. Além disso, há segmentação das mensagens e estudos mais aprofundados, baseando-se nas pesquisas de opinião pública, para identificar as características do eleitorado e como atingi-lo por meio das estratégias usadas pelos profissionais. É neste contexto da terceira fase apresentada por Norris (2000) em que há a citação dos novos meios como ferramenta de campanha. Segundo a autora, as novas tecnologias passam a ser usadas no marketing eleitoral, pois teriam determinadas características relevantes para contatar o eleitor (Norris, 2000). Pretende-se neste trabalho durante o desenvolvimento da pesquisa de tese, a partir das fases apresentadas pelos autores acima citados, se aprofundar mais na caracterização das campanhas eleitorais, principalmente a partir da adoção da internet como um novo canal de comunicação e informação político. Esse item terá como objetivo também caracterizar as campanhas eleitorais norte-americanas, que também é foco da investigação no uso do big data. 4.5.3 Pesquisa e Política (em desenvolvimento) As pesquisas procuram mensurar o conhecimento da população sobre determinados assuntos como educação, saúde, segurança, economia, meio ambiente, entre outros. 64 As pesquisas de acompanhamento e desempenho administrativo levantam os principais problemas da população, avaliam o desempenho dos governantes, aferem a imagem da administração, o grau de conhecimento dos projetos e das obras realizadas e o grau de satisfação com os serviços públicos. Já as pesquisas eleitorais, por sua vez, procuram detectar as intenções de voto do eleitor a cada momento, aferindo o potencial de adesão ou rejeição a cada candidato. Os fatores de maior relevância em uma pesquisa são: a imagem do candidato, sua trajetória política, seu carisma e empatia com o eleitor, seu programa de governo, sua principal meta de governo, sua profissão, seu partido político, seus apoiadores, e o grupo social em que está inserido ou com o qual se identifica. Casartelli (2005) diz que as pesquisas são dotadas de critérios metodológicos e são interpretadas para se observar o que é fundamental, para aprimorar a disputa entre os candidatos ou avaliar tendências que possam trazer modificações de cenário. A análise deve se basear no dinamismo e na falta de unidade da sociedade, com seus diversos grupos, que pensam de forma diferente. A utilização de métodos qualitativos na Ciência Política e no Marketing Político cresceu a partir dos últimos anos da década de 80, de acordo com Veiga e Godim (2001), especificamente através da técnica dos grupos focais, completando abordagens quantitativas habitualmente utilizadas em pesquisas de opinião pública. Os objetivos das pesquisas qualitativas, de acordo com Veiga e Godim (2001), são mapear demandas e frustrações dos eleitores, conhecer sua percepção do quadro político e as expectativas dos eleitores. Além disso, deve-se avaliar a imagem dos candidatos e seu programa de governo e as razões para votar neles. De acordo com Almeida (2001), o conjunto de informações levantadas numa pesquisa de opinião permite ao analista compreender o cenário de representação da política. Assim, esse cenário é identificado a partir de instrumentos que investiguem as opiniões do público, de modo quantitativo e qualitativo. Esse cenário de disputa da representação política está em constante mutação. A leitura dessas pesquisas não pode ser feita de forma isolada, mas de modo sequencial no contexto político e ideológico, isto é, as alterações sociais, eventos, acontecimentos significativos irão influenciar diretamente a opinião do público e alterar o cenário naquele momento e dentro daquele contexto. Na visão de Aldé (2001), a opinião de um povo sempre foi estratégica no campo da política, mesmo em regimes autoritários. Maquiavel aconselhava ao príncipe que conhecesse os costumes e opiniões do povo, pois consenso sempre foi vantajoso para o exercício do 65 poder. Manter favorável a “opinião popular”, torna a política menos onerosa, socialmente e financeiramente. Os cidadãos contracenam com quadros de referência que alimentam as explicações que eles constroem para a política. Cada um busca se informar sobre a política de acordo com a satisfação que obtém do que considera informação suficiente. Nesse contexto, para Aldé (2001), o cidadão comum é receptor da comunicação de massa e usuário de um sistema diferenciado de informação e conhecimento político. A população que elege se distribui entre ávidos, assíduos, consumidores de escândalos, frustrados e desinformados. A pesquisa qualitativa usada no contexto do marketing político objetiva mostrar as relações entre as atitudes políticas e os tipos de recepção de comunicação dos indivíduos, com implicações importantes para o que se pode dizer acerca das possibilidades e expectativas políticas deste cidadão e sua decisão de voto (ALDÉ, 2001). Segundo Aldé (2001) a mídia se torna referência para todos os indivíduos, pela sua homogeneidade discursiva ao repetir os principais enquadramentos, e pela acessibilidade praticamente universal, recente e frequente dos meios de massa. Considerando todas essas percepções que se busca conhecer, ao longo do desenvolvimento desta pesquisa, como vem sendo usado as redes sociais digitais pelos políticos, como ambientes de comunicação, interação e também de pesquisas para finalidades de estratégias eleitorais. Redes sociais remetem a um conjunto de pessoas (ou organizações) conectadas por relacionamentos sociais, estimulados pela amizade, por relações de trabalho ou compartilhamento de informações e, por meio dessas vinculações, vão construindo e reconstruindo a estrutura social (MARTELLETO, 2001). Redes sociais digitais podem ser definidas também como diálogos interativos entre diferentes pessoas, realizados com o apoio de tecnologias web e mobile, capazes de gerar mudanças pervasivas na comunicação, entre organizações, comunidades e indivíduos (WIKIPEDIA, 2013). O estudo das redes traz a tona um dado da realidade social contemporânea de que as pessoas, dotadas de recursos e capacidades propositivas, organizam suas ações nos próprios espaços políticos em função de socializações e mobilizações suscitadas pelo próprio desenvolvimento das redes (MARTELETO, 2001). De acordo com Recuero (2009) as redes sociais digitais possuem elementos (atores, conexões e relações) característicos, que servem de base para que a rede seja percebida e as informações a respeito dela sejam apreendidas. 66 Vale aqui destacar, que a análise de redes sociais digitais admite como pressupostos que as relações sociais (ou laços sociais) constituídas por indivíduos (eleitores), organizações, atores sociais e políticos, instituições, e entre eles, formam por excelência o elemento de estruturação da vida social. Para analisar redes sociais usa-se uma ferramenta que permite que se conheça as interações e classes de indivíduos, partindo principalmente mais de dados qualitativos, do que quantitativos com o apoio do software UCINET41. 41 UCINET é um software que foi desenvolvido por Lin Freeman, Everett Martin e Steve Borgatti para analisar relações e informações nas redes sociais digitais. 67 5 ESTRUTURA PRELIMINAR DA TESE O presente trabalho está estruturado da seguinte forma, que poderão ser ampliados de acordo com o desenvolvimento da pesquisa: 1. Explosão Informacional – que vai tratar dos conceitos, causas e consequências do aparecimento e aumento das informações, principalmente no ambiente da internet. Discutimos o fenômeno da dataficação da informação na atual sociedade, com destaque para a coleta e análise de dados em mídias sociais, bem como buscará apresentar uma discussão em torno da ética da informação, no que se refere ao uso das informações dos usuários das mídias sociais digitais, para fins de estratégias informacionais e comunicacionais em campanhas eleitorais. 2. Big data – neste item serão apresentados os conceitos, tendências, características e evolução do tema. Além disso, serão apresentadas as experiências dos usos do big data em diversos segmentos da sociedade. 3. Informação, Comunicação e Marketing Político – neste item terá por finalidade mostrar discussões em torno dos teóricos da Ciência da Informação, da Comunicação e também da Ciência Política. Serão apresentados conceitos e particulares a respeito da informação, da comunicação política, do marketing político e eleitoral e das campanhas eleitorais. Ainda serão discutidos os tipos de pesquisas que são usadas em períodos eleitorais que ajudam na construção de estratégias de comunicação e marketing político e eleitoral, com enfoque para as redes sociais digitais. 4. Usos do big data em campanhas eleitorais estrangeiras e brasileiras – é a pesquisa de campo em torno da aplicação do big data no âmbito da política eleitoral. Serão tomadas como observações as campanhas eleitorais americanas de 2013 e as brasileiras, especificamente a que acontecerá em 2014. 5. Considerações finais a respeito da investigação e da pesquisa de tese. 68 6 CRONOGRAMA DE TRABALHO As atividades, referente a este trabalho de doutorado, estão distribuídas como demonstra a Tabela 2. Cronograma de Atividades do Trabalho Tabela 2 Atividades J F M 1. Revisão do projeto com as X considerações da banca A M J J A S O N D X X J F M de qualificação 2.Pesquisas bibliográficas X X X X X X X X X X 3 .Elaboração de capítulos X X X X X X X X X X 4. Coleta de informações e X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X dados da pesquisa 5. Entrevistas com profissionais e políticos envolvidos em campanhas eleitorais nos EUA e no Brasil. 6. Escrita da Tese com a partir das pesquisa de informações entrevistas e campo. 7.Observações ao processo de campanha eleitoral brasileira de 2014. Enfoque nas estratégias comunicacionais e de marketing em ambientes da Internet. 8. Considerações finais da X X pesquisa 9. Defesa da Tese 10. Escrita e publicação de artigos X X X X X X X X X X X X X X X X 69 7 REFERÊNCIAS ALBUQUERQUE, Afonso. (1999). “Aqui você vê a verdade na tevê”: A propaganda política na televisão. Niterói: MCII. ALDÉ, A. A construção da política: cidadão comum, mídia e atitude política. Rio de Janeiro, 2001. 234 p. (Tese de Doutorado, Ciência Política). Instituto Universitário de Pesquisas do Rio de Janeiro – Iuperj. ALMEIDA, Jorge. Marketing político, hegemonia e contra-hegemonia. São Paulo, Editora Fundação Perseu Abramo e Xamã Editora, 2002. ALMEIDA, Jorge. Pesquisas de opinião e cenário de representação da política, 2001. Disponível em: <http://www.unb.br/fac/comunicacaoepolitica/Jorge2001.pdf > Acessado em: 26 de maio de 2008. AMA – American Marketing Association - The American Marketing Association Releases New Definition for Marketing – Press Release - Chicago – 14 de Janeiro de 2008- disponível em http://www.marketingpower.com/AboutAMA/Documents/American%20Marketing%20Association% 20Releases%20New%20Definition%20for%20Marketing.pdf acessado em 21 de Fevereiro de 2010. AMARAL, S.A. do. Marketing: abordagem em unidades de informação. Brasília: Thesaurus, 1998. ANÁLISE em larga escala de dados não convencionais e diferentes. 2013. Disponível em: <http://www-03.ibm.com/software/products/br/pt/infobigibasiedit/>. Acesso em: 06 mai. 2013. ANHAIA, Valéria dos Santos. O Marketing de Relacionamento na Campanha Eleitoral de Yeda Crusius. Santa Maria – RS, 2007. Disponível em: http://lapecpp.files.wordpress.com/2011/05/valc3a9ria-anhaia.pdf ANTONIUTTI, Cleide Luciane. De operário a presidente. A imagem política de Lula no Horário Eleitoral da televisão nas campanhas presidências de 1989 e 2002. Dissertação de Mestrado em Sociologia Política, UFPR, Curitiba – Pr, 2004. Disponível em: http://www.educadores.diaadia.pr.gov.br/arquivos/File/2010/artigos_teses/SOCIOLOGIA/clei de.PDF. Acessado em set de 2013. ARAUJO, Eliany Alvarenga de. A construção social da informação: dinâmicas e contextos. Data Grama Zero – Revista de Ciência da Informação, v. 2, n. 5, out. 2001. Disponível em: < http://dgz.org.br/dez08/F_I_aut.htm >. Acesso em: set 2013. ARAUJO, V.M.R.H. de. Informação: instrumento de dominação e de submissão. Ciência da Informação, v. 20, n. 1, 1991 70 ________. Sistemas de Recuperação da Informação: Nova abordagem teórico conceitual. Rio de Janeiro: Universidade Federal do Rio de Janeiro, 1994. Tese (Doutorado em Comunicação e Cultura, Escola de Comunicação). ARAÚJO, V.M.R.H. de; FREIRE, I.M. A rede Internet como canal de comunicação, na perspectiva da Ciência da Informação. Transinformação, v.8, n.2, 1996 ÁREA do Brasil. 2013. Disponível em: <http://www.brasilescola.com/brasil/area-brasil.htm>. Acesso em: 04 jun. 2013. ARRIGONI, Rodrigo (2013). Big data, a ciência do grande. Disponível em: http://convergecom.com.br/tiinside/21/06/2013/big-data-a-ciencia-do-grande/#.Uoy0-sRJ6s1 BARBOSA, D. Information Extraction for Social Media Analysis. 2013. Disponível em: <http://emcbigdataschool.nce.ufrj.br/images/downloads/Denilson_Barbosa_InfoExtraction.pd f>. Acesso em: 16 mai. 2013. BORKO, H. Information science: what is it? American Documentation, Jan. 1968. BARRETO, Aldo de Albuquerque. A questão da informação. São Paulo em perspectiva, São Paulo, v. 8, n. 4, p. 3-8, 1994. ____________________________. Mudança estrutural no fluxo do conhecimento: a comunicação eletrônica. Ciência da Informação, v. 27, n. 2, p. 122-127, maio/ago. 1998. Disponível em: <http://dx.doi.org/10.1590/S0100-19651998000200003> ____________________________. A oferta e a demanda da informação: condições técnicas, econômicas e políticas. Ciência da Informação, 1999b, vol.28, n.2, p.168-168. Disponível em: http://www.scielo.br/scielo.php?script=sci_arttext&pid=S010019651999000200009&lng=en&nrm=iso. Acesso em: 18out.2013. BIG DATA. 2013. Disponível em: <http://www.gartner.com/it-glossary/big-data/>. Acesso em: 14 abr. 2013. CALVO, Tereza Cristina Mate. Distinção entre informação e Conhecimento. Disponível em:http://www.microkids.com.br/artigos/distincao_entre_informacao_e_conhecimento.pdf Acessado em Set de 2013. CANAVILHAS, João. A Comunicação Política na Era da Internet. Universidade da Beira Interior, 2009. Disponível em: http://www.bocc.ubi.pt/pag/canavilhas-joao-comunicacaopolitica-na-era-da-internet.pdf , acessado em setembro de 2013. CASARTELLI, A. O. Proposição de um modelo de comunicação e marketing político. São Paulo: INTERCOM, v. 10, p. 10-11, 2005. 71 CASTELLS, M. A sociedade em rede. São Paulo: Paz e Terra, 1999. (A era da informação; economia, sociedade e cultura, v.1) CHOO, C. W. A organização do conhecimento: como as organizações usam a informação para criar significado, construir conhecimento e tomar decisões. São Paulo: Editora Senac São Paulo, 2003. CONSULTAS e artigos com a palavra “análise”. 2005. Disponível em: <http://origemdapalavra.com.br/palavras/analise/>. Acesso em: 19 abr. 2013. COX, M.; ELLSWORTH, D. Application-Controlled Demand Paging for Out-of-Core Visualizatoin. 2004. Disponível em: <http://www.evl.uic.edu/cavern/rg/20040525_renambot/ Viz/parallel_volviz/paging_outofcore_viz97.pdf>. Acesso em: 12 mai. 2013. DAHLBERG, L. Computer-Mediated Communication and the Public Sphere: A Critical Analysis. Journal of Computer-Mediated Communication, v. 7, n. 1, 2001 DANTAS, Edmundo Brandão. A informação como insumo da prática do marketing na gestão do conhecimento do cliente. Universidade de Brasília, 2006. Disponível: http://www.bocc.ubi.pt/pag/dantas-edmundo-informacao-pratica-marketing.pdf DAVENPORT, T. H., PRISAK, L. Conhecimento empresarial. Rio de Janeiro: Campus, 1998. DEMCHENKO, Y. Defining extra Vs: Value and Veracity for Big Data 3V: Volume, Velocity, Variety. 2013. Disponível em: <http://staff.science.uva.nl/~demch/////presentations/sne2013-01-03-bigdata-5V-infrav04.pdf>. Acesso em: 03 fev. 2013. DUMBRILL, Edd. Big Data Now: Current Perspectives from O’Relly Media. 2012. Disponível em: <http://oreilly.com/data/radarreports/big-data-now-2012/thankyou.csp>. Acesso em: 11 mar. 2013. EATON, Chris. Understanding Big Data. IBM. Ebook. 2012. FIGUEIREDO, Ney Lima. FIGUEIREDO JUNIOR, José Rubens de Lima. Como ganhar uma eleição: lições de campanha e marketing político. Cultura Editores Associados: São Paulo, 1990. FREIRE, Gustavo Henrique de Araujo. Ética da Informação: Conceitos, Abordagens, Aplicações. Simpósio Brasileiro de Ética da Informação. Idéia, João Pessoa (PB), 2010 GOMES, Wilson. Participação Política Online: Questões e hipóteses de trabalho. In: GOMES, W.; MAIA, R. C. M.; MARQUES, F. P. J. A. Participação política e internet 2011. Porto Alegre: Editora Sulina. GOMES, Wilson. Propaganda política, ética e democracia. In: RUBIM, Antonio C (Org). 72 Mídia, eleições e democracia. São Paulo, 1994. P. 53-90 GOUVEIA, Sônia Mara. A informação como produto de alto valor no mundo dos negócios. CRB-8 Digital, São Paulo, v. 1, n. 1, p. 43-54, jul. 2008 | http://www.crb8.org.br/ojs INTEL IT Center. Big Data 101: Unstructured Data Analytics. 2012. Disponível em: <http://www.intel.com/content/www/us/en/big-data/unstructured-data-analytics-paper.html>. Acesso em: 04 abr. 2013. ISSENBERG, Sasha. How President Obama’s campaign used big data to rally individual voters, Part 1 Disponível em:. http://www.technologyreview.com/featuredstory/508836/howobama-used-big-data-to-rally-voters-part-1/ . Acessado em 17 de novembro de 2013. KOTLER, Philip. Administração de marketing. São Paulo : Atlas, 1975. KOTLER, Philip. Marketing para o Século XXI – Como criar, conquistar e dominar mercados – 3ª Edição – São Paulo – Editora Futura 1999. LAS CASAS, Alexandre Luzzi. Marketing de Serviços. 4ª edição. São Paulo: Atlas, 2006 LASTORI, A. MySQL e Big Data. 2013. Disponível em: <http://www.slideshare.net/MySQLBR/mysql-e-big-data>. Acesso em: 08 mai. 2013. LAZER, David. et al. Computacional Ciências Sociais. 2006. Disponível em: http://www.sciencemag.org/search?author1=David+Lazer&sortspec=date&submit=Submit. Acessado em set 2013. LE COADIC, Yves-Françoes. A Ciência da Informação. Brasília – DF, Briquet de Lemos/Livros, 1996. LÉVY, Pierre. A inteligência coletiva: por uma antropologia do ciberespaço. 2. ed. Tradução de Luiz Paulo Rouanet. São Paulo: Loyola, 1999. ____________. O que é virtual?. Tradução de Paulo Neves. São Paulo: Editora 34, 1996. ____________. As tecnologias da inteligência: o futuro do pensamento na era da informática. Rio de Janeiro : Editora 34, 1993. 208 p. LITTLE Jonh, Stephen W. Teoria da informação. In: ______. Fundamentos teóricos da comunicação humana. Rio de Janeiro: Guanabara, [197-]. p. 152-161. LORENA, Karin Mestriner. 2013. Qual o custo da comunicação fragmentada?. Disponível em: <http://www.ibm.com/midmarket/br/pt/library_dicas_comunicacao.html>. Acesso em: 06 abr. 2013. MCKENNA, R. Marketing de Relacionamento – 1ª Edição– Editora Campus – 1993 73 MANCINI, P.; SWANSON, D. L. (1995). Politics, Media and Modern Democracy: an International Study of Innovations in Electoral Campaigning and their Consequences. Westport, London: Praeger. MANHANELLI, Carlos Augusto. Estratégias Eleitorais – Marketing Político. Ed. Summus, 1988. MARTELETTO, Regina. Análise de redes sociais aplicação nos estudos de transferência da informação. Ci. Inf., Brasília, v. 30, n. 1, p. 71-81, jan./abr. 2001. Disponível em: http://www.scielo.br/pdf/ci/v30n1/a09v30n1.pdf MASSUCHIN, Michele Goulart. Quais as funções do Websites durante as campanhas eleitorais? As eleições brasileiras de 2012 e o cenário de Curitiba. UFSCar- SC. II Congreso de Comunicación Politica Estratégias de Campaña. Toluca (México), 2013. MIGUEL, Luis Felipe. Os meios de comunicação e a prática política. Lua Nova º 55-56— 2002. Disponível em: http://www.scielo.br/pdf/ln/n55-56/a07n5556.pdf , acessado em 10 de setembro de 2013. MIRANDA, R. C. da R. O uso da informação na formulação de ações estratégicas pelas empresas. Ciência da Informação, Brasília, v.28, n.3, p.284-290, set./dez. 1999. MORIN, Edgar. O problema epistemológico da complexidade. Lisboa: Mem Martins: Europa-América, 1996. NAFFAH, S. ANÁLISE CONFIÁVEL. 2012. Disponível em: <http://www.sas.com/offices/latinamerica/brazil/sascom/revistas/pdfs/sascom_2012q2-ed19.pdf>. Acesso em: 19 abr. 2013. NORRIS, P. (2000). Democratic divide? The impact of the internet on parliaments worldwide. Harvard University: John Kennedy School of Government. ________. (2001). Digital divide; civic engagement, information poverty, and the internet worldwide. CAMBRIDGE: CAMBRIDGE UNIVERSITY PRESS. RADFAHRER, LULI. Uma nova ciência social. Folha de http://www1.folha.uol.com.br/fsp/tec/76084-uma-nova-ciencia-social.shtml. publicada em 05 de novembro de 2012. São Paulo. Reportagem RIBEIRO, Rodrigo Mendes. Marketing político: o poder das estratégias nas campanhas eleitorais. Belo Horizonte: C/Arte, 2002. 191p. (Política & sociedade). 74 ROSSI, Gabriel. Big Data e a pesquisa brasileira. Disponível http://gabrielrossi.com.br/artigo-de-gabriel-rossi-e-novamente-destaque-no-correiobraziliense-edicao-de-natal/ publicada em 25 de dezembro de 2012. em: O ESTADO DE SÃO PAULO. Big Data. Disponível em: http://www.estadao.com.br/ O GLOBO. Como funciona o Big Data. Disponível em: <http://oglobo.globo.com/infograficos/bigdata/> Acessado em maio de 2013. QUEIROZ, Adolfho Carlos Françoso; TAVARES, Débora Cristina. Marketing Político, História e Evolução no Brasil Republicado. Trabalho apresentado ao GT02 do V Congresso Nacional de História da Mídia, Facasper e Ciee, São Paulo em 2007. Disponível em: http://www.ufrgs.br/alcar/encontros-nacionais-1/5o-encontro-2007 1/201cMarketing%20Politico%20Historia%20e%20Evolucao%20no%20Brasil%20Republicano201d.pdf. Acessado em out 2013. PACHECO, Cid. Marketing Eleitoral: A Política Apolítica. In: Revista "Comunicação e Política". Rio de Janeiro: Ed. Cebela, 1994. Ano I, n° I, p. 147 / 153. PRESS, Gil. What’s the Big Data?. 2012. Disponível em: <http://whatsthebigdata.com/2012/06/06/a-very-short-history-of-big-data/>. Acesso em: 17 nov. 2012 RECUERO, Raquel. Big Data: apontamentos e limitações. Postagem em 14.05.2013. Blog Disponível em: < http://www.raquelrecuero.com/arquivos/2013/05/big-data-apontamentos-elimitacoes.html>. Acessado junh de 2013. RECUERO, Raquel. Redes Sociais na internet. Porto Alegre: Sulina, 2009. REVISTA IMASTERS. Disponível: http://issuu.com/imasters/docs/revistaimasters5 REVISTA ISTO É DINHEIRO. Disponível em: http://www.istoedinheiro.com.br/noticias/130282_ESTRATEGISTA+VE+VALETUDO+EM +CAMPANHA+ELEITORAL+NA+WEB . Acessado em set de 2013. RUBIM, Antonio.A. C.; AZEVEDO, F. Mídia e Política no Brasil. Lua Nova, São Paulo, n. 43, 1998, p. 189-216. SAGAN, C. The dragons of Eden; speculations on the evolution of human intelligence. New York: Ballantine Books, 1977 SARACEVIC, Tefko. Ciência da Informação: origem, evolução e relações. Perspectivas em Ciência da Informação, Belo Horizonte, v. 1, n. 1, p. 41-62, jan./jun. 1996. ______. Interdisciplinarity nature of Information Science. Ciência da Informação, Brasília, v. 24, n. 1, p. 36-41, 1995. Disponível em: < http://www.uff.br/ppgci/editais/saracevicnatureza.pdf>. Acesso em: n. 2008. 75 SCHONS, Claudio Henrique. O volume de informações na internet e sua desorganização: reflexões e perspectivas. I n f . I n f . , L o n d r i n a , v . 1 2 , n . 1 , j a n . / j u n . 2 0 0 7. SILVA, Alzira Karla Araújo da; CORREIA, Anna elizabeth Galvão Coutinho; LIMA, Izabel França de. O conhecimento e as tecnologias na sociedade da informação. Rev. Interam. Bibliot vol.33 no.1 Medellín Jan./June 2010 Disponível em: http://www.scielo.org.co/scielo.php?pid=S0120-09762010000100009&script=sci_arttext, acessado em setembro de 2013. SIQUEIRA, Ethevaldo. O mundo na Era do Zettabyte. Economia&Negócio. O Estado de S. Paulo. Maio de 2012. Disponível em:< http://blogs.estadao.com.br/ethevaldosiqueira/2012/05/18/o-mundo-na-era-do-zettabyte/>. Acessado em Ago 2013. STIVANIN, Taíssa. Obama o tuiteiro mais “curtido” do mundo. Artigo publicado em 07 de novembro de 2012. Disponível em: http://www.portugues.rfi.fr/americas/20121107obama-o-tuiteiro-mais-curtido-do-mundo. Acessado em: jan de 2013. TERRA, J. C. C. Gestão do conhecimento: o grande desafio empresarial. São Paulo: Negócio Editora, 2000. 283p. URDANETA, I. P. Gestión de la inteligencia, aprendizaje tecnológico y modernización del trabajo informacional: retos y oportunidades. Caracas: Universidad Simón Bolivar, 1992. VEIGA, Luciana; GONDIM, Sônia Maria Guedes. A utilização de métodos qualitativos na Ciência Política e no Marketing Político. Opin. Publica, Campinas, v. 7, n. 1, 2001. Disponível em: <http://www.scielo.br/scielo.php?script=sci_arttext&pid=S010462762001000100001&lng=en&nrm=iso>. Acesso em: 26 de maio de 2008. VEJA. São Paulo: Abril, n. 2321, 15 mai. 2013. WIKIPEDIA. https://pt.wikipedia.org/wiki/Wikip%C3%A9dia:P%C3%A1gina_principal WHITCH Industries Use More Unstructured Data?. 2012. Disponível <http://sites.tcs.com/big-data-study/tag/unstructured-data/>. Acesso em: 15 mai. 2013 em: XEXÉO, Geraldo. Big data: computação para uma sociedade conectada e digitalizada. Ciência Hoje, v. 51, n. 306, ago. 2013. ZEFERINO, André. A Gestão Estratégica de Dados em Social Media – “Make the big data small or die!”. Disponível: http://cibertransistor.com/2013/06/17/a-gestao-estrategicade-dados-em-social-media-make-the-big-data-small-or-die/. Acesso em agosto de 2013.