Clique Aqui Para Baixar o Arquivo - Artigos

Transcrição

Clique Aqui Para Baixar o Arquivo - Artigos
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – UFRJ
INSTITUTO BRASILEIRO DE INFORMAÇÃO EM CIÊNCIA E TECNOLOGIA – IBICT
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA INFORMAÇÃO – PPGCI
Cleide Luciane Antoniutti
USO DO BIG DATA EM CAMPANHAS ELEITORAIS
COMO ESTRATÉGIAS DE INFORMAÇÃO E COMUNICAÇÃO POLÍTICA
Rio de Janeiro
2013
Cleide Luciane Antoniutti
USO DO BIG DATA EM CAMPANHAS ELEITORAIS
COMO ESTRATÉGIAS DE INFORMAÇÃO E COMUNICAÇÃO POLÍTICA
Documento de qualificação apresentado ao
Programa de Pós-Graduação em Ciência da
Informação, como exame de qualificação de
Doutorado.
Orientadora: Prof. Dra. Sarita Albagli
Rio de Janeiro
2013
RESUMO
O presente trabalho se coloca diante de um contexto marcado por novas práticas do fazer
político, a partir dos usos das novas tecnologias da informação e comunicação (TICs),
principalmente da internet marcada pela “explosão informacional”. Esta pesquisa investiga
particularmente os usos e apropriações que as campanhas eleitorais têm feito de novas
ferramentas para análise de grandes quantidades de dados e informações digitais que
circulam pelas mídias sociais e que inaugura a chamada era do Big data. O trabalho tem
como foco as campanhas eleitorais que apresentam experiências com o uso do Big Data e
particularmente as campanhas políticas brasileiras. O termo Big data é muitas vezes
invocado para descrever o grande volume de informações produzidas pela e sobre a
atividade humana, tornada possível pela crescente onipresença de dispositivos móveis,
celulares, ferramentas de monitoramento, computação e armazenamento barato (em
nuvem). O resultado das análises feitas pelo Big data pode revelar informações que antes
não se conhecia devido à complexidade de sua captura. Para o desenvolvimento deste
trabalho serão realizadas pesquisas bibliográficas em livros, periódicos, publicações
institucionais, científicas e jornalísticas, bem como serão realizadas pesquisas de campo a
partir das observações de fatos que envolvam os usos do big data em campanhas políticas,
com o objetivo de compreender os mais diferentes aspectos desses usos na política
eleitoral.
Palavras-chaves: Big Data, Informação, Internet, Campanhas Eleitorais
ABSTRACT
This paper inserts itself into a context emphasized by new practices of policy making,
because of new information and communication technologies, especially the Internet –
highlighted by the explosion of information. This research investigates uses and
appropriations that election campaigns have been doing of the new tools for analyzes large
amounts of data and digital information circulating through social medias – and that
launches this new era, called Big data. The focus of this work lies beneath electoral
campaigns that experience use of Big data and chiefly the Brazilian political campaigns.
Big Data is often an expression invoked to describe the sheer volume of information
produced by human activity, possible to be gathered and manipulated by the increasing
ubiquity of mobile devices, mobile, tracking, computing and cheap storage (cloud) tools.
The results of the analysis made by Big data can reveal information that previously was not
known due to the complexity of its capture. In order to present this propose, will be
conducted bibliographic searches in books, periodicals and other institutional scientific as
well as journalistic publications. Field surveys will be also conducted to observe facts
involving the uses of Big data in political campaigns, in order to understand different
aspects of uses in electoral politics.
Keywords: Big Data, Information, Internet, Electoral Campaign.
LISTA DE TABELAS
Tabela 1- O dado, a informação e o conhecimento ............................................................. 22
Tabela 2- Cronograma de Atividades do Trabalho ............................................................ 68
LISTA DE SIGLAS
ANP- Agência Nacional do Petróleo
CI – Ciência da Informação
CERN- European Organization for Nuclear Research
CEO- Chief Executive Officer
CDR – Corel Draw
DEM - Democratas
DNC- Democratic National Committee
ECG- Eletrocardiograma
EUA – Estados Unidos da América
FGV – Fundação Getúlio Vargas
HTML- HyperText Markup Language
IBGE – Instituto Brasileiro de Geografia e Estatística
IBM- International Business Machines
IDC – International Data Corporation
IEEE- Instituto de Engenheiros Eletricistas e Eletrônicos
MGD – Machine Generated Data
MIT – Instituto de Tecnologia de Massachusetts
NASA – National Aeronautics and Space Administration
NSA- National Security Agency
PDT - Partido Democrático Trabalhista
PMDB – Partido do Movimento Democrático Brasileiro
PRISM- Programa de Espionagem do Governo Americano
PSDB- Partido da Social Democracia Brasileira
PT – Partido dos Trabalhadores
RFID- Rádio-Frequency IDentification
RSD – Redes Sociais Digitais
TICs – Tecnologias da Informação e Comunicação
WTCCC- Wellcome Trust Control Consortium Case
XML – eXtensible Markup Language
UGC- User Generated Content
USA – United States of América
STEM- Spatio Temporal Epidemiological Modeler
SUMÁRIO
1
INTRODUÇÃO .......................................................................................................... 9
2
OBJETIVOS .............................................................................................................. 14
2.1 OBJETIVO GERAL ................................................................................................ 14
2.2 OBJETIVOS ESPECÍFICOS .................................................................................. 14
3
METODOLOGIA...................................................................................................... 15
3.1 PESQUISAS BIBLIOGRÁFICAS .......................................................................... 15
3.2 PESQUISA DE CAMPO ......................................................................................... 15
4
REVISÃO DE LITERATURA................................................................................. 16
4.1 A EXPLOSÃO INFORMACIONAL ...................................................................... 16
4.1.1 Informação e Conhecimento ............................................................................ 18
4.2 A REVOLUÇÃO DOS DADOS E O FENÔMENO DATAFICAÇÃO .................. 21
4.2.1 Conceito de Dado ............................................................................................ 21
4.2.2 Análise Dos Dados Na Sociedade ................................................................... 22
4.2.3 Dataficação Da Informação ............................................................................. 24
4.2.3.1 Quantificação e Representação do Mundo .................................................. 26
4.2.3.2 Interações Sociais Como Dados .................................................................. 27
4.3 BIG DATA .............................................................................................................. 28
4.3.1 Conceito e Evolução ........................................................................................ 29
4.3.2 Características do Big Data ............................................................................. 33
4.3.3 De onde vêm os dados ..................................................................................... 37
4.3.4 Ciclo de vida do Big Data................................................................................ 39
4.3.5 Usos e aplicações do Big Data ........................................................................ 42
4.3.5.1 Big data e empresas ..................................................................................... 42
4.3.5.2 Big data e Saúde .......................................................................................... 43
4.3.5.3 Big data e Governo ...................................................................................... 45
4.3.5.4 Big data e Política ........................................................................................ 47
4.4 MÍDIA, POLÍTICA E MARKETING ..................................................................... 52
4.4.1 Relação entre Mídia e Política ......................................................................... 52
4.4.2 Informação e Marketing na Política ................................................................ 54
4.4.3 Marketing Político e Eleitoral: evolução e diferenças ..................................... 57
4.5 COMUNICAÇÃO POLÍTICA E CAMPANHAS ELEITORAIS ........................... 61
4.5.1 Comunicação Política (Em desenvolvimento) ................................................ 61
4.5.2 Campanhas Eleitorais (Em desenvolvimento) ................................................. 62
4.5.3 Pesquisa e Política (em desenvolvimento) ...................................................... 63
5
ESTRUTURA PRELIMINAR DA TESE ............................................................... 67
6
CRONOGRAMA DE TRABALHO ........................................................................ 68
7
REFERÊNCIAS ........................................................................................................ 69
9
1
INTRODUÇÃO
O presente projeto de tese se coloca diante de um contexto marcado por novas práticas
do fazer político, a partir dos usos das novas tecnologias da informação e comunicação
(TICs), principalmente da internet, como ambiente e fonte de informação. Esta pesquisa
investiga particularmente os usos e apropriações de novas ferramentas para análise de grandes
quantidades de dados e informações digitais, que inaugura a chamada era do big data. O
trabalho se contextualiza sob a perspectiva da sociedade da informação e do conhecimento, a
partir da explosão e de novos usos de informações presentes em ambientes das mídias sociais
digitais1.
Depois da informatização e da digitalização de documentos (textos, imagens,
fotografias, etc.) ocorrida a partir da década de 1990, a grande preocupação na atualidade está
no gerenciamento da quantidade de informações produzidas em vários segmentos da
sociedade, nas mais diferentes estruturas informacionais. Os bancos de dados crescem em
diversos domínios devido ao uso crescente de redes de sensores em terra e no espaço, a bordo
de satélites, de identificadores de radiofrequências, de outros sistemas de detecção e registro
de dados, do uso de equipamentos móveis como smartphones e tablets, e da proliferação e
utilização crescente das redes sociais digitais2.
O volume global de dados produzidos ou replicados em 2012, por exemplo, chegou a
1,8 zettabyte3, segundo o IDC (International Data Corporation) (SIQUEIRA, O ESTADO DE
S. PAULO, 2012). Hoje são produzidas cerca de cinco bilhões de gigabytes de informações a
cada dois dias. As mídias sociais digitais (redes sociais) aparecem como ambientes de maior
fluxo de informação (SILVA et al, 2010). A previsão é que em 2015 esse número chegue 7,9
zettabytes. Segundo as projeções do cientista italiano Di Bari, em 2020 a sociedade produzirá
o equivalente de conteúdo que toda a humanidade criou em 18 mil anos a cada 18 minutos.
1
O conceito de mídias sociais (social media) precede a Internet e as ferramentas tecnológicas - ainda que o
termo não fosse utilizado. Trata-se da produção de conteúdos de forma descentralizada e sem o controle editorial
de grandes grupos. Significa a produção de muitos para muitos. Mídias sociais se referem aos meios de interação
entre pessoas pelos quais elas criam, compartilham, trocam e comentam conteúdos em comunidades e redes
virtuais. De acordo com Kietzmann et al, mídias sociais empregam tecnologias móveis e de Internet para criar
plataformas altamente interativas por meio das quais indivíduos e comunidades compartilham, co-criam,
discutem e modificam conteúdos gerados por usuários. Mídias sociais introduzem mudanças substanciais e
permanentes na forma como organizações, comunidades e indivíduos se comunicam.
2
Redes Sociais Digitais são definidas como: Segundo a HowStuffWork, redes sociais são o mapeamento das
relações entre diferentes indivíduos, por meio do uso de tecnologias digitais. De acordo com a Wikipedia, redes
sociais são os diálogos interativos entre diferentes pessoas, realizados com o apoio de tecnologias web e mobile,
capazes de gerar mudanças pervasivas na comunicação entre organizações, comunidades e indivíduos.
3
Um Zettabyte é uma unidade de informação ou memória. Ele corresponde a 1.000.000.000.000.000.000.000
(1021) ou 1180591620717411303424 (2 70) Bytes, dependendo do contexto. Informações retiradas do site do
Wikipédia. Acessado em junho de 2013.
10
Joe Hellerstein, cientista da computação na University of Califórnia, em Berkeley (USA),
chama isso de “a revolução industrial dos dados”. Para outros especialistas da área de
Tecnologia da Informação (TI), o mundo vive a Era do Zettabyte, que traz novos e crescentes
desafios. Nessa nova era, a explosão de dados, de todas as origens, ganha o nome de Big Data
(SIQUEIRA, O ESTADO DE S. PAULO, 2012).
O volume exponencial de dados nos últimos anos tornou-se extremamente difícil de
ser mensurado e analisado, mas também passou a ser visualizado por muitos especialistas
como novas oportunidades de negócios, sejam eles econômicos ou políticos. Assim, exigiu-se
o surgimento de novas soluções tecnológicas, que pudessem mapear o grande volume de
dados em tempo real e em alta velocidade. Dessa realidade nasceu o conceito de big data, que
segundo o Gartner (BIG, 2013) pode ser caracterizado basicamente por meio dos “3 Vs”:
high-volume, high-velocity, high-variety (volume, velocidade e variedade respectivamente).
Logo, ao estar diante de dados que possuam essas características em grande escala, o conceito
de banco de dados tradicional não atende aos requisitos atuais de uma rápida análise de
bilhões de dados em um curto espaço de tempo. Atualmente outras duas características foram
adicionadas ao big data, a saber: valor e veracidade (DEMCHENKO, 2013).
O big data se constitui na união entre estatística, matemática e arranjo de dados, que
por meio de fórmulas complexas gera tendências de dados que podem ajudar, segundo
especialistas, a prever comportamentos humanos. O termo é muitas vezes invocado para
descrever o grande volume de informações produzidas pela e sobre a atividade humana,
tornada possível pela crescente onipresença de dispositivos móveis, celulares, ferramentas de
monitoramento, computação e armazenamento barato (em nuvem). O big data promete
coletar dados de diversas fontes e diferentes formatos, estruturados ou não, para gerar
informações estatísticas. O resultado das análises podem revelar informações que antes não se
conhecia devido à complexidade de sua captura. Um dos exemplos mais simples é utilizar o
big data para cruzar informações dos usuários de redes sociais para descobrir quais são suas
preferências de produtos e serviços, para assim colocar anúncios específicos em sua página. O
Facebook e o Google, por exemplo, utilizam dessa tática. O Google refina as buscas que as
pessoas fazem em seu buscador na web com informações já pesquisadas anteriormente, ou
que condizem com suas preferências. Para os estudiosos do tema na era do big data todos os
dados são considerados valiosos e reutilizáveis (MAYER- SCHÖNBERGER; CUKIER,
2013).
Esta pesquisa pauta-se no fato de que, com o desenvolvimento das TICs, o uso
generalizado da internet, a adoção das mídias sociais e os fluxos crescentes de informação
11
criaram-se novas práticas informacionais e comunicacionais em todos os âmbitos da vida
social. E isso tem atingido também as práticas políticas, em especial as eleitorais.
A partir dessa premissa, este estudo pretende focar a investigação no uso do big data
como um suporte de análises de grandes volumes de informações presentes nas redes sociais
digitais, tentando entender como a análise desses dados, que vêm a partir do big data, são
aplicados como estratégias informacionais na comunicação política, especialmente em
campanhas eleitorais. A pesquisa busca, ainda, verificar se as novas possibilidades oferecidas
pelo big data (cruzamento de informações de usuários de redes sociais digitais) têm sido
exploradas na área política também no contexto brasileiro, assim como foram experimentadas
na política norte-americana, principalmente na última campanha política de Barack Obama,
ocorrida em 2012.
O recorte desta pesquisa será direcionado para as campanhas políticas norteamericanas, com foco na disputa de 2012 do atual presidente Barack Obama e nas campanhas
políticas brasileiras, que tiveram alguma experiência com o tema. O olhar da pesquisa será
direcionado também para as próximas campanhas eleitorais brasileiras de 2014.
A presente pesquisa em CI insere-se neste ambiente porque parte da premissa que cada
vez mais políticos e candidatos deverão fazer uso das novas tecnologias em suas estratégias
de informação e comunicação, principalmente em campanhas eleitorais. Como observa o
especialista em uso de tecnologia na política e fundador do site Personal Democracy Media,
Andrew Rasiej, falar o idioma da web será fundamental para qualquer candidato conseguir se
eleger num mundo cada vez mais hiperconectado. Com o surgimento e expansão da internet e
das mídias sociais digitais, os princípios democráticos acabaram sendo afetados de alguma
forma pelo uso intensivo de informação em que a velocidade passou a ser sinônimo de
eficiência. Dessa forma, toda e qualquer mensagem política precisa ser meticulosamente
planejada sob todos os ângulos, a fim de atender os desejos e necessidades dos eleitores. As
mídias sociais digitais, pelas suas características interativas e democráticas, se tornam para os
políticos, importantes ambientes de comunicação e fontes de informações, que podem ser
valiosas para as suas estratégias políticas.
O conceito de big data aliado a explosão informacional também leva a uma tendência
na busca da humanidade por quantificar e compreender o mundo. O processo em que os dados
podem ser registrados, tabulados, analisados e organizados é chamado de “dataficação”
(MAYER- SCHÖNBERGER; CUKIER, 2013). A fim de captar informações quantificáveis,
de dataficar, é preciso saber como medir e registrar essa mediação, o que exige um conjunto
certo de instrumentos, além do desejo de quantificar e registrar.
12
Este trabalho passa por uma proposição central de que o uso de tecnologias para coleta
e análises de grandes volumes de dados e informações produzidas nos últimos anos,
principalmente em mídias sociais digitais, reflete-se em novas formas de se fazerem
campanhas políticas e elaborarem estratégias eleitorais segmentadas, a partir da dataficação
de informações de eleitores. Levantam-se as premissas que isso leva a promessas de que os
políticos poderão conhecer melhor seus eleitores a partir dos usos das informações e dados
encontrados em ambientes de redes sociais, bem como de que o uso do big data, como uma
opção às pesquisas eleitorais tradicionais, pode trazer possíveis inovações para as campanhas
políticas.
Para pesquisadores das áreas de informação e de comunicação, em especial, o forte
crescimento de sites de redes sociais, como Facebook e Twiter, tem fornecido um “oceano de
dados”. A utilização e a análise estatística das enormes bases de dados das redes sociais têm
cada vez maior importância e valor do ponto de vista social, econômico e principalmente
político. Este desenvolvimento tem criado novas oportunidades de abordagens e pesquisas em
ciências sociais (LAZER et al, 2009), mas ao mesmo tempo desperta a intenção para as
questões de privacidade e ética. Assim, o uso do big data no âmbito político também faz
pensar sobre os limites e eficácia destes procedimentos, bem como a ética no uso das
informações dos eleitores, principalmente as de ambientes das redes sociais digitais. É
essencial um questionamento ético sobre as possíveis consequências da coleta,
armazenamento e dos usos dessas informações com finalidades eleitorais.
Este é um tema pertinente e emergente no âmbito da Ciência da Informação (CI)
entendida como ciência interdisciplinar dedicada à investigação das propriedades e do
comportamento da informação, das forças que governam o fluxo e uso da informação, e das
técnicas de processamento para o armazenamento, recuperação e divulgação da informação
(BORKO, 1968). A importância da informação é resumida por Sagan (1977) em uma única
frase: “informação e alimento [ar, aí compreendido] são as condições necessárias à
sobrevivência do ser humano”.
Para a construção conceitual e teórica em torno do tema desta pesquisa recorreu-se a
outras áreas do conhecimento, buscando assim, uma interdisciplinaridade com a área de CI.
Como aponta Saracevic (1990) “os problemas básicos de se compreender a informação e a
comunicação, suas manifestações, o comportamento informativo humano e os problemas
aplicados ligados ao “tornar mais acessível um acervo crescente de conhecimento”, incluindo
as tentativas de ajustes tecnológicos, não podem ser resolvidos no âmbito de uma única
disciplina” (SARACEVIC, 1990, p. 48). Assim, este trabalho transita por conceitos e visões
13
das áreas de Comunicação, Tecnologia da Informação, Marketing, Ciência Política, entre
outras, a partir também das considerações de Morin (1996) que sugere uma nova postura para
as ciências, fazendo o conhecimento progredir através das áreas, comunicar não apenas
informações, mas estruturas de pensamento entre comunidades científicas.
Para o desenvolvimento deste projeto buscaram-se pesquisas na CI relacionados ao
tema big data, mas deparou-se com deficiências bibliográficas, por ser tratar de um assunto
recente. Até o presente momento nenhum trabalho foi encontrado em CI no Brasil que discuta
o conceito de big data com enfoque na política eleitoral. Apesar de não haver publicações em
abundância, sendo que as existentes em sua maior parte são provenientes do inglês, avaliouse ser possível abordar o assunto como pesquisa de doutorado. Assim, diante da falta de
pesquisas e bibliografias, este trabalho se mostra relevante, buscando contribuir para a
discussão e compreensão do conceito de big data, despertando o interesse para novas
pesquisas em outras áreas de conhecimento.
Nesse contexto, é importante pesquisar e questionar pressupostos, valores, tendências
e implicações do uso do big data, particularmente na área política, ainda que seu uso nessa
área ainda esteja apenas começando.
Diante do exposto, a pesquisa pretende responder às seguintes questões:
a) Quais as possibilidades e limites de quantificação e do aproveitamento dos usos das
informações das mídias sociais?
b) Que tipo de mudança o big data traz no uso de dados e informações em campanhas
eleitorais? Quais os limites desses usos?
c) Como esses usos se refletem nas estratégias de comunicação política?
d) Que questões éticas têm sido levantadas no uso do big data, a partir das apropriações
das informações públicas de usuários das redes sociais?
e) Que repercussões o uso do big data têm nas estruturas tecnológicas e profissionais nas
campanhas políticas?
f) Em que medida e de que maneira isto tem sido sentido no Brasil?
g) Quais são os pontos comuns nas experiências no uso do big data no âmbito brasileiro e
em outros países? No que estas experiências se diferenciam?
14
2
OBJETIVOS
Para responder às questões deste trabalho, neste item são descritos os objetivos geral e
específicos.
2.1
OBJETIVO GERAL
Investigar como o big data tem sido usado em campanhas eleitorais e de que modo
isso tem sido aplicado no Brasil.
2.2
OBJETIVOS ESPECÍFICOS
a) Observar como o big data tem sido usado no plano internacional em campanhas políticas,
identificando as possibilidades, os limites e riscos desse uso;
b) Observar que estratégias informacionais e comunicacionais podem ser aplicadas no campo
político a partir do uso do big data.
c) Apresentar as mudanças ocorridas na comunicação política a partir do uso do big data;
15
3
METODOLOGIA
Neste trabalho serão utilizados os seguintes procedimentos:
3.1
PESQUISAS BIBLIOGRÁFICAS
Serão levantadas bibliografias e referências pertinentes aos temas da pesquisa. As
pesquisas serão realizadas em livros, revistas, jornais, publicações especializadas, artigos
científicos, bem como serão coletadas informações a respeito do tema Big Data de
universidades, institutos de pesquisa internacionais por meio da internet como: sites, blogs,
redes sociais, entre outros.
A pesquisa bibliográfica tem por objetivos:
a) ampliar o marco teórico sobre a discussão no campo da Ciência da Informação e áreas
afins e dos conceitos de big data;
b) situar o contexto geral da pesquisa;
c) levantar e conhecer experiências do tema big data fora do Brasil.
d) apresentar antecedentes, contexto do surgimento, evolução e diferentes usos do conceito de
big data;
3.2
PESQUISA DE CAMPO
Pretende-se realizar entrevistas semiestruturadas com profissionais de comunicação,
marketing, tecnologia da informação, cientistas de dados e políticos, envolvidos em
campanhas eleitorais brasileiras e estrangeiras. Além desses profissionais, pretende-se
identificar ao longo da pesquisa, estudiosos, jornalistas, observadores e outros profissionais
destas novas práticas. As entrevistas serão realizadas de forma presencial e também por email e em outras alternativas tecnológicas, principalmente com profissionais envolvidos em
campanhas eleitorais no exterior (especialmente nos EUA) com experiências em big data.
A pesquisa tem por objetivos:
a) conhecer experiências de uso de big data em campanhas eleitorais no exterior, sobretudo
nos EUA;
b) identificar se já existem experiências no uso de big data ou em abordagens análogas em
campanhas eleitorais no Brasil;
c) buscar saber se já está em gestação o uso do big data nas próximas campanhas eleitorais,
principalmente as que acontecerão em 2014.
16
4
REVISÃO DE LITERATURA
A revisão de literatura apresentada a seguir aborda os temas da pesquisa deste trabalho
de forma ainda preliminar. A discussão teórica será aprofundada ao longo da investigação
desta tese. Para situar a pesquisa, é apresentada no decorrer deste capítulo alguns dos temas
que serão abordados durante a elaboração da tese.
4.1
A EXPLOSÃO INFORMACIONAL
Neste item discutem-se os conceitos em torno da revolução e explosão da informação,
a partir dos teóricos da Ciência da Informação e de outras áreas do conhecimento. A discussão
começa por lembrar os apontamentos de Saracevic (1995). O autor recorda que “a explosão da
informação é um problema social que teve seu início com o desenvolvimento das ciências, e
hoje se estende para todas as atividades humanas” (SARACEVIC, 1995, p.42). Cabe aqui
entender como se dá a explosão informacional.
Desde o advento da escrita, a comunicação passou por muitas transformações, que
resultaram, dentre outras consequências, na multiplicação da informação com cópias de
manuscritos, imprensa, fotocópia, permitindo assim exteriorizar, primeiro nas bibliotecas uma
das funções do cérebro humano, que é a memória (LE COADIC, 1996). Essas operações de
multiplicação e memorização explicam uma boa parte do que se costumou chamar de
explosão da informação, ou seja, mais exatamente a explosão da quantidade de informações.
Para Le Coadic:
O advento da eletrônica, que se traduziu pela transição dos suportes materiais para
suportes imateriais, seguido da informática e do desenvolvimento da comunicação
de informações à distância (telecomunicações) só fez reforçar essas tendências. De
multiplicação, amplificação e armazenamento de enormes volumes de informações
ocorrem sem cessar e, às vezes nos fazem duvidar da cordialidade da nova sociedade
da informação (LE COADIC, 1996, p. 6-7).
O surgimento da internet no final do século XX levou a uma série de indagações e em
particular na Ciência da Informação. O advento da rede sem dúvida foi o grande fenômeno
informacional desse período. Barreto (1999b), por exemplo, resume essa inquietação ao
reconhecer que ainda temos mais perguntas que respostas, e que as transformações que
ocorrem com a passagem para a cultura eletrônica e a realidade virtual só irão se delinear ao
longo do tempo (BARRETO, 1999b).
17
A expansão da Internet, desencadeada pelo aumento do número de usuários
conectados, tornou-se um fenômeno amparado pelo desenvolvimento tecnológico. “Esse
crescimento da web foi favorecido pelo avanço de equipamentos tais como: satélites,
roteadores, servidores, switches, backbones entre outros” (SCHONS, 2007, p.2)
Lévy (1993) considera que, no mundo da internet, trabalhamos com quatro pólos
fundamentais: o da produção ou composição de dados, o da seleção, recepção e tratamento
dos dados, o da transmissão e o do armazenamento dos mesmos.
Para estudiosos, a chegada do computador no meio social e a evolução da tecnologia,
principalmente a móvel, contribuíram na última década para a acumulação dos dados. O
mundo não apenas está mais cheio de informação como também a informação está se
acumulando com mais rapidez. (MAYER-SCHÖNBERGER; CUKIER, 2013). A mudança
quantitativa levou a uma mudança qualitativa. A verdadeira revolução na era da informação
não está nas máquinas que calculam os dados, e sim nos dados em si e na maneira como a
sociedade os usa.
A facilidade de acesso e publicação de documentos na rede desencadeou novas
possibilidades quanto à construção de um grande acervo informacional (SCHONS, 2007).
Para Schons:
Tal fenômeno a princípio é positivo, mas no decorrer do tempo esse processo
originou um grande problema na rede pelo fato de conduzir e fomentar o processo
de explosão informacional gerando grandes conflitos, uma vez que o excesso de
informações parece ser pior que a sua falta (SCHONS, 2007, p 04).
Para Schons (2007) o excesso de informações na rede excede a capacidade humana de
explorá-las, ocasionando assim uma grande tarefa temporal para o indivíduo acessar e
processar a informação que deseja. Terra (2000) diz que o excesso de informação está
associado à perda de controle sobre a informação e à imobilidade em usar efetivamente essa
informação. Da mesma forma Chons (2007) observa que hoje as atenções estão voltadas para
o desenvolvimento de tecnologias visando à busca e recuperação eficiente das informações, já
que as dificuldades de selecionar e escolher informações relevantes em meio a um espaço não
estruturado crescem na mesma proporção que o aparecimento delas.
Lévy, assim como os demais autores, observa que o dilúvio informacional na internet
é fluida, virtual e ao mesmo tempo reunida e dispersa. Para ele “essa biblioteca de Babel não
pode ser queimada. […] As águas deste dilúvio não apagarão os signos gravados: são
inundações de signos” (LÉVY, 1999, p.16).
18
No cerne dessa discussão, as atenções, principalmente, dos profissionais da
informação voltam-se mais para a organização, o armazenamento e a análise das informações
que se dispõem, e não propriamente para como obter novas informações (SCHONS, 2007).
A percepção de muitos pesquisadores a respeito do constante aumento no volume de
dados como apontada anteriormente não é recente. Por volta de 1940 o escritor americano
Arthur Fremont Rider publicou em seu livro “The Scholar and the Future of the Research
Library: a Problem and Its Solution” (PRESS, 2012) uma pesquisa na qual estimou que as
bibliotecas americanas dobrariam de tamanho a cada dezesseis anos e, continuando nessa
taxa de crescimento, a biblioteca situada na cidade de Yale teria aproximadamente duzentos
milhões de volumes armazenados até o ano de 2040. Esse volume ocuparia, então, cerca de
dez mil quilômetros em prateleiras. Para servir como referência, a distância entre os extremos
norte e sul do Brasil, não chega a cinco quilômetros (ÁREA, 2013). De fato, a previsão de
Arthur Fremont só não acontecerá devido à digitalização de livros e documentos, recurso não
existente na época da pesquisa. Caso contrário, devido ao elevado aumento das publicações,
essa previsão seria superada bem antes de 2040.
A expansão no que tange à criação de dados é devida principalmente ao avanço
da internet e à facilidade de colaboração on-line entre pessoas geograficamente dispersas,
duas das forças planificadoras do mundo apresentadas por Friedman (2006). Por planificação
mundial, Friedman se refere à redução de barreiras impostas pela distância, de modo a
garantir uma capacidade de colaboração, em escala mundial, aos indivíduos. O avanço da
web ocasionou também a proliferação das redes sociais e a difusão dos dispositivos móveis
como formas de acesso à rede mundial de computadores. A partir de todas essas origens
(dispositivos) e meios (internet), são criados e espalhados enormes e variados conjuntos de
dados. Este fenômeno de criação e compartilhamento de dados em grande volume, velocidade
e variedade, tornou-se conhecido como big data, que posteriormente será discutido neste
trabalho a partir do item 4.3.
4.1.1 Informação e Conhecimento
Nesta subseção serão apresentados os conceitos de informação e conhecimento, a
partir do levantamento feito em fontes não especializadas e na Ciência da Informação (CI).
O conceito de informação pode ter diversas definições. Para muitos a informação pode
ser definida como mensagem, conteúdo, dados, sendo às vezes confundida com
conhecimento. Entre definições, conceitos e abordagens utilizados por pesquisadores de
diferentes áreas e culturas são encontradas inúmeras discussões em torno do fenômeno
19
informação. A discussão neste trabalho em torno do conceito não tem a intenção de esgotar
todos esses conceitos e nem apresentar as considerações de todos os autores, apenas escolher
e situar aqueles que são julgados, neste momento, interessantes do ponto de vista desta
pesquisa.
Etimologicamente o termo informação é proveniente do verbo latino “informare” que
significa colocar em forma, criar, representar ou construir uma ideia ou uma noção de algo
podendo ser compreendida como processo de atribuição de sentido (ARAÚJO, 2001, p. 1).
Na sociedade da informação, a informação é utilizada intensivamente como elemento
da vida econômica, social, cultural e política (MORE, 1999). O termo informação vem atuar
como elemento importante em todos os setores da atividade humana, constituindo-se como
dados organizados e comunicados.
É importante destacar que:
… a informação é a mais poderosa força de transformação do homem. O poder da
informação, aliado aos modernos meios de comunicação de massa, tem capacidade
ilimitada de transformar culturalmente o homem, a sociedade e a própria
humanidade como um todo. (ARAÚJO, 1989, p.01)
A informação é vista por Araújo (1989) e por Barreto (1994) com poder de
modificação da sociedade. Barreto (1994, p. 3) qualifica informação “como um instrumento
modificador da consciência do homem e de seu grupo”, sendo que, quando assimilada de
forma adequada, “produz conhecimento, modifica o estoque mental de informações do
indivíduo e traz benefícios ao seu desenvolvimento e ao desenvolvimento da sociedade”.
Outra definição é de que a informação são dados organizados ou matéria
informacional potencialmente significativas, que servem para a tomada de decisão
(URDANETA, 1992; MIRANDA, 1999).
Já a informação como estratégia é abordada por Choo (2003), que observa que quem
lidava ou lida melhor com a informação e dela sabe tirar proveito consegue levar vantagem,
através de uma melhor tomada de decisões, com inteligência, criatividade e, ocasionalmente,
esperteza.
Essas discussões se aproximam muito da discussão estabelecida neste trabalho em
torno dos usos e aplicações das informações coletadas dos ambientes da internet e que podem
ser aproveitadas a partir da teoria do big data. Em que dados são extraídos de grandes
volumes de informações, para finalidades estratégicas, comunicacionais na área da política
eleitoral.
20
No entanto, no contexto informacional em que pesquisa se insere, a informação está
relacionada também ao conhecimento. O conhecimento, por sua vez, é um conjunto de
declarações organizadas sobre fatos e ideias, apresentando um julgamento ponderado ou
resultado experimental que é transmitido a outros por intermédio de algum meio de
comunicação (CASTELLS, 1999). Assim, informação e conhecimento são as principais
fontes de produtividade e competitividade na nova economia informacional e esta dependerá
basicamente da capacidade de gerar, processar e aplicar eficientemente a informação baseada
em conhecimento.
Lévy (1996) aborda a relação entre informação, conhecimento (e saber) como um ato
de criação.
[...] Quando utilizo a informação, ou seja, quando a interpreto, ligo–a outras
informações para fazer sentido, ou, quando me sirvo dela para tomar uma decisão,
atualizo–a. Efetuo, portanto um ato criativo, produtivo. O conhecimento, por sua
vez, é o fruto de uma aprendizagem, ou seja, o resultado de uma virtualização da
experiência imediata. Em sentido inverso, esse conhecimento pode ser aplicado, ou
melhor, ser atualizado em situações diferentes daquelas da aprendizagem inicial.
Toda aplicação efetiva de um saber é uma resolução inventiva de um problema, uma
pequena criação (LEVY, 1996, p. 58-59).
Portanto,
para
localizar
a
informação
relevante
na
imensidão
de
dados
disponibilizados nesse espaço, é necessário ter um conhecimento básico do que se deseja,
assim como conhecer estratégias de busca que possibilitem a identificação de fontes
confiáveis. O acesso a grandes quantidades de informação não necessariamente garante a
possibilidade de transformá–la em conhecimento. O conhecimento não viaja pela internet
(MATÍNEZ, 2004). Da mesma forma, Calvo (2004) diz que a informação não é
conhecimento.
A produção em massa de dados e fatos e números não significa nada se não houver
produção do conhecimento. O conhecimento é criado por pessoas, individualmente,
a partir de experiências individuais, eliminando-se o “ruído” e só então é
socializado, construindo-se redes de conhecimento (individuais e sociais), e que
estamos continuamente atualizando (CALVO, 2004, p.1).
Para Barreto (1997), o conhecimento, portanto, pode ser visto como toda alteração
provocada no estado cognitivo do indivíduo, isto é, no seu acervo mental de saber acumulado,
proveniente de uma interação positiva com uma estrutura de informação, o que nos levaria à
concepção de ideias de informação como processo e um meio para se atingir determinado fim.
“É também desenvolvimento, de uma forma ampla e geral, como um acréscimo de bem estar;
21
um novo estágio de qualidade de convivência que seria alcançado através da informação”
(BARRETO, 1997)4
4.2
A REVOLUÇÃO DOS DADOS E O FENÔMENO DATAFICAÇÃO
Neste item apresentam-se discussões em torno da importância que os dados passaram
a ter, mostrando discussões em torno do fenômeno inaugurado com a chegada da era do “big
data”, chamado de dataficação da informação. A revolução dos dados está ligada ao
aparecimento do big data (grandes dados), que posteriormente é discutido em detalhes neste
trabalho. Inicialmente são apresentados conceitos em torno do termo dado e a sua importância
na sociedade contemporânea até chegar no processo de quantificação e análise.
4.2.1 Conceito de Dado
À luz da Ciência da Informação o dado é definido como uma sequência de símbolos
quantificados ou quantificáveis. Assim dados podem ser além de textos, imagens, sons,
animações, pois todos podem ser quantificados a ponto de alguém que entra em contato com
eles ter eventualmente dificuldade de distinguir a sua reprodução, a partir da representação
quantificada, com o original. É muito importante notar-se que qualquer texto constitui um
dado ou uma sequência de dados, mesmo que ele seja ininteligível para o leitor.
Como são símbolos quantificáveis os dados podem obviamente ser armazenados em
um computador e processados por ele. Em nossa definição, um dado é necessariamente uma
entidade matemática e, desta forma, puramente sintática. Isto significa que os dados podem
ser totalmente descritos através de representações formais, estruturais. Dentro de um
computador, trechos de um texto podem ser ligados virtualmente a outros trechos, por meio
de contiguidade física ou por "ponteiros", isto é, endereços da unidade de armazenamento
sendo utilizada. Ponteiros podem fazer a ligação de um ponto de um texto a uma
representação quantificada de uma figura, de um som, etc.
A palavra “dado” tem origem latina e pode ter o sentido de “fato”. Segundo MayerSchönberger e Cukier (2013), dado se tornou título de um trabalho clássico de Euclides, no
qual ele explica a geometria como a palavra é conhecida e pode ser demonstrada. Hoje, no
contexto do big data, “dados se referem a algo que permite ser registrado, analisado e
reorganizado” (MAYER SCHÖNBERGER; CUKIER, 2013, p. 54).
4
Citação retirada do artigo A oferta e a demanda da informação: condições técnicas, econômicas e políticas.
Disponível em: http://www.scielo.br/pdf/ci/v28n2/28n2a09.pdf
22
A diferença entre dado, informação e conhecimento como conceitos presentes nesta
pesquisa, ficam mais claros a partir da tabela5 1 que se segue:
O dado, a informação e o conhecimento
Tabela 1
Dado
Simples observações
sobre o estado do mundo
Informação
Dados dotados de
relevância e propósito
 Facilmente estruturado  Requer unidade de

análise
 Facilmente obtido por
máquinas

 Exige consenso em
relação ao significado 
 Freqüentemente
quantificado
 Exige necessariamente a
mediação humana
 Facilmente transferível
Conhecimento
Informação valiosa da mente
humana Inclui reflexão, síntese,
contexto
De difícil estruturação
De difícil captura em máquinas
Freqüentemente tácito
De difícil transferência
FONTE: Davenport, Prusak (1998 p.18)
As palavras informação e dados são intercambiáveis em muitos contextos. Todavia,
não são sinônimos. Por exemplo, de acordo com a observação de Gadomski (1993), dados é
tudo que pode ser processado e as informações são dados que descrevem um domínio físico
ou abstra(c)to.
Considera-se como dado qualquer elemento ou símbolo que por si só não possui
nenhum significado. “Fatos que descrevem os objetos de informação (eventos e entidades).
Os dados referem-se a mais de um fato. Um determinado fato é referido como item”
(GOUVEIA, 1996, p.17).
Com as definições até aqui apresentadas fica claro que para se ter informação é preciso
necessariamente que se tenha dados.
4.2.2 Análise dos Dados na Sociedade
A análise de dados não é um processo moderno, os seres humanos analisam dados há
milênios, como demonstra Mayer- Schönberger e Cukier (2013) numa breve discussão
histórica. A escrita foi desenvolvida na antiga Mesopotâmia porque os burocratas queriam
um instrumento eficiente para registrar e manter o controle de informações. Desde os tempos
bíblicos, os governos organizam censos para reunir dados sobre os cidadãos. O registro de
5
<http://pt.wikipedia.org/wiki/Dados >
23
dados mais antigos remonta a 8000 a. C., quando comerciantes sumérios usaram continhas de
barro para denotar os bens comercializados.
Os seres humanos há muito tempo usam dados para aprender mais sobre o mundo seja
no sentido informal das observações diárias ou, principalmente nos últimos séculos, no
sentido formal de unidades quantificadas que podem ser manipuladas por potentes algorítmos.
Os exemplos usados por Mayer- Schönberger e Cukier (2013) se referem aos conceitos de
censo e estatística, respectivamente a coleta e análise de informações da sociedade. Esses
conceitos são muito utilizados nos dias de hoje com finalidades diversas tanto para governos
quanto para a sociedade.
Desde remota antiguidade, os governos têm se interessado por informações sobre suas
populações e riquezas, tendo em vista, principalmente, fins militares e tributários. O registro
de informações perde-se no tempo. Confúcio relatou levantamentos feitos na China, há mais
de 2000 anos antes da era cristã. No antigo Egito, os faraós fizeram uso sistemático de
informações de caráter estatístico, conforme evidenciaram pesquisas arqueológicas. Desses
registros também se utilizaram as civilizações pré-colombianas dos maias, astecas e incas. É
conhecido de todos os cristãos o recenseamento dos judeus, ordenado pelo Imperador
Augusto. Os balancetes do império romano, o inventário das posses de Carlos Magno, entre
outros.
Há indícios na história de que 3000 anos A.C. já se faziam censos na Babilônia, China
e Egito e até mesmo o 4º livro do Velho Testamento faz referência a uma instrução dada a
Moisés, para que fizesse um levantamento dos homens de Israel que estivessem aptos para
guerrear (Bíblia Sagrada:Livro dos Números: 1, 1-3: p.175). Usualmente, estas informações
eram utilizadas para a taxação de impostos ou para o alistamento militar. Um outro registro da
Bíblia, informa que o Imperador César Augusto, ordenou que se fizesse o Censo de todo o
Império Romano (Bíblia: Lucas: 1, 1-3: p.1530) (MAYER- SCHÖNBERGER; CUKIER,
2013).
No passado, a tarefa de coletar e analisar informações só cabia a instituições mais
poderosas, como a igreja e o Estado. Ao longo de milênios, os governos tentaram manter o
controle da população coletando informações. O censo é citado por Mayer- Schönberger e
Cukier (2013) como um exemplo disso. Segundo os autores, conduzir um censo na época era
caro e demorado, exemplo da demora de se concretizar o processo é exemplificado pelo livro
Domesday, de 1086, um dos mais venerados tesouros britânicos. Essa obra foi uma contagem
abrangente – e sem precedentes em seu tempo – dos ingleses, suas terras e propriedades.
Mayer-Schönberger e Cukier (2013) contam que funcionários se espalharam pelo interior
24
coletando informações para inscrevê-las no livro. Os resultados deste Censo foram publicados
em 1086 no livro intitulado "Domesday Book" e serviram de base para o cálculo de impostos.
O livro era chamado de “fim dos dias” porque o processo era como o Juízo Final bíblico, no
qual todas as vidas eram contadas. O Rei Guilherme I, que encomendou o livro, não viveu
para vê-lo completo, e mesmo depois de todo o tempo e dinheiro investidos, as informações
não eram precisas, eram apenas aproximadas, já que os funcionários não podiam contar todos
os dados com perfeição. A palavra "censo" é derivada da palavra "censere", que em Latim
significa "taxar".
Outro exemplo que ilustra esse item diz respeito ao aparecimento do conceito de
estatística. A origem da palavra estatística está associada à palavra latina status (Estado). Há
mais de 300 anos, um comerciante britânico chamado John Graunt teve uma ideia considerada
inovadora para a época. Ele queria saber a população de Londres na época da peste negra
(1665)6. Segundo Mayer- Schönberger e Cukier (2013) em vez de contar todas as pessoas,
Graunt inventou uma abordagem que lhe permitiu estimar a população, hoje chamada de
estatística. Com uma abordagem simples, ele estabeleceu a ideia de que uma pessoa podia
extrair conhecimento da população em geral a partir de uma pequena amostra.
Essa prática tem sido continuada nos tempos modernos, por meio dos recenseamentos
que são realizados a cada 10 anos pela Fundação IBGE (Instituto Brasileiro de Geografia e
Estatística), órgão responsável pelas estatísticas (dados estatísticos) oficiais brasileiras.
4.2.3 Dataficação da Informação
A era do big data tem chamado a atenção para um novo fenômeno, para além da
digitalização7: o da dataficação (datafication) (MAYER- SCHÖNBERGER; CUKIER, 2013).
Esse fenômeno que vem sendo experimentado principalmente pela área comercial consiste em
transformar informações em dados, ou seja, é a tendência de transformar um negócio existente
em um negócio de dados. Dataficação se refere à coleta de informações de tudo o que existe,
seja no mundo digital ou analógico, transformando tudo em dados que possam ser
quantificados. Esse conceito permite usar as informações de novas maneiras, como análise
6
A Grande Praga de Londres foi um surto de peste bubônica. Houve outros antes dela na Inglaterra e ao redor do
mundo. O mais conhecido foi a pandemia chamada de Peste Negra, no século 14. Especialistas apontam que ela
possa ter dizimado 1/3 da população europeia na época, aproximadamente 75 milhões de pessoas. A Grande
Praga matou um número estimado de 100 mil pessoas, equivalente a 20% da população da capital britânica em
1665. Acredita-se que os focos da doença só tenham sido eliminados em 1666, com o Grande Incêndio, que
destruiu grande parte das favelas e lugares mais pobres da cidade.
7
Digitalização é o processo de converter informações analógicas nos zeros e uns do código binário, de modo que
os computadores possam usá-las. A digitalização não foi o primeiro recurso dos computadores a ser utilizado. A
era inicial da revolução digital foi computacional (MAYER- SCHÖNBERGER E CUKIER, 2013)
25
privisível. Seria, assim, um processo sistemático de extração e tabulação desses dados
dispersos e aparentemente irrelevantes.
As mídias sociais digitais são exemplos de dataficação (MAYER- SCHÖNBERGER E
CUKIER, 2013). O Facebook datafica a rede de amigos, o Google tem dataficado a busca e
recuperação de informações. Twitter é um dataficador de notícias e de informações em tempo
real, o LinkedIn, por exemplo, tem “dataficados” os contatos profissionais. A ideia da
dataficação é a espinha dorsal de várias empresas de mídias sociais. As plataformas de redes
sociais não apenas oferecem uma maneira de encontrar e manter o contato com amigos e
colegas, mas usam elementos intangíveis do cotidiano e os transformam em dados que podem
ser usados para outros fins. O Facebook é um exemplo de dataficação de relacionamentos. Por
meio do gráfico social, as informações são definidas como dados. O Twitter também permite
a dataficação de sentimentos ao criar uma maneira simples das pessoas registrarem e
compartilharem pensamento. Assim, segundo especialistas, cada uma dessas empresas busca
aproveitar essa grande quantidade de dados não estruturados (big data) para armazenar,
analisar e rentabilizar a informação em torno das suas atividades e negócios.
Cada processo de negócio agora é “dataficado”. Com isso é possível monitorar,
armazenar e começar a identificar padrões de uso e, portanto, ter recomendações de como
melhorar ou monetizar os negócios. Os executivos de diversos segmentos da indústria têm
tentado analisar e “dataficar” vendas, aquisição de clientes, rentabilidade de produtos e custos
da cadeia de suprimentos há anos. A novidade é que, agora, esse processo tem velocidade
rápida e ferramentas adequadas para armazenar, manipular e analisar determinadas
informações.
Para entender o fenômeno da dataficação em tempos de explosão de informações, é
necessário buscar uma discussão teórica na Ciência da Informação acerca dos conceitos de
dado. O termo “dado” é usual na literatura da área de Ciência da Informação, Sistemas e
Tecnologia da Informação e Comunicação. É definido como um “conjunto de registros
qualitativos ou quantitativos conhecido, que, organizado, agrupado, categorizado e
padronizado adequadamente se transforma em informação” (MIRANDA, 1999, p.284-290).
A dataficação transforma a hierarquia informacional até agora adotada na Ciência da
Informação. Na perspectiva da CI, os dados se transformam em informações e conhecimento.
Já na era do big data, as informações coletadas em diferentes ambientes é que se transformam
em dados com valor estratégico. Para Davenport e Prusak (1998) dados, informações e
conhecimento estão intimamente relacionados formando uma hierarquia entre eles. Esses
autores explicam que o conhecimento é decorrente da informação, que por sua vez, deriva de
26
um conjunto de dados. Davenport e Prusak (1998) consideram dados como registros sem
significados, que se transformam em informações ao adquirirem algum significado. Da
mesma forma, a hierarquia reversa também pode ser considerada, o conhecimento ao ser
explicitado, difundido através de meios físicos ou virtuais, se torna uma informação ou um
conjunto delas, que ao serem desmembradas se tornam um conjunto de dados. Nesse sentido,
Davenport e Prusak (1998) afirmam que o conhecimento está relacionado ao uso inteligente
da informação, podendo ser avaliado pela qualidade das ações ou das decisões a que leva.
O big data tem a ver com a percepção e compreensão de relações entre informações
que, até recentemente, tinha-se dificuldade para entender. O especialista em big data da IBM,
Jeff Jonas, segundo Mayer-Schönberger e Cukier (2013), diz que é preciso deixar que os
dados “falem com você”. As análises não causais ajudam a compreender o mundo ao
perguntar primeiramente o quê, e não o por quê (MAYER- SCHÖNBERGER E CUKIER, 2013).
4.2.3.1 Quantificação e Representação do Mundo
O processo de dataficação, como abordam os autores Mayer- Schönberger e Cukier,
(2013), não é sinônimo de digitalização. Digitalização é apenas um processo de representação
numérica por meio de codificação binária. O ato de digitalização, ou seja, a transformação de
informações analógicas no formato que os computadores possam ler, em si não datafica. Um
exemplo usado por esses autores quanto a essa diferença é da digitalização de livros a partir
do Google Books: a página digitalizada, é transformada em uma imagem ou similar, mas isso
não torna o texto em si um dado. É necessário que se façam outros processos (como o
reconhecimento textual) para que as palavras em si e a coerência que elas mantêm possam ser
reconhecidas como dados.
A Google8 digitalizou os textos: todas as páginas foram escaneadas e transformadas
numa imagem de alta resolução armazenadas nos servidores da empresa. Cada
página foi transformada numa cópia digital que podia facilmente ser consultada na
internet. Para recuperá-la, contudo, era preciso saber em que livro estava a
informação ou ler muitas páginas até encontrá-la. Não era possível procurar
determinadas palavras no texto, nem analisá-lo, porque o texto não fora dataficado.
Tudo o que o Google tinha eram imagens que apenas os seres humanos podiam
transformar em informações úteis – isto é, lendo. (MAYER- SCHÖNBERGER E
CUKIER, 2013, p.57-58)
Para além dessa necessidade, Mayer-Schönberger e Cukier (2013) sublinham a
importância da medição e do registro como facilitadores de criação de dados. Sem a invenção
8
A Google é referida aqui no texto no contexto feminino porque se refere a empresa.
27
da escrita, como instrumento de catalogação, e a adoção dos algarismos, voltados ao cálculo,
seria inviável qualquer processo de captura e aglutinação de dados. Passando a vista por um
breve histórico da Matemática e das variadas formas de registro (como os livros comerciais),
os autores mostram a importância de se ter uma abordagem padronizada e objetiva diante da
manutenção e dos cálculos de tais dados.
A dataficação permitiu a indexação e a busca nos textos, além de um fluxo infinito de
análise textual. Estima-se que 130 milhões de livros tenham sido publicados desde a invenção
da imprensa no século XV. Em 2012, o Google já havia escaneado mais de 20 milhões de
títulos, mais de 15% de toda a herança escrita do mundo.
Mayer- Schönberger e Cukier (2013) destacam que a transformação de palavras em
dados gera inúmeros usos. Os dados podem ser usados pelos seres humanos para a leitura e
pelas máquinas para a análise. Para esses autores (MAYER-SCHÖNBERGER; CUKIER,
2013, p.57) “o surgimento dos computadores gerou aparelhos de medição e armazenagem
digitais que tornaram a dataficação muito mais eficiente. Eles também permitiram que a
análise matemática dos dados revelasse seu valor oculto”.
4.2.3.2 Interações sociais como dados
O fenômeno da dataficação, já apresentada anteriormente neste trabalho, também está
atingindo o âmbito mais pessoal (relações, experiências e estado de humor). A ideia da
dataficação é uma das características de várias empresas de mídias sociais. “As plataformas
de redes sociais não apenas nos oferecem uma maneira de encontrar e manter contato com
amigos e colegas, mas usam elementos intangíveis do cotidiano e os transformam em dados
que podem ser usados para outros fins” (MAYER- SCHÖNBERGER E CUKIER, 2013, p
63).
Apesar disso, a utilização de dados de redes sociais ainda é embrionária. Segundo
Mayer- Schönberger e Cukier (2013), no caso do Facebook, a empresa ainda está ajustando
seu modelo de negócio (e política de privacidade) de acordo com a quantidade e tipo de dados
que deseja coletar de seus usuários. Segundo dados do Comitê Gestor da Internet (2013), o
Facebook tinha por volta de um bilhão de usuários em 2012, conectados por meio de 100
bilhões de amizades. O gráfico social (Graph Search)9 - relações entre objetos em um conjunto
9
Gráfico Social é considerado o terceiro pilar do Facebook. Tem por finalidade facilitar a vida de quem usa a rede,
oferecendo o resultado direto das buscas - feitas com base nas conexões e dados dos usuários - e não apenas os links. O
sistema permite buscas por conteúdos curtidos e compartilhados pelos usuários, como músicas, lugares, fotos, vídeos e
interesses.
28
- resultante representa mais de 10% de toda a população mundial, dataficada e disponível para
uma única empresa.
O Twitter também tem usado amplamente os dados de seus usuários. Em 2012 foram
enviados em torno de 400 milhões de tweets todos os dias, por mais de 140 milhões de
usuários mensais. A empresa permite a dataficação dos pensamentos, do estado de espírito e
das interações das pessoas. O Twitter fez negócios com duas empresas, a DataSift e a Gnip,
para vender acesso aos dados. A partir disso, muitas empresas analisam os tweetts e às vezes
usam uma técnica chamada “análise de sentimentos”, a fim de reunir opiniões de
consumidores ou de julgar o impacto de campanhas de marketing.
Dessa forma, entende-se que os grandes bancos de dados das empresas de mídia social
formam a base de novos empreendimentos que vão muito além do superficial
compartilhamento de fotos, atualizações de estatus e botões de “curtir”. São importantes
ambientes de informações que podem ser transformados em dados com valores estratégicos,
que podem ser aplicados para diversas finalidades, inclusive em estratégias de informação e
comunicação política. Por isso, destaca-se esse ambiente da internet, para o estudo do
presente trabalho.
4.3
BIG DATA
O presente item tem como finalidade discutir o conceito e aplicabilidade do big data
(grandes dados) na sociedade contemporânea. Inicia-se pela discussão da origem e evolução
do conceito, características – os chamados 5 Vs-, ciclo de vida e em seguida apresentam-se os
usos e
algumas experiências do big data em diversas áreas, e por fim destaca-se as
experiências em campanhas políticas eleitorais. Além disso, são apresentadas as primeiras
iniciativas de big data eleitoral.
Para a construção deste item recorreu-se a grande parte da literatura advinda de
autores e especialistas da área de Tecnologia da Informação (TI). A obra mais utilizada para
descrever o big data foi do professor de Controle e Regulação da Internet no Oxford Internet
Institute, em Oxford University, Viktor Mayer- Schönberger e o editor da revista Economist,
Kenneth Cukier, que são considerados autoridades em big data nos EUA. Entre esses autores,
outros foram pesquisados por meio de blogs, sites e artigos de referência internacional e
publicações em veículos impressos brasileiros como O Globo, Revista Veja e em veículos
científicos como Revista Ciência Hoje e demais periódicos internacionais.
É importante ressaltar que o termo big data recebe diversas referências. Durante as
pesquisas ele apareceu de várias maneiras como: fenômeno, Era, tecnologia, ferramenta.
29
Buscou-se inicialmente dar uma dimensão do que seja o conceito big data que está sendo
discutido por diversos autores que foram selecionados neste trabalho.
4.3.1 Conceito e Evolução
É importante ressaltar que o conceito de big data (grandes dados), apesar de estampar
as principais revistas e jornais nacionais e internacionais nos últimos tempos, não é algo novo.
Como assinala Manovich (2013)10 o termo big data é frequentemente usado em meios de
comunicação, empresas, ciência da computação e da indústria do computador11. Big data é um
termo de mercado já sendo discutido desde o final da década passada, mas só em 2013 foi que
o conceito extrapolou de vez os limites da academia e dos setores de Tecnologia da
Informação (TI).
Na imprensa especializada, o termo big data desde 2008 vem chamando a atenção
para a “Era do Big Data”. Por exemplo, em junho de 2008, a revista Wired abriu sua seção
especial sobre "A Era Petabyte", afirmando: "Nossa capacidade de captar, armazenar, e
compreender grandes quantidades de dados está mudando a ciência, medicina, negócios e
tecnologia. Como a nossa coleção de fatos e números cresce, assim será a oportunidade de
encontrar respostas para as questões fundamentais. "Em fevereiro de 2010, The Economist
começou seu relatório especial" Dados, Dados Everywhere "com a frase" a revolução
industrial de dados "(cunhado pelo cientista da computação Joe Hellerstein). Na observação
de Monovich (2013) o efeito está sendo sentido em todos os lugares, de empresa para a
ciência, por parte do governo para as artes.
No Brasil, a revista Veja (2013) e Ciência Hoje (2013) publicaram recentemente
reportagens apresentando o conceito de big data como a “revolução dos dados”, ressaltando a
suas aplicações, principalmente na área comercial e empresarial. O jornal O Globo também
vem explorando o tema desde
O que desde 2008 pela imprensa vem sendo chamada de “era do big data”12 só se
materializou com a confluência de alguns fatores como a queda do custo de armazenar dados.
Há 20 anos estocar um gigabyte custava cerca de 1000 dólares, hoje sai em média seis
10
Nessa perspectiva, uma das principais referência no campo de pesquisa dos software sutdies, o russo Lev
Manovich tem desenvolvido, desde 2009, um projeto ambicioso de coleta desses conteúdos, capazes de gerar um
grande banco de dados no qual é possível a visualização de modo sistemático de um conjunto de rastros dos
indivíduos em ambientes da internet. Trata-se do Cultural Analytics, um novo conceito de análise de dados
oriundos de usuários.
11
http://cio.uol.com.br/tecnologia/2013/07/24/do-big-data-ao-big-brother/
12
Revista Veja. Edição 2321. ano 46. n°20 – 15 de maio de 2013. p. 70-81.
30
centavos. Os processadores tornaram-se velozes, os programas ficaram mais inteligentes e a
quantidade de dados cresce exponencialmente.
Os especialistas otimistas observam que o big data tem ganhado proporções
diferenciadas em diversos ambientes de discussão. O termo tem se tornado tão importante que
no World Economic Forum de 2012, foi citado como uma nova classe de ativo econômico
comparado ao petróleo. Ginni Rometty, CEO da IBM ressaltou que, da mesma forma que o
petróleo foi o recurso natural que potencializou a última revolução industrial, dados serão os
recursos que farão a diferença em termos de competitividade, inovação e até mesmo
sobrevivência nesta revolução industrial que estamos vivendo – a era da informação
(LEONARDI, 2013).
Prova do alcance do conceito foi último Fórum Econômico Mundial. O austero
encontro de Davos abriu espaço em sua agenda de debates sobre mercados financeiros e
conjuntura macroeconômica para discutir diversos aspectos do mundo da informação. Ao fim,
o fórum publicou o estudo "Big Data, grande impacto: novas possibilidades para o
desenvolvimento internacional", que mostra como o big data pode ser uma arma contra os
problemas sócio-econômicos13.
Big data é um termo muito utilizado atualmente, principalmente em empresas de
comunicação e tecnologia, mas diferentemente do que a princípio possa parecer, big data não
é uma tecnologia, mas sim um novo paradigma a respeito da geração e manipulação de dados,
bem como seu crescimento exponencial. Em outras palavras, uma “explosão de dados” em
uma proporção que nunca havia ocorrido antes. Em 1997, durante conferência do Instituto de
Engenheiros Eletricistas e Eletrônicos (IEEE) sobre virtualização, dois pesquisadores da
NASA (National Aeronautics and Space Administration – Administração Nacional da
Aeronáutica e do Espaço) publicaram o artigo Application-controlled demand paging for outof-core visualization (COX, 2004) em que anteviam os novos desafios na área de computação
ao ter que lidar com grandes volumes de dados. Pelo que se tem conhecimento, foi nesse
artigo o termo big data foi usado pela primeira vez.
O big data no meio comercial nasceu da necessidade de empresas como a Google e
Yahoo de criarem uma arquitetura escalanável para analisar um gigantesco volume de dados
variados e que se acumulam rapidamente. O Machine learning, em português o aprendizado
de máquina, é considerado o grande aliado do tema big data. Ele possibilita aos computadores
13
< http://oglobo.globo.com/tecnologia/de-moneyball-davos-big-data-se-abre-para-mundo-4460918>
31
aprenderem a contar, qualificar e predizer infinitos aspectos da vida dos indivíduos e da
natureza.
É importante destacar que, com o grande universo originado ao redor do assunto
nesses últimos anos, hoje o big data pode ser considerado como uma região de conhecimento
transversal e que abrange diversas áreas produtivas e pesquisas científicas. É um campo
focado em gerar conhecimento e inteligência a partir de grandes quantidades de dados
complexos. Ferramentas desse tipo surgiram no fim da década passada, mas este ano o
conceito extrapolou de vez os limites da academia e dos setores de TI. Isso porque o preço
para armazenamento de dados está despencando e diversas ferramentas baratas ou gratuitas
para lidar com as informações estão surgindo. Um exemplo é o Hadoop, software de código
aberto surgido dentro da Google que permite tratar grandes volumes de dados em tempo
real14.
O projeto genoma é considerado um exemplo de big data e da evolução da
computação científica. Afinal, o primeiro mapeamento humano (menos de uma década atrás)
custou US$ 1 bilhão, dada à complexidade de captura e processamento dos dados. Hoje, o
processo está para se tornar rotineiro e custa menos de US$ 5mil, ou seja, o big data não só
possibilitou o crescimento do conhecimento do genoma como também a democratização do
processo de geração desse conhecimento.
Especialistas apontam o Social Security Act15 — programa instituído pelo presidente
dos EUA Franklin Roosevelt em 1937 — como o primeiro grande projeto de captação e
catalogação de informações. Por meio de um sistema de cartões perfurados, idealizado e
implantado pela IBM, o governo computou informações de 26 milhões de americanos. Hoje,
para se ter uma ideia, só a cadeia de lojas Walmart processa informações de transações de
mais de 1 milhão de clientes por hora (ARRIGONI, 2013)
Mas afinal o que é big data? O big data descreve um conjunto de problemas e suas
soluções tecnológicas em computação aplicada com características que tornam seus dados
difíceis de tratar. Na informática, o big data tem um significado mais preciso. O termo é
originário de tecnologia da informação e é aplicado a conjuntos de dados, cujo tamanho é
14
Leia mais sobre esse assunto em http://oglobo.globo.com/tecnologia/de-moneyball-davos-big-data-se-abrepara-mundo-4460918#ixzz2lSND5bXF
15
A segurança social é um conceito consagrado no artigo 22 da Declaração Universal dos Direitos Humanos que
afirma que toda pessoa, como membro da sociedade, tem direito à segurança social e tem direito à realização,
pelo esforço nacional, pela cooperação internacional e de acordo com a organização e recursos de cada Estado,
dos direitos econômicos, sociais e culturais indispensáveis à sua dignidade e ao livre desenvolvimento de sua
personalidade. Em termos simples, os signatários concordam que a sociedade em que vive a pessoa deve ajudálos a desenvolver e tirar o máximo partido de todas as vantagens (cultura, trabalho, bem-estar social ), que são
oferecidos a eles no país. Informações retiradas do http://en.wikipedia.org/wiki/Social_security_system
32
além da capacidade de ferramentas de software utilizadas para capturar, gerenciar e processar
os dados dentro de um tempo decorrido tolerável (ADAMI, 2013). “Devido ao modelo
econômico adotado pela globalização, o termo just in time, totalmente dependente da
necessidade de uma expansão virtual, se tornou a palavra de ordem das negociações e forçou
a ampliação de estrutura para armazenamento de dados”16.
Segundo Manovich (2013) grandes volumes de dados têm variado de algumas dezenas
de terabytes para muitos petabytes de dados em um único conjunto de dados.
Já para Recuero17 (2013), uma das pesquisadoras da área de internet, do ponto de vista
social, o big data se refere à imensidão de dados sobre indivíduos e grupos que hoje são
gerados na Internet por esses atores. Recuero (2013) diz que,
...coletar dados de pessoas sempre foi um problema para a pesquisa. Pessoas
mentem, inventam, são subjetivas e, o "pior", esses dados ainda eram "traduzidos"
pelo pesquisador. Análise de redes sociais, por exemplo, era feita como no tempo do
Moreno: perguntando às pessoas. Eis que com a Internet, centenas de milhares de
pessoas passaram a criar e espalhar "rastros digitais". Passaram a deixar por aí
registros de suas falas, seus gostos, seus pensamentos, seus amigos e etc. Centenas
de milhares de dados passaram a ser gerados e publicados por todos nós. E o uso
desses dados é o que "Big Data" se refere. É a primeira vez na História que cientistas
têm acesso a dados brutos humanos "não subjetivos" e que essas análises podem ser
feitas de forma quantitativa e em grande escala. E mais do que isso, de dados que
são gerados em outras plataformas especialmente para isso (como dados de
consumo, dados de comportamento e etc.) (RAQUEL, 2013)18
Resumindo, para Recuero (2013), big data é sobre todos nós e as informações que
publicamos/concedemos a outros. Big data é sobre análise dos dados de milhares de
consumidores. É sobre padrões.
Com o big data Existem várias formas de extrair valor dessa quantidade de dados
disponíveis, de modo a facilitar a vida das pessoas, melhorar a prestação de serviços, pautar
decisões mais assertivas e consequentemente aumentar a receita das empresas.
Em linhas gerais, big data é a análise de vastos banco de dados, tanto estruturados
(planilhas e tabelas) como não estruturados (linguagem natural, imagens, etc), em sua
totalidade, sem recorrer a amostras, e sempre em busca de padrões e correlações.
Para os especialistas em marketing o big data é considerado uma técnica avançada de
análise de dados dos indivíduos. Já no âmbito da política eleitoral o big data tem se
16
Citação retirada da página da infoescola da autora Anna Adami. Disponível em:
<http://www.infoescola.com/informatica/big-data/>
17
RECUERO, Raquel. Big Data: apontamentos e limitações. Postagem em 14.05.2013. Blog acessado em junho
de 2013 < http://www.raquelrecuero.com/arquivos/2013/05/big-data-apontamentos-e-limitacoes.html>
18
Citação retirada do blog http://www.raquelrecuero.com/
33
transformado numa ferramenta alternativa de survey (pesquisa) para revelar atitudes e
preferências de eleitores, que podem ser utilizados por candidatos e políticos de forma
estratégica na conquista do voto (OLIVEIRA, 2013).
4.3.2 Características do Big Data
O big data é constituído por três principais características, os chamados três 'Vs': highvolume (volume), high-velocity (velocidade) e high-variety (variedade). (BIG, 2013; XEXÉO,
2013). A outras duas características foram adicionadas atualmente ao conceito que trata-se do
valor e veracidade (DEMCHENKO, 2013). Com isso, também será encontrado na literatura o
termo 5 Vs, definindo melhor a abrangência do conceito de big data. Mas do que, afinal, se
trata os 5 Vs do big data?
1.Volume: esta característica se refere à grande quantidade de dados digitais a serem
analisados. Porém, não há uma definição precisa da medida, em bytes, da quantidade
necessária para afirmar que alguma organização está lidando com um volume grande de
dados. Para o analista e pesquisador da IDC (International Data Corporation), Carl W.
Olofson (TRÊS, 2013) essa questão do volume depende do caso e da natureza do dado.
“Algumas centenas de gigabytes podem muito bem caracterizar big data por causa da terceira
dimensão, que é a da velocidade ou tempo necessário para processamento”. Assim, pode-se
verificar que a questão da “grande quantidade de dados” é um aspecto relativo; depende de
outros fatores.
A partir de informações divulgadas pela Intel (2012), é possível ter uma “visão
telescópica” sobre o que vem acontecendo com os dados que são gerados diariamente,
principalmente na Internet. A pesquisa revela que desde o início da era civilizada até 2003
foram gerados 5 exabytes de informações. Atualmente, em dois dias é gerado o mesmo
volume. A estimativa, calculou que o planeta chegaria a um volume de 2.72 zettabytes em
2012 e dobraria a cada dois anos até chegar a 8 zettabytes em 2015.
Outros exemplos ilustram essa característica do big data. Os experimentos no Large
Hadron Colider no CERN (Laboratório de Física de Partículas na Europa) geram 40 terabytes
de dados por segundo, mais informação do que pode ser armazenada ou analisada pelas
tecnologias atuais (muitos destes dados são simplesmente descartados, dada a incapacidade de
armazená-los). Esta informação foi extraída da revista semanal The Economist de 2013, na
qual é afirmado que exemplos de manuseio de grandes quantidades de informação como este
também são encontrados em outros cenários, como nos bancos de dados do Wallmart, de
34
tamanho estimado em torno de 2,5 petabytes, o equivalente a 167 vezes o conteúdo dos livros
na biblioteca do Congresso Americano.
Estes e outros exemplos mostram como a criação de dados cresceu nos últimos anos.
Estima-se que do início da civilização até 2003, a humanidade criou 5 hexabytes de
informação; atualmente esse mesmo volume é criado a cada dois dias (VILLELA, 2013).
Xexéo (2013) observa que muitas vezes somos obrigados a escolher que tipos de
dados queremos guardar. “O restante acabamos descartando. Cabe aí saber o que guardar. E
guardar cada vez mais rápido é o desafio de hoje”. (XEXÉO, CIÊNCIA HOJE, 2013, p.19)
2.Velocidade: de acordo com o Gartner (BIG, 2013), velocidade significa tanto o quão rápido
os dados estão sendo produzidos quanto o quão rápido os dados devem ser tratados para
atender à demanda. Etiquetas RFID e contadores inteligentes estão impulsionando uma
necessidade crescente de lidar com torrentes de dados em tempo quase real. Reagir rápido o
suficiente para lidar com a velocidade é um desafio para a maioria das organizações.
Na computação, por exemplo, toda vez que o volume de dados a ser analisado
aumenta, consequentemente é consumido mais tempo de processamento para obter o
resultado da análise. Essa relação, inversamente proporcional, ocorre independentemente da
tecnologia utilizada. Assim, quanto mais lentamente o resultado for divulgado, maior será a
probabilidade de que a necessidade da informação já esteja expirada.
Assim, de acordo com Carl W. Olofson realizar-se a análise de uma grande massa de
dados consumia uma hora de processamento e, com o aperfeiçoamento desse processo, foi
possível realizar em um segundo, altera-se muito a perspectiva do que se pode “fazer com os
resultados gerados, agregando mais valor ao dado”. Dessa forma, entende-se que avaliar
isoladamente essas características não satisfaz a compreensão do que seja big data. Nesse
aspecto, a velocidade no processamento é um fator fundamental para possibilitar a análise de
um grande volume de dados no menor intervalo de tempo que seja possível.
3.Variedade: de acordo com uma pesquisa realizada pela empresa TATA Consultancy
Services (TCS) (WHITCH, 2012), 51% dos dados nas empresas estão organizados de forma
estruturada. Portanto, estão definidos em esquemas ou tabelas de um banco de dados em que a
estrutura possui atributos que dão significado ao dado e utilizam algum tipo de indexação para
determinar uma identidade única para cada registro. Os 49% restantes estão distribuídos em
não estruturados ou semiestruturados. Em outras palavras, estão catalogados através de
35
planilhas, documentos de texto, e-mail, recados em mídias sociais, imagens, vídeos, arquivos
de áudio, XML, HTML, entre outros.
Assim, variedade significa que os dados aparecem em formas diferentes. Os sistemas
tradicionais são otimizados para processar dados que podem ser facilmente descritos na forma
de tabelas, como uma planilha eletrônica, onde cada coluna tem tamanho constante ou
previsíveis, mesmo que a quantidade de linhas seja muito grande. Muitos dos novos tipos de
dados têm formatos mais livres (textos, imagens, etc) ou com estruturas específicas (redes,
por exemplo). (XEXÉO, Ciência Hoje, 306, Agosto, 2013, p. 19)
A partir desses três ‘Vs’, outros autores propõem ainda mais dois conceitos, como
veracidade, variabilidade ou valor. São outras preocupações importantes, como garantir que
o dado seja verdadeiro e ainda válido no tempo.
4. Veracidade: Lorena (2013), a respeito dos problemas de comunicação nas empresas,
observa que um em cada três líderes de negócios frequentemente toma decisões importantes
com informações incompletas ou de fontes não confiáveis, um em cada dois líderes de
negócios não tem informação suficiente vinda através de sua organização para executar suas
tarefas.
5. Valor: Segundo Norvig (VEJA, 2013, p. 8) diretor de pesquisa do Google, “com o big
data, se gasta muito mais tempo coletando dados do que chegando a resultados”. Segundo ele
mais de 90% da informação armazenada sempre aparenta ser dispensável. Então, a pergunta
que se faz, qual seria o sentido de empenhar tanto esforço e investimento para recuperar um
número tão pequeno de informações úteis, ou seja, cerca de 10%? O esforço empenhado na
análise desses dados só passa ter utilidade, ou valor, quando são selecionados corretamente os
dados que devem ser analisados. Norvig (2013) observa que “o real diferencial está no que é
considerado lixo”.
Mayer-Schönberger e Cukier (2013) também discutem essa característica do big data,
dizendo que o valor dos dados, no mundo do big data, passa do uso primário para o uso
potencial no futuro, o que gera profundas consequências: afeta a forma como os negócios
valorizam seus dados e a quem conferem acesso a eles. Segundo os autores, “isso permite, e
talvez até obrigue, as empresas a mudar seus modelos de negócios e altera a forma como elas
enxergam e utilizam os dados” (MAYER-SCHÖNBERGER; CUKIER, 2013, p. 70).
36
Os autores chamam a atenção particularmente para as empresas de informação, como
a Farecast ou o Google – nas quais, segundo eles, os fatos brutos entram num lado da linha de
produção e saem do outro como informação processada. Com isso, os dados estão começando
a parecer um novo elemento de produção. O valor imediato da maioria dos dados é evidente
para os que o coletam. As lojas registram dados de vendas para realizar um adequado balanço
financeiro. As fábricas monitoram a produção para garantir que esteja adequada à demanda e
a seus padrões de qualidade. Os sites registram cada clique dos usuários para analisar e
otimizar o conteúdo que fornecem aos visitantes.
Ao contrário das coisas materiais, o valor dos dados não diminui com o uso; ele pode
ser continuamente reprocessado, reagregando valor a cada novo uso. “Os dados são o que os
economistas chamam de bem “sem concorrente”: seu uso por uma pessoa não impede o uso
por outra, e a informação não se desgasta como as coisas materiais”. (MAYERSCHÖNBERGER; CUKIER, 2013, p 71). Como os dados podem ser usados várias vezes com
o mesmo objetivo, o mais importante é que podem ser utilizados com vários objetivos
também.
Mas afinal que tipo de possibilidades temos com o emprego do big data? Dentre
outras formas de se criar valor com big data, é possível, segundo as perspectivas dos
especialistas da IBM19:
 Identificação de padrões: que podem auxiliar na tomada de decisões. Por exemplo a
percepção de que um grande número das pessoas sofre de um problema comum gera o
insight em relação às carências que as empresas podem preencher.
 Personalização: o armazenamento de dados relativos aos hábitos e interações das
pessoas permite que elas tenham atenção personalizada, o que torna o atendimento e a
resolução dos seus problemas muito mais efetiva.
 Planejamento estratégico: as empresas podem planejar suas ações com base em
informações previamente mapeadas direcionando suas decisões com base em dados.
 Inovação: o uso de big data possibilita um conhecimento maior dos clientes e do
mercado como um todo, facilitando o processo de criação de novos produtos e
serviços.
Assim segundo as expectativas dos especialistas da IBM, o big data torna-se viável e
rentável, emergindo formas de “domar” dados massivos, pois, dentro desses dados existem
padrões e informações valiosas, previamente ocultos devido à sua extração complexa. Por
19
Informações retiradas do site da IBM.
37
exemplo, em empresas como a Google ou a Walmart, este poder é por vezes atingido, mas a
um custo exorbitante. Contudo, hoje em dia, o hardware, as arquiteturas cloud (nuvem) e o
software open source oferecem o processamento big data a um menor custo, possibilitando,
aos iniciantes na área, alojar um servidor na cloud com custos mais reduzidos.
4.3.3 De onde vêm os dados
Xexéo (2013) aponta que os dados estão presentes no comércio e na indústria.
Segundo o autor as informações são geradas a partir de cada venda em uma rede de
supermercados, por exemplo. E se essas informações forem cruzadas com mensagens em
redes sociais sobre mercados, produtos, receitas e notícias na mídia ou com as regiões
geográficas, em que acontecem, os sistemas que analisam toda essa informação permitem aos
donos dessas lojas obterem tanto dados de perfis de consumo individualizado quanto da
experiência de compra do cliente e seus gastos.
Já na indústria, Xexéo (2013) destaca que um dos fatores que aumenta a quantidade
de dados é a multiplicação dos sensores de vários tipos, de câmeras de alta definição a
simples contadores ou termômetros. O autor exemplifica, dizendo que uma empresa pode
colocar sensores não só em sua fábrica para analisar o processo produtivo, mas também em
seus produtos, que enviam ao fabricante, dados sobre sua localização geográfica, seu uso e
desempenho.
A maioria das coisas hoje, até aqueles equipamentos que temos em casa, já oferecem
informações e dados sobre seus estados. Geladeiras, por exemplo, ligadas a internet oferecem
dados sobre o estado e ritmo de consumo dos produtos que estão guardadas nelas. Esse
fenômeno é identificado por muitos pesquisadores como a “internet das coisas”, em que s ão
utilizadas várias tecnologias em conjunto, tais como sensores, RFID, redes wireless e outras.
Ainda sobre os dados, Xexéo (2013) observa que no Brasil, em especial, a indústria de
petróleo é grande criadora de dados, que vão da pesquisa sísmica inicial e monitoração
eletrônica de poços até a venda de combustível na bomba dos postos de abastecimento. Os
dados dos bancos de dados da Agência Nacional do Petróleo (ANP) são usados por várias
empresas de petróleo, que produzem ainda mais informações. A partir deles, são gerados
imagens e filmes que são analisados e geram textos e relatórios, que, por sua vez, geram
investimentos financeiros, movimentos da bolsa e notícias na mídia. Assim, entende-se que os
dados gerados circulam por diversos ambientes e diversos formatos o tempo todo.
Como observa Arrigoni (2013) a geração dessa massa informacional está em todo
lugar.
38
Nas suas interações na web, quando você busca algo no Google — o pai do big data
— no seu celular, no seu exame médico, na previsão do tempo, na compra da sua
passagem aérea e até no cinema. Por toda essa grandiosidade, um data scientist
precisa entender de matemática, probabilidade, programação, às vezes linguística
(NLP) e até de análise de redes sociais (SNA) (ARRIGONI, 2013)
É importante lembrar, que nem todos os dados são necessariamente úteis para análise
de big data. No entanto, alguns tipos de dados são particularmente maduros para análise,
segundo as perspectivas dos analistas de dados David Reinsel e John Gantz (2012), do IDC
Group apresentadas no site do grupo20:
Imagens de vigilância. Normalmente, os metadados genéricos (data, hora, local,
etc) são automaticamente ligado a um arquivo de vídeo. No entanto, como as
câmaras IP continuam a proliferar, há uma maior oportunidade para incorporar mais
inteligência na câmara (na extremidade) de modo que as imagens podem ser
capturadas e analisadas e marcado em tempo real. Este tipo de marcação pode
agilizar investigações de crimes, melhorar a análise de varejo para os padrões de
tráfego de consumo, e, claro, melhorar a inteligência militar como vídeos de drones
em várias geografias são comparados para as correlações teste padrão, emergência
multidão e resposta, ou medir a eficácia de contra-insurgência.
Incorporado e dispositivos médicos No futuro, os sensores de todos os tipos
(incluindo aqueles que podem ser implantados no corpo) irá capturar a biometria
vitais e não vital, a eficácia da medicina rastrear, correlacionar a atividade física com
a saúde, monitorar potenciais surtos de vírus, etc - tudo em tempo real.
Entretenimento e mídia social. Tendências com base em multidões ou grupos
enormes de pessoas pode ser uma grande fonte de grandes volumes de dados para
ajudar a trazer ao mercado a "próxima grande coisa", ajudar a escolher vencedores e
perdedores no mercado de ações, e sim, até mesmo prever o resultado das eleições tudo baseado em usuários da informação publicar livremente através de lojas sociais.
Imagens de consumo. Nós dizemos muito sobre nós mesmos quando postamos
fotos de nós mesmos ou nossos familiares ou amigos. A imagem usada pode valer
mais que mil palavras, mas o advento do Big Data introduziu um multiplicador
significativo. A chave será a introdução de algoritmos sofisticados de marcação que
pode analisar as imagens, quer em tempo real quando as fotografias são tiradas ou
enviados ou em massa depois que eles são agregados a partir de vários sites.
(REINSEL; GANTZ, 2012)
Zeferino (2013) aponta a evolução histórica do big data, a partir de três níveis
fundamentais de produção:

A produção de dados em regime de Input - Situação que retrata os primórdios dos
primeiros computadores pessoais, sobre os quais existia a necessidade de armazenar
dados diretamente em cada PC, e que marcou uma viragem determinante na vida
tecnológica das empresas.

A produção de dados em regime de User Generated Content (UGC) – Situação que
abrange a realidade da chamada Web 2.0, na qual se evidencia o papel preponderante
20
<http://www.emc.com/leadership/digital-universe/iview/index.htm>
39
do próprio utilizador na criação e geração de conteúdos em regime colaborativo e de
partilha.

A produção de dados em regime de Machine-Generated Data (MGD) – Situação que
retrata o processamento automatizado de dados sem intervenção humana e que se
refere ao funcionamento de complexos sistemas integrados em ambiente de
computação contínua.
Para Simon Szykman21, diretor de informática do Departamento de Comércio Norte-
americano, os desafios do big data em relação aos dados podem ser divididos em: como
adquirir; armazenar; processar; transmitir e disseminar; gerenciar e manter; arquivar por longo
prazo; garantir a segurança; treinar pessoas para usá-los; pagar por tudo isso. Além disso, a
preocupação está como entender os dados de forma isolada e como relacioná-los. Para isso, a
sociedade precisa de novas teorias e tecnologias. Uma das principais aplicações de ter à
disposição uma grande quantidade de dados é descobrir algo novo. Isso, segundo Xexéo
(2013) pode se dar por detecções de padrões, levantamento de regras ou aprendizagem de
máquina.
4.3.4 Ciclo de vida do Big Data
Para por em prática os conceitos referentes aos 5Vs do big data, como já foram
descritos anteriormente neste trabalho no item 4.3.2, é necessário desenvolver uma visão
crítica sobre os dados a serem analisados. Esta visão é apoiada pelo conhecimento do ciclo de
vida ou fases que norteiam o big data a partir das considerações da área de Tecnologia da
Informação (TI).
Lastori (2013) divide em quatro fases o ciclo de vida do big data: acquire, organize,
analyze, decide, ou seja, aquisição, organização, análise e decisão respectivamente.
Aquisição: é a fase em que os dados são coletados através de diversas fontes
possíveis; podem ser através da web ou até mesmo de fontes de dados estruturadas. Esta fase
precede o armazenamento dos dados.
Organização: é o processo em que os dados são modificados para se adaptarem à
estrutura de análise e, também, é o momento de classificação desses dados antes de seu
armazenamento físico no banco de dados.
21
Informações retiradas da Revista Ciência Hoje, agosto de 2013.
40
Análise: também conhecida como analytics, é a parte do ciclo em que são aplicados
algoritmos matemáticos sobre os dados já classificados e armazenados. Esses algoritmos são
definidos a partir das regras de negócio, obtendo-se ao final do processamento, resultados
estatísticos. Algoritmos é conceituado como uma sequência finita de instruções bem definidas
com a finalidade de resolver um determinado problema computacional. As informações se
inserem nesse contexto como os dados de entrada, o algoritmo executa o processamento
dessas informações e o resultado são as informações. Segundo o dicionário Aurélio um
algoritmo é um: “processo de cálculo, ou de resolução de um grupo de problemas
semelhantes, em que se estipulam, com generalidade e sem restrições, regras formais para a
obtenção de resultado ou solução de problema”.
Analytics é definido como inteligência analítica, é a palavra-chave que encerra o ciclo
de vida do big data (NAFFAH, 2012). Isso porque, em essência, análise “...dá a idéia de que
se pode entender melhor uma situação ou ideia quando as suas diversas partes se encontram
como que soltas, separadas entre si para contemplação” (CONSULTAS, 2005). Com big data,
a diferença é que essa capacidade de se “entender melhor uma situação” se tornou
exponencial, uma vez que é possível realizar análises sobre dados volumosos e caóticos, tais
como os encontrados na internet, principalmente em ambientes de redes sociais.
No que se refere a fase de análise, os resultados estatísticos são os elementos mais
esperados para a conclusão da última fase do ciclo; o processo de tomada de decisão e,
consequentemente as ações a serem realizadas.
O fenômeno big data oferece às organizações novas possibilidades de obtenção de
importantes informações sobre seus mercados, competidores e seu negócio (VILLELA,
2013). Através do uso de analytics (i.e. Ferramentas de análise de dados), estas organizações
conseguem acessar, gerenciar e cruzar estes dados à procura de insights de informações
contidas neles. Assim, tais organizações podem, por exemplo, conseguir conhecer um
possível nicho consumidor emergente, identificar gargalos operacionais a fim de reduzir os
custos envolvidos na produção de algum bem ou desempenho de algum serviço.
Através do uso de analytics pesquisadores conseguem analisar informações de
milhares de pessoas e compreender o comportamento humano a um nível de população (The
Economist, 2013). Este tipo de entendimento do comportamento de grupos humanos tem
grande valor para as organizações modernas, pois fornece uma nova força motora para seus
negócios. Através deste entendimento, podem-se definir melhores estratégias de venda e
produção de bens de consumo, de forma a melhorar o desempenho e aumentar a
competitividade da organização. Este aumento de desempenho e competitividade representa
41
algumas das formas de geração de valor a partir da informação, valor este que é intangível se
comparado a outras forças motrizes dos negócios, como dinheiro e trabalho. Intangível, pois
não gera um valor direto para a organização (com dinheiro compra-se matéria prima, com
trabalho produzem-se bens e serviços), mas aplicado em conjunto com outros recursos
representa uma excelente ferramenta para o mundo dos negócios.
Uma demonstração prática desse poder de análise pode ser observada através dos
resultados do projeto Social Genome da rede de supermercados Wallmart. O objetivo do
projeto é melhorar seu sistema para recomendação de compras através de inteligência
analítica. As informações disponíveis pelo Wallmart (SOCIAL, 2013) mostram como é
possível realizar as recomendações através do cruzamento de informações postadas no twitter.
Através do recebimento da simples mensagem “I love Salt” postada pela usuária Hanna, o
sistema automaticamente enviou um e-amil para Juliana, também usuária do twitter,
sugerindo um presente de aniversário para sua amiga Hanna.
Para que seja possível realizar minimamente essas quatro fases que compreendem o
ciclo de vida do big data, no entanto, são necessários diversos componentes de hardware e
software. Além disso, são necessários especialistas na área de dados a fim de formar uma
arquitetura completa. Na área de TI esses especialistas, também são chamados de Data
Scientists (Cientista de Dados), são profissionais escassos e, portanto, muito valorizados nessa
área. Eles são capazes de interagir com sucesso entre todas as fases de suma importância no
tratamento de dados. São profissionais focados na obtenção dos resultados de valor,
imprescindíveis na garimpagem de petabytes de dados. Por sua polivalência, os cientistas de
dados têm a capacidade de atender a uma vasta gama de nichos. Esta versatilidade só é
possível mediante formações, especializações e pesquisas em áreas tais como estatística,
computação, programação, ciências sociais, entre outras.
Em poucas palavras, a arquitetura necessária para tratar big data é dividida em três
categorias: softwares para coleta de dados, infraestrutura de armazenamento de dados e
análise de dados. Algumas empresas tais como Amazon, Google, Yahoo, Facebook e IBM,
estão entre as maiores empresas que desenvolvem e utilizam essa arquitetura (BARBOSA,
2013). Para coletar o grande volume de informações essas grande companhias têm criado
centros de pesquisa de informação (DRAGLAND, 2013). A vantagem de tais empresas é que
seus serviços, por natureza, produzem grandes quantidades de informações sobre o
comportamento das pessoas, extraídos das pesquisas que fazem, das páginas que visualizam.
No entanto, mesmo pesquisadores que não estejam alocados nestas companhias conseguem
ter acesso aos dados. Ferramentas como o Wisdom, uma ferramenta de análise de dados
42
sociais de usuários do Facebook, garantem a seus usuários acesso a dados de enormes grupos
de indivíduos.
4.3.5 Usos e aplicações do Big Data
Hoje, várias áreas são guiadas por programas desenvolvidos a partir da análise de
informações a partir do emprego do big data. O big data se aplica a qualquer área em que
haja enormes desafios para extrair informações a partir de dados não convencionais ou sobre
dados extremamente volumosos que não podem ser atendidos pela estrutura tradicional.
Para Mayer-Schönberger e Cukier (2013), os usos do big data se aplicam tanto ao
setor público quanto às empresas privadas. Estudo realizado pelo Gartner (2013) mostra que
as três principais aplicações de big data do mercado são em marketing e vendas, performance
operacional e financeira, e inovação.
Neste item busca-se apresentar alguns exemplos
práticos dos usos e aplicações do big data presente em diferentes segmentos, para o
desenvolvimento deste item foram buscadas informações em sites e blogs de especialistas que
discutem o tema.
4.3.5.1 Big data e empresas
No âmbito comercial, a empresa americana FedEx, a mais famosa transportadora de
cargas do mundo, é pioneira no uso do big data22. A empresa desde a sua fundação em 1973,
quando operava em 25 cidades, monitorava os pacotes que transportava, o que resulta em um
enorme banco de dados. Nos anos 1980, a empresa tornou-se uma das primeiras companhias
privadas a escanear cada encomenda. Hoje algoritmos23 permitem aos computadores da
FedEx processar em tempo real e sem interrupção cerca de 2,5 milhões de transações diárias
realizadas em 220 países por 90 mil veículos e 690 aviões. A FedEx usa sensores que medem
a temperatura, a localização e a exposição à luz de pacotes. Esses dados são transmitidos
diretamente ao cliente.
22
Informações retiradas da revista Veja 2013. Disponível em:
http://ufmggei2013.files.wordpress.com/2013/08/veja-big-data.pdf
23
Na definição clássica, algoritmos são uma sequência de instruções, que permite que chegue a uma conclusão
sobre que tipo de ação tomar. Temos aquela definição clássica do Algoritmo sendo uma receita de bolo, que
nada mais é do que uma sequência de passos para chegar ao bolo pronto. A origem do termo remonta ao
matemático persa do século IX cujo nome entrou na corrente do pensamento ocidental pelo árabe clássico como
Al-Khwarizmi. A idéia de uma sequência algorítma foi inspirada na vida cotidiana. O conceito de um algoritmo
foi formalizado em 1936 pela Máquina de Turing de Alan Turing e pelo cálculo lambda de Alonzo Church, que
formaram as primeiras fundações da Ciência da Computação. Informações retiradas do site do Wikipédia.
43
No e-banking, o big data combina fonte de dados para detectar padrões de atividade
fraudulenta, como lavagem de dinheiro, fraude de cartões de crédito, entre outros. No
marketing de relacionamento, o conceito usa os dados para fidelizar clientes, conquistar
prospects, bem como informações transacionais e demográficas para maximizar o
relacionamento com os clientes e as margens de lucros (VEJA, 2013).
Com o volume de informações e dados gerados pela sociedade muitos setores
passaram a dar mais atenção para isso nos últimos tempos. Um exemplo é o da Zappos, um
site de compras americano, que lançou um serviço que recomenda produtos com base no
comportamento de seus usuários, tendo por objetivo identificar as tendências de compras dos
clientes/usuários.
Outras empresas também fazem mineração de dados de redes sociais em tempo real.
Ford Motor, PepsiCo, e Sudoeste Airlines por exemplo, analisam postagens de consumo sobre
suas empresas em sites de mídia social como o Facebook e Twitter para avaliar o impacto
imediato de suas campanhas de marketing e para entender como o sentimento do consumidor
sobre suas marcas está mudando24.
No Brasil a loja de departamento Renner é considerada também um exemplo de uso do
big data. Ela usa a tecnologia do big data para monitorar o fluxo de mercadorias de suas
filiais em todo o país, o que é feito em tempo real. Com isso é possível cruzar os dados de
localização dos caminhões com o nível de estoque das lojas e ainda reorganizar a mercadoria
entre as lojas com base em dados.
4.3.5.2 Big data e Saúde
Na área da saúde, o big data tem sido usado e contribuído para criar novos
medicamentos, tratamentos personalizados e entender a diversidade genômica de um país. Por
exemplo, usando o WTCCC25 (Wellcome Trust Control Consortium Case) foi identificada
uma variante genômica relacionada ao câncer que estratifica a população japonesa e chinesa,
seus perfis de expressão de genes associados e subtipos específicos de tumores gástricos.
24
< http://www.experienceclub.com.br/site/artigos-reader/items/brasil-big-data-e-grandes-oportunidades.html>
A Wellcome Trust Caso Controle Consortium (WTCCC) é um grupo de 50 grupos de pesquisa em todo o
Reino Unido, que foi fundada em 2005. Os objetivos WTCCC estão na exploração do progresso na compreensão
dos padrões de variação da seqüência do genoma humano, juntamente com os avanços nas tecnologias de
genotipagem de alto rendimento, e para explorar a utilidade, design e análise de estudos de associação ampla de
genoma (GWA).O WTCCC aumentou substancialmente o número de genes conhecidos por desempenhar um
papel no desenvolvimento de alguns dos nossos doenças mais comuns e, até à data identificado,
aproximadamente 90 novas variantes através de todas as doenças analisadas. Bem como confirmar muitas das
associações conhecidas, cerca de 28 no total, a WTCCC identificou também muitas novas variantes que afetam a
susceptibilidade à doença. (www.wtccc.org.uk/) acessado em 16 de outubro de 2013.
25
44
Na área médica, pesquisadores do Instituto de Tecnologia de Massachusetts (MIT), da
Universidade de Michigan, do Hospital Brigham, de Boston, e da Escola de Medicina da
Harvard desenvolveram uma ferramenta que determina com mais precisão a possibilidade de
ataques cardíacos e até risco de morte em pacientes que já sofrem do coração 26. Eles
estudaram os eletrocardiogramas (ECG) de um grupo de risco e encontraram indicadores
sutis, até então escondidos, que antecipam crises cardíacas. Ao observar fragmentos de dados
de ECG, médicos e enfermeiros jamais conseguiriam chegar a uma determinante para o
comportamento dos pacientes. Essa tarefa só foi possível ao enxergar o quadro todo, em
grande escala, através de técnicas de data mining27 e machine learning. Também na área
médica, um hospital de Santa Clara (Kaiser Permanente Santa Clara Medical Center,
Califórnia, EUA) comprou um software que armazena os dados dos pacientes ainda na
triagem, junto dos futuros diagnósticos destes mesmos pacientes. A partir do cruzamento com
informações e comportamentos de novos pacientes, o software consegue antecipar
diagnósticos, sintomas e sugerir tratamento, internações e exames complexos. O sistema
custou US$ 4 milhões e foi intregrado aos 37 hospitais da rede Kaiser. Hoje, ajuda médicos e
enfermeiros a chegarem a diagnósticos mais precisos e rápidos.
Ainda na saúde podemos citar a potencialidade do big data no caso da pandemia do
vírus H1N1 ocorrido em 2009 em todo o mundo. O exemplo é citado por Mayer-Schönberger
e Cukier (2013). Segundo os autores, essa nova forma do vírus da gripe se disseminou
rapidamente em diversos países. Os centros de prevenção e controle dos EUA, por exemplo,
tiveram dificuldade em realizar diagnósticos de forma rápida, pela demora dos pacientes em
procurar um médico ou pelo tempo necessário para realizar o processamento das notificações
dos casos. No mesmo período, um artigo publicado na revista Nature apresentou algumas
possibilidades de uso de recursos do sistema de buscas Google para previsão de ocorrência do
vírus por localizações determinadas como estados ou regiões. A análise não levou em conta
apenas os termos buscados pelos usuários, mas uma grande quantidade de modelos
matemáticos, construídos a partir de combinações entre a frequência de certos termos e a
disseminação do vírus através do tempo e regiões geográficas. A pesquisa processou 450
milhões de modelos matemáticos diferentes, comparando-os com casos de gripe registrados
entre 2007 e 2008. O resultado foi a combinação de 45 termos de pesquisas que, quando
26
Informações retiradas do site: http://www.adnews.com.br/tecnologia/uma-entrevista-didatica-sobre-big-data
Prospecção de dados ou mineração de dados (também conhecida pelo termo inglês data mining) é o processo
de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou
sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos
subconjuntos de dados. (Wikipédia, http://pt.wikipedia.org/wiki/Minera%C3%A7%C3%A3o_de_dados)
27
45
utilizados nesses modelos matemáticos, mostravam uma forte relação entre as previsões e os
dados oficiais posteriores. Portanto, a análise rápida de grandes volumes de dados, a partir de
uma estrutura rápida e com alto poder de processamento, poderia ser utilizada para prever
eventos.
Um hospital no Canadá usou tecnologia da IBM e da Universidade de Ontário para
monitorar em tempo real dezenas de indicadores de saúde de bebês prematuros. O cruzamento
permitiu aos médicos antecipar ameaças às vidas das crianças28.
E mais recentemente, temos os exemplos de aplicação do big data em doenças como
dengue e malária. A IBM29 fez uma parceria com pesquisadores da Universidade Johns
Hopkins e da Universidade da Califórnia para usar a análise de big data para prever a eclosão
de doenças, como a dengue e a malária. A pesquisa teve como objetivo compreender a
propagação de doenças em tempo real, a fim de utilizar os recursos da saúde pública da
melhor maneira possível. Mas ao invés de apenas prever a propagação de uma doença, os
pesquisadores da IBM e das universidades estão aplicando a análise de grandes conjuntos de
dados para ver como as mudanças na precipitação, temperatura e até mesmo a acidez do solo
podem afetar dramaticamente as populações de animais selvagens e insetos que carregam as
doenças. Os pesquisadores também estão fundindo essas informações com outros dados,
como os de aeroportos e tráfego nas estradas, para tentar entender melhor os surtos.
Para isso, a IBM criou um aplicativo open-source chamado Spatio Temporal
Epidemiological Modeler (STEM), que permite que qualquer tipo de dado seja rapidamente
combinado e correlacionado com dados de doenças.
4.3.5.3 Big data e Governo
Outro exemplo de aplicação do big data citada por Mayer-Schönberger e Cukier
(2013) são as “cidades inteligentes” (Smart Cities), que atualmente, segundo os autores, estão
sendo planejadas em diversos países e visualizam para um futuro próximo espaços urbanos
altamente intensivos no uso de por tecnologias de informação e comunicação. Sensores
disseminados em equipamentos de infraestrutura urbana, informações produzidas por
dispositivos pessoais de comunicação, redes sem fio, apps inteligentes, posts em mídias
sociais baseadas em geolocalização, serviços de computação em nuvem. Todos esses
elementos vislumbrados como parte essencial das cidades inteligentes – pelo menos do ponto
de vista tecnocrático das grandes empresas de TI – poderiam produzir e alimentar grandes
28
O Globo. Como funciona o Big Data. < http://oglobo.globo.com/infograficos/bigdata/>
Matéria completa está disponível no site: http://canaltech.com.br/noticia/saude/IBM
29
46
bases de dados, com o objetivo de reagir de forma rápida a demandas individuais e mudanças
no ambiente urbano.
Projeto como Cidades 202030 também são baseadas em estudos a partir do uso do big
data. Com o objetivo de desenvolver um novo modelo de cidade inteligente sustentável,
ecológica e economicamente por meio da análise das necessidades dos cidadãos aliada às
oportunidades de comunicação oferecidas pela internet e cada vez mais numerosos
dispositivos conectados à rede, o projeto pretende identificar as necessidades de usuários com
serviços públicos.
Além de integrar diferentes âmbitos e tecnologias, o principal atrativo e diferencial do
projeto Cidades 2020 é que a análise de dados obtidos em grande escala do comportamento
urbano do cidadão, mediante a integração dos grandes dados digitais, promete melhorar e
definir os serviços oferecidos, em áreas como, transporte, energia, meio ambiente e
comunicação31.
Além disso, já existem projetos mais ambiciosos de aproveitar as informações de
cidades inteligentes para gerar receita proveniente de anunciantes, levando a questões sobre
privacidade e uso ético da informação. Imagine o seguinte: e se uma telecom cruzar dados
demográficos e de geolocalização de seus assinantes e oferecer para empresas que desejam
saber onde seu público alvo circula na cidade, a fim de escolher o melhor ponto para uma loja.
Outra aplicação do big data foi registrada em 29 de Março de 2012, em que o governo
dos EUA lançou a Big Data Research and Development Initiative, dotada de um orçamento
inicial de 200 milhões de dólares, com o objetivo de acelerar o ritmo do desenvolvimento da
ciência e tecnologia, de fortalecer a segurança nacional e de transformar o processo de ensino
e aprendizagem. Antes dessa iniciativa o governo dos EUA já utilizava o big data para
atividades de espionagem à escala global, mas de forma clandestina32. O projeto PRISM,
conduzido pela National Security Agency (NSA), funcionou desde 2007 de forma secreta até
junho de 2013, momento em que os jornais britânicos Guardian e norte-americano
Washington Post revelaram as atividades daquela agência, com base em depoimentos feitos
por Edward Snowden, um ex-analista contratado pela NSA que abandonou os EUA, se exilou
na Rússia. O PRISM é capaz de registrar os conteúdos de todas as formas de comunicação
30
As smart cities do futuro deverão partir das pessoas e das comunidades onde vivem e trabalham. É um novo
paradigma na forma de fazer cidades, que exige repensar estratégias, tecnologias, modelos e processos urbanos
para responder aos atuais desafios ligados à qualidade de vida, ao equilíbrio do ambiente e eficiência dos
recursos naturais, às desigualdades e à exclusão social.
31
32
Revista IMasters Disponível: http://issuu.com/imasters/docs/revistaimasters5
Informações retiradas do site: http://issuu.com/telaviva/docs/ti_93/9?e=1344148/4817402
47
eletrônica a nível mundial, incluindo todos os emails, todas as chamadas de celulares, todas as
navegações feitas na Internet, todas as imagens e dados obtidos em satélites, bem como toda a
espécie de dados pessoais, empresariais, institucionais e governamentais que estejam sob
forma digital e circulem nas redes de telecomunicações. Segundo Washington Post o que é
preocupante sobre o PRISM não é a coleta de dados, mas sim o tipo de dado coletado33.
É importante destacar os projetos que estão em andamento também no Brasil. Em
setembro de 2013, foi anunciado que o big data irá monitorar população por meio do registro
celular. A Fundação Getúlio Vargas (FGV) está desenvolvendo um projeto de big data para o
monitoramento da população da Região Metropolitana do Rio de Janeiro a partir dos CDR das
ligações de usuários das operadoras celulares. Segundo Alexandre G. Evsukoff, professor da
FGV, o projeto vai identificar os padrões de mobilidade de um universo de 2 milhões de
pessoas e poderá ser utilizado para o desenvolvimento de politicas públicas e planejamento na
área de transporte e controle de epidemias34. O projeto conta com apoio da Fundação de
Amparo a Pesquisa do Rio de Janeiro (Faperj) e parceria com a Coppe-UFRJ e o
Massachusetts Institure of Technology (MIT). O seu objetivo é gerar informações relevantes
sobre o deslocamento das pessoas, permitindo o desenvolvimento de modelos preditivos que
poderão ser usados pela prefeitura que também apoia o projeto.
4.3.5.4 Big data e Política
Neste item busca-se apresentar as experiências do big data no âmbito da política
eleitoral, que se constitui no recorte de investigação sugerido no trabalho. Os exemplos
pioneiros são oriundos principalmente da política norte-americana. No Brasil pouco ainda se
discute sobre o emprego do termo em estratégias de marketing e comunicação política, em
processos eleitorais. Até o presente momento, nenhuma bibliografia ou pesquisa acadêmica e
científica deram conta da temática. A proposta deste item é de aprofundar as pesquisas ao
longo do desenvolvimento deste trabalho. A priori apenas é apontada e caracterizada, a partir
das pesquisas iniciais feitas na internet, sobre o uso do big data na campanha presidencial de
norte-americano Barak Obama em 2012. Cabe ressaltar, que as campanhas políticas de
Obama são consideradas pioneiras nos usos das tecnologias como mídias sociais e big data,
em estratégias informacionais, comunicacionais e de marketing.
33
< http://gizmodo.uol.com.br/o-que-e-prism/>
34
O Globo.<http://oglobo.globo.com/projetos/tirio_2013/mat2.asp>
48
4.3.5.4.1 Usos do Big data em Campanhas Eleitorais: a experiência americana
As campanhas do presidente norte-americano Barack Obama35 são consideradas
verdadeiros “case” de marketing político com o uso do big data. Os usos de tecnologias e
também das mídias sociais digitais contribuíram para a sua vitória nas duas disputas à Casa
Branca. A campanha nas redes sociais em 2012 se transformou no evento político mais
tuitado da história dos EUA36. Exemplo disso foi a foto do presidente abraçado à mulher,
Michelle Obama, comemorando a vitória que teve mais de 630 mil retweets, com mais de 20
milhões de mensagens, confirmando a influência das redes sociais na opinião pública. A foto
foi postada acompanhada da frase "Four More Years" (em português- Mais Quatro Anos).
No Facebook e teve 3 milhões de ‘curtir’, pulverizando todos os recordes da maior rede social
do mundo (STIVANIN, 2012).
Ainda em 2012, a campanha presidencial de Barack Obama contou com o uso da
tecnologia de informação, colocando em prática o conceito de big data para a conquista de
votos. Segundo Greenwald da Mit Technology Review (2013), durante os 18 meses finais da
campanha do presidente Obama, um grupo de análise de dados coletou e combinou milhares
de dados sobre todo o público votante dos Estados Unidos. A partir do resultado desta análise
foi possível determinar políticas e campanhas de marketing para influenciar o público mais
propício para ir às eleições e votar no atual presidente norte-americano. Na campanha um
gigantesco banco de dados foi estruturado, com registros de eleitores, suas preferências,
reações a abordagens de campanha já realizadas, além de publicações em mídias sociais como
Facebook e Twitter. Mais e mais dados foram adicionados por empresas especializadas em
hábitos de consumo. Essa base de dados foi utilizada para gerar microsegmentações que então
deram origem a aplicativos, ferramentas de campanha e estratégias de atuação diferentes para
uma infinidade de perfis de eleitores.
A campanha de Obama foi coordenada pelo especialista em dados Dan Wagner, que
respondia como diretor de segmentação do Diretório Nacional do partido (DNC). Wagner
tornou-se responsável pela coleta e análise de informações dos eleitores individuais por mala
direta e telefone. O especialista pediu ao departamento de tecnologia do DNC para
35
Em 6 de novembro de 2012, Obama ganhou 332 votos no colégio eleitoral, superando os 270 votos
necessários para que ele fosse reeleito como presidente. Com 51% de votos populares, Obama tornou-se o
primeiro presidente democrata desde Franklin D. Roosevelt a ganhar duas vezes a maioria dos votos populares.
(Informações retiradas do Wikipedia. < http://pt.wikipedia.org/wiki/Barack_Obama>)
36
Informações retiradas do site: <http://www.portugues.rfi.fr/americas/20121107-obama-o-tuiteiro-mais-curtidodo-mundo>
49
desenvolver software que poderia transformar em tabelas, o que ele chamou de Gerente de
Pesquisas (Survey Manager).
Na avaliação do especialista em uso de tecnologia na política e fundador do site
Personal Democracy Media, Andrew Rasiej37, falar o idioma da web será fundamental para
qualquer candidato conseguir se eleger num mundo cada vez mais hiperconectado. Segundo
Rasiej, os internautas pensam em rede, não confiam em hierarquia e questionam instituições e
até a ideia de Estados Nacionais. Uma das maneiras de alcançar esse público é pelo uso
intensivo da tecnologia, como ocorreu na última campanha de Obama em 2012. Para derrotar
Mitt Romney, a equipe democrata investiu muito em big data, ou seja, reuniu a maior
quantidade possível de dados de eleitores americanos e criou algoritmos e aplicações para
lidar com esse conteúdo coletado. O banco de dados da campanha era abastecido com
informações sobre os modos como as pessoas abrem o e-mail, tuítam ou publicam no
Facebook e sobre mudanças demográficas. Os dados vieram de campanhas passadas,
empresas especializadas (como Experian e Acxiom), redes sociais, assinantes do aplicativo
Obama for America38 e etc. Um volume gigantesco de dados, chegando a 4gb processados por
segundo, 8,5 bilhões de requisições ao banco de dados e 180 tb de armazenamento em três
data centers.
Toda a captação de dados na campanha de Obama em 2012 foi integrada. Enquanto
Romney trabalhava com o tradicional método de pesquisa, sabendo em termos gerais a
opinião de seus eleitores, Obama tinha dados fundamentais certeiros (ROSSI, 2012).
Todas as informações serviram para adaptar as estratégias da campanha de um modo
detalhista, a fim de comunicar mensagens diretamente de acordo com as necessidades de cada
grupo de eleitores americanos. Um exemplo do uso dos dados verificou-se que havia em
Nova York um público interessado por um tipo de programa noturno peculiar, um possível
jantar com celebridades, especialmente com a atriz Sara Jessica Parker. Esse grupo existia e,
verificou-se que tinham poder aquisitivo grande. Daí nasceu um concurso de doação para a
campanha. Quem doasse poderia jantar com ela e Obama. A estratégia também foi aplicada
com o ator George Cloney, em que mulheres de 40 a 42 anos manifestavam interesse em um
jantar na companhia da celebridade.
A aplicação das técnicas de análise de dados apresenta-de como potencialmente
decisiva para os resultados da eleição. A campanha de Obama utilizou os insights
37
Informações retiradas do site http://www.hexans.com.br/noticia/big-data-ajudou-obama-a-ganhar-eleicoes.html
, acessado no dia 16 de outubro de 2013.
38
http://barackobama.tumblr.com/
50
conquistados para ações one on one, ou seja, a campanha foi baseada em ferramentas do
marketing relacional e do marketing individualizado (O2O), muito utilizado também por
grandes empresas de sucesso na conquista de clientes.
Assim, toda estratégia de marketing da campanha de Obama foi extraída do marketing
que já se pratica no âmbito comercial. Marketing é visto como a ciência que se fundamenta na
identificação e interpretação de anseios do mercado para atendê-los, satisfazendo as
necessidades identificadas. O candidato americano buscou trabalhar a sua campanha eleitoral,
a partir do uso das informações coletadas e análise dos dados com a ajuda da ferramenta do
big data.
Foi, portanto, a partir das últimas eleições norte-americanas em 2012 que se colocou
como um desafio e tendência o conceito de big data empregado no âmbito da política
Os vários blogs39 e sites que tratam de política eleitoral, especificamente da americana,
abordam que os dados em grande volume provenientes de redes sociais, sistemas e emails e
outras ferramentas representam um desafio tanto pela capacitação operacional de manejá-los e
armazená-los de maneira estratégica para potencializar o negócio ou uma ação, com as
estratégias de campanhas dos candidatos americanos.
Os dados mostram que, antes do dia da votação, cada convenção dos partidos gerava
em torno de 1 terabyte de dados em e-mails, twitters, streaming de vídeo e pelo uso de
internet móvel. Durante o último debate entre o democrata Barack Obama e o republicano
Mitt Romney, quando mencionada a intenção do republicano de extinguir as transmissões
públicas de televisão, devido aos autos custos para o governo, 10,3 milhões de mensagens no
Twitter foram geradas. O aumento de seguidores de perfis favoráveis ou contrários a essa
medida, que foram de igual tamanho, indica o quanto a disputa acirrada entre os dois
candidatos.
Episódios como este - última campanha eleitoral (2012) do presidente norte-americano
Barak Obama -, mostram o poder de influência de organizações que podem analisar o grande
volume de dados gerado pelo fenômeno big data sobre os indivíduos. Isso fortalece ainda
mais a proposta de investigação desta pesquisa de doutorado de pesquisar se há uma tendência
de usos do big data também no Brasil, principalmente nas próximas eleições.
39
Informações retiradas do blog disponível em <http://www.globalweb.com.br/2012/11/eleicoes-americanasevidenciam-tendencia-de-big-data/>
51
4.3.5.4.2 Big data eleitoral: conceito e primeiras iniciativas
Com o aparecimento de novas tecnologias e com o advento das redes sociais e do
reconhecimento de seu papel nas decisões dos eleitores, novas ferramentas de pesquisas
surgem com o objetivo de desvendar o comportamento humano. As manifestações dos
usuários nas redes sociais estão sendo frequentemente monitoradas com o objetivo de
identificar e decifrar suas opiniões. As pesquisas tradicionais e o monitoramento das redes
sociais combinados, além de técnicas estatísticas adequadas, formam o big data eleitoral,
utilizado para melhor compreensão do comportamento do eleitor. O cientista político e
professor Adriano Oliveira (2013) define big data eleitoral como “um conjunto de dados
específicos para entender os fenômenos eleitorais” (OLIVEIRA, 2013). Oliveira assinala que
são quatro as fontes de informação para entender uma conjuntura política: pesquisas,
estratégias, comunicação e imagem. Sem elas nenhum candidato pode desenvolver uma boa
campanha eleitoral.
Ainda sobre isso, Oliveira (2013) diz que as tradicionais pesquisas qualitativas e
quantitativas continuam a contribuir para a interpretação do comportamento das pessoas, em
particular, das suas escolhas. Entretanto, com o advento das redes sociais e do
reconhecimento de que emoções e sentimentos incentivam as decisões dos eleitores, novas
ferramentas de pesquisas surgem com o objetivo de desvendar o comportamento humano e
que de forma alguma devem ser desconsideradas nas estratégias de comunicação numa
campanha eleitoral (OLIVEIRA, 2013).
4.3.5.4.2.1 Primeiras iniciativas
Vislumbrando a era do big data, já apontada e discutida anteriormente nesse trabalho,
iniciativas mercadológicas brasileiras têm buscado aprimorar as suas técnicas de coleta e
análise de dados e informações para finalidades eleitorais. Exemplo disso é a E.life,
considerada líder na América Latina em Inteligência de mercado e gestão de relacionamento
nas redes sociais, e a Contexto Estratégica, empresa especialistas em estratégias políticas, que
lançaram no início de novembro de 2013 em Brasília, o Big Data Eleitoral. Trata-se de uma
base de dados crescente e contínua, com milhões de informações classificadas e analisadas
por diferentes tipos de hábitos e padrões de comportamento de eleitores e políticos brasileiros
nas redes sociais.
Oliveira (2013) afirma que o Big Data Eleitoral é um instrumento de aproximação
entre os políticos e a sociedade, pelo conceito de “tribos de interesse”. O serviço incorpora a
52
infraestrutura de big data e as ferramentas de business intelligence e que são aplicadas as
análises de pesquisas quantitativas e qualitativas tradicionais para traçar estratégias políticas.
A proposta do serviço Big Data Eleitoral é coletar, classificar e analisar os desejos da
sociedade, o comportamento de eleitores e políticos e os movimentos sociais que tenham
quaisquer relações com o tema. A metodologia utilizada pelo Big Data Eleitoral envolve
indicadores como pesquisas eleitorais quantitativas, pesquisas qualitativas e dados agregados
das redes sociais.
Faz parte, também, do Big Data Eleitoral o monitoramento do Twitter de alguns
políticos brasileiros com o objetivo de analisar suas principais citações, participações e
interações nessa rede social. O monitoramento está sendo feito desde 11 de setembro de 2013
até as eleições de 2014. Entre os politicos monitorados pelo serviço estão a presidenta Dilma
Rousseff (PT), o governador do Rio de Janeiro Sérgio Cabral Filho (PMDB), o profeito do
Rio Eduardo Paes (PMDB), Aécio Neves (PSDB), Marina Silva (Rede PSB), Antônio Carlos
Magualhães Neto (Dem), o governador do Paraná Beto Richa (PSDB), o prefeito de Curitiba
Gustavo Fruet (PDT).
4.4
MÍDIA, POLÍTICA E MARKETING
Antes de adentrar numa discussão em torno da informação, comunicação e marketing
político, é necessário uma pequena introdução do tema mídia e política. Sabe-se que numa
sociedade cada vez mais mediática e tecnológica, os usos que a política faz dos meios de
comunicação disponíveis, se tornam primordiais em práticas políticas, principalmente em
campanhas eleitorais.
4.4.1 Relação entre Mídia e Política
Percebe-se que não é de hoje que a comunicação mantém um importante diálogo com
a política. O surgimento das mídias eletrônicas – como o rádio, a televisão e o computador -,
importantes meios de divulgação em massa de ideias das campanhas eleitorais, contribuem
para que as informações atinjam maior número de pessoas. Influenciar nas decisões dos
eleitores é o objetivo fundamental das estratégias de comunicação adotadas pelos assessores
de comunicação e políticos nas campanhas eleitorais. Para Miguel (2002) é necessário o
reconhecimento de que a mídia é um fator central da vida política contemporânea. “É ocioso
alimentar a nostalgia de “tempos aureos” da política, quando imperava o verdadeiro debate de
ideias sem a preocupação com a imagem ou a contaminação pelas técnicas da publicidade
comercial” (MIGUEL, 2002, p. 158).
53
O desenvolvimento dos meios de comunicação, segundo Veiga e Godim (2001)
possibilitaram que as pessoas dirigissem sua atenção para um único assunto. Esses meios,
assim, detêm grande penetração social, pois submetem as pessoas a uma homogeneização de
opiniões.
É bastante visível que o desenvolvimento dos meios de comunicação de massa,
particularmente o rádio e a televisão, imprimiu um novo ritmo aos processos sociais
e políticos. Uma de suas maiores conseqüências foi a de aproximar o candidato à
realidade cotidiana de seu eleitorado, minimizando o papel do partido nesta
mediação. (VEIGA, GODIM, 2001. p.4).
De acordo com Almeida (2002), o poder da mídia está na sua capacidade de irradiação
política que torna o Estado e os políticos mais visíveis e mais vulneráveis às negociações
necessárias para a obtenção desta visibilidade.
Assim, hoje, existe praticamente um consenso entre os pesquisadores de que em todas
as formas de regimes políticos, especialmente os democráticos, o papel da mídia na política
tem sido de grande importância (ANTONIUTTI, 2004). Antoniutti (2004) observa também
que de acordo com as pesquisas realizadas na área de comunicação política, as transformações
tecnológicas e a realidade sóciopolítica têm levado à redefinição de estratégias informativas e
comunicativas, buscando o máximo de eficácia de seu uso.
A revista Comunicação & Política fundada em março de 1983 foi fundamental para
dar visibilidade e destacar os estudos de comunicação política (RUBIM e AZEVEDO, 1998).
Rubim e Azevedo (1998) em seus estudos apontam que, a temática mídia e política, no Brasil
passou a ser discutida no início da transição democrática, envolvendo a mobilização da
sociedade civil e a participação da mídia na campanha das diretas. Depois, os estudos voltamse ao processo eleitoral de 1989, marcado pelas campanhas políticas de Fernando Collor de
Mello e Luís Inácio Lula da Silva, enfocando a análise dos discursos, a composição e o perfil
do eleitorado brasileiro e suas predisposições quanto às instituições políticas, a participação
da mídia na construção dos cenários de representação política, as estratégias de comunicação
das campanhas eleitorais, com destaque para o horário eleitoral gratuito. Esses autores
observam que sem dúvida, a eleição presidencial de 1989, realizada depois de 29 anos sem
eleições diretas para presidente, aparece como acontecimento detonador de um boom
imediato e posterior de reflexões sobre o enlace mídia e política. Pode-se afirmar que este
acontecimento eleitoral, ao fazer emergir em toda sua potência estas novas conexões entre
mídia e política, começa verdadeiramente a conformar um campo de estudos sobre
comunicação e política no país, perpassado por olhares sintonizados com esta nova
circunstância de sociabilidade acentuadamente midiatizada (RUBIM; AZEVEDO, 1998).
54
A partir de 2000, estudos de comunicação e política passaram a ter a internet como
principal ambiente de discussões acadêmicas e científicas. Pesquisadores procuram
compreender fenômenos como representação e participação política on-line, democracia
digital, campanhas virtuais e influência da web no contato com a diferença politica, entre
outros temas (GOMES et al., 2009; MAIA, GOMES, MARQUES, 2011). Campanhas
políticas contemporâneas têm apostado na internet como meio alternativo para veiculação
eleitoral e que são próprios do ambiente virtual (GOMES et al., 2009). Porém numa pesquisa
inicial, nenhum estudo foi encontrado, explorando mesmo na Ciência Política ou
Comunicação, o tema da pesquisa proposta neste trabalho. Isso só reforça a importância da
discussão em torno da apropriação do big data em campanhas eleitorais.
Para o entusiasta da política na rede, Canavilhas (2009) é graças a Internet que a
política parece ter encontrado uma forma de retomar o contato direto com o eleitorado,
evitando assim intermediários, como por exemplo, a imprensa. O autor observa que os
políticos americanos desde 2004 apostam nas potencialidades comunicativas e informacionais
da Internet. A blogosfera foi um fenômeno em foco, com Howard Dean, candidato à
nomeação democrata, na época ele foi o primeiro a criar um blogue. Esta aposta na Internet
permitiu-lhe abrir vias diretas no contato com o eleitorado e arrecadar 15 milhões de dólares
para apoio à campanha. Da mesma forma, na corrida à Casa Branca, Bush e Kerry também
apostaram no meio, criando diários de campanha na blogosfera. Mas foi a partir da campanha
de Barack Obama em 2008, que a Internet passou a ser vista como um novo elemento
importante na manobra de um candidato. Obama utilizou quase todas as aplicações online
disponíveis no momento. Além disso, criou espaços nas redes sociais, como, por exemplo,
Obama Everywhere e só no Facebook chegou aos 320 mil utilizadores. Obama arrecadou
ainda 28 milhões de dólares de apoio, o que lhe permitiu manter alguma distância em relação
aos adversários. Desde a experiência do presidente norte-americano Barack Obama,
campanhas políticas têm apostado na Internet como meio alternativo para a aplicação do
marketing político e eleitoral.
4.4.2 Informação e Marketing na Política
O marketing é uma das mais antigas estratégias utilizadas no mundo, para divulgação
e interesse de vendas e produtos, ou do que se pretende realizar. Mas, foi somente no século
XX é que se tornou sistematizado, em razão da grande concorrência enfrentada pelas
empresas. Nessa época os empreendedores passaram a entender que, para criar novos
mercados, seria necessário desenvolver novos produtos e serviços, oferecendo maior
55
variedade, se opondo às técnicas da época de simplesmente abastecer o mercado com o que já
era produzido. Após a segunda metade do século XX com a obra “Prática de Administração
de Empresas”, de autoria de Peter Drucker, o marketing passou a ser visto como filosofia,
vindo a ser estudado e aplicado por empresários, executivos, consultores e acadêmicos.
Marketing pode ser definido como uma área do conhecimento que “engloba todas as
atividades concernentes às relações de troca, orientadas para a satisfação dos desejos e
necessidades dos consumidores visando alcançar determinados objetivos de empresas ou
indivíduos e considerando sempre o ambiente de atuação e o impacto que essas relações
causam no bem estar da sociedade” (LAS CASAS 2006 p.10).
O conceito de Marketing evolui de acordo com as mudanças e necessidades da
sociedade. Um entendimento bem aceito, pelos principais autores é aquele publicado pela
American Marketing Association, que esporadicamente revê a sua definição. A última revisão
feita pelo organismo foi em 2007, quando definiu marketing da seguinte forma: “Marketing é
a atividade, conjunto de instituições e processos para criar, comunicar, distribuir e efetuar a
troca de ofertas que tenham valor para consumidores, clientes, parceiros e a sociedade como
um todo” (tradução livre do autor). Até então, a AMA utilizava a definição que afirmava que
“Marketing é uma função organizacional e um conjunto de processos para criar, comunicar e
distribuir valor aos clientes e para administrar o relacionamento com clientes de forma que
beneficie a organização e os seus Stakeholders” (AMA 2008)
As contínuas mudanças ambientais influenciam a maneira de exercitar a política,
principalmente em tempos de mídias participativas, como as redes sociais digitais. Assim,
entendemos que a tarefa do marketing no segmento da política torna-se extremamente
complexa, arriscada e cada vez mais necessária para reduzir os riscos do processo político. A
informação sempre foi o condutor de todos os processos eleitorais, principalmente na
aplicação de estratégias de comunicação e marketing político.
Ao lançar a discussão sobre a necessidade de se buscar informações para se trabalhar o
marketing político, busca-se algumas considerações e aportes no marketing de
relacionamento, considerado por muitos especialistas como o marketing do futuro.
A constatação de que a informação é condição imprescindível à prática do marketing é
consistente. Amaral (1998) contribui para a ratificação dessa constatação, ao afirmar que a
informação é um fator imprescindível para impulsionar o desenvolvimento da sociedade
constituindo-se em um insumo de fundamental importância de geração de conhecimento que,
por sua vez, possibilitará, de modo eficiente, a satisfação das diversas demandas da população
(AMARAL, 1998, p 17)
56
Para entender a necessidade da informação na construção de estratégias de marketing
em vários segmentos, apresenta-se uma pequena discussão histórica e evolutiva do marketing.
Para Dantas (2006) até 1925, o que prevalecia no ambiente de negócios era uma
orientação para a produção, cuja concentração era na eficiência de fabricação. Entre 1925 e
1950, a orientação para a produção deu lugar à orientação para vendas, em que a concentração
era sobre a venda de produtos. Entre 1950 e 1990, a orientação prevalecente foi a orientação
para marketing, cuja concentração era sobre as necessidades e desejos dos clientes. Nessas
três orientações, o que se buscava era, essencialmente, a conquista de novos clientes para as
organizações. Até que a pesquisa realizada pelo TARP mostrou que manter clientes era mais
barato do que conquistar novos. Essa pesquisa parece ter sido uma espécie de “divisor de
águas” no marketing, já que gerou uma quebra de paradigma na postura adotada até então.
Dantas (2006) afirma que a conquista de novos clientes, que marcava tão intensamente a
cultura de marketing até 1990, deu lugar à retenção de clientes, em que a segmentação
baseada no conhecimento do cliente passou a ser de singular importância. A partir dessa nova
postura, novo valor passou a ser atribuído aos sistemas de informação de marketing. As
organizações passaram a perceber que a obtenção de informação de qualidade sobre o cliente
podia gerar diferencial competitivo. Este novo ponto de vista deu origem ao que se
convencionou chamar de marketing de relacionamento que além de ser aplicado no âmbito
empresarial também ganhou destaques na política, principalmente em períodos eleitorais.
Regis McKenna foi o primeiro autor a divulgar o marketing de relacionamento ao
mundo corporativo, como uma forma de atender os relacionamentos necessários entre a
empresa e seus clientes.
Na obra de 1993 definiu Marketing de Relacionamento ou pós-marketing (como ousou
chamar) ” como a construção e sustentação da infra-estrutura dos relacionamentos com os
clientes. “Surgido na década de 90, o Marketing de relacionamento inverteu o papel das
empresas no que concerne ao atendimento de seus clientes. Se até então o Marketing tentava
atender os desejos dos consumidores, hoje em dia o Marketing tenta ouvir as suas demandas
antes de atendê-las. MCkenna afirma que a mudança no Marketing após os estudos de
relacionamento com os clientes foram “impulsionados pelo enorme poder e pela disseminação
onipresente da tecnologia” (MCKENNA 1993).
O marketing de relacionamento deve ser utilizado com o objetivo de conquistar e
fidelizar os clientes, seja aqueles que compram um determinado serviço, produto ou até
mesmo elegem um político. Esse tipo de marketing inclui desde a reunião com eleitores até a
análise de dados sobre eleitor individual, o que facilita uma comunicação recíproca contínua,
57
preservando desse modo os eleitores e enfatizando a sua fidelidade. Os profissionais do
marketing de relacionamento devem ser abertos para transferir informações e construir
capacidades individuais, grupais e organizacionais.
Marketing Político e Marketing Eleitoral podem unir-se com o Marketing de
Relacionamento, construindo estratégias focalizadas num público-alvo, tornando-o fiel até a
hora de ir para as urnas votar (ANHAI, 2007).
4.4.3 Marketing Político e Marketing Eleitoral: evolução e diferenças
A migração de conceitos e práticas do universo empresarial para a política tem-se
tornado, no mundo todo, a tendência predominante nas últimas décadas. Kotler (1975)
considera que o marketing político é comparável ao marketing comercial seja através de seus
conceitos e ferramentas, seja através dos modelos de comportamento do consumidor.
O marketing político engloba ferramentas de publicidade, jornalísticas, técnicas
teatrais, musicais, sensoriais, humorísticas e de psicologia. Além disso, são usadas pesquisas,
análises estatísticas e qualitativas ao máximo. Tudo é planejado e unido a um profundo
entendimento do ser humano e seus anseios.
O marketing político surgiu em 1952 e pode ser definido como um conjunto de
técnicas e procedimentos cujo objetivo é avaliar aspectos psicológicos do eleitorado, visando
embasar estratégias para aumentar a aceitação do candidato junto à população. Basicamente
centra-se: i) na imagem dos candidatos, dos partidos políticos e dos adversários, ii) nos
aspectos psicológicos dos eleitores e, por fim, iii) no acompanhamento de todo o processo
eleitoral, intervindo de modo ativo conforme os objetivos pretendidos (FIGUEIREDO, 2000).
Na versão oficial, a primeira vez que um candidato utilizou uma grande empresa de
comunicação numa campanha presidencial foi em 1952, nos EUA com o general Dwight
Eisenhower (1890-1969). O general contratou a agência publicitária BBDO para auxiliá-lo na
campanha presidencial americana daquele ano. A principal função da empresa de
comunicação era adaptar a linguagem de Eisenhower a mídia eletrônica – rádio e televisão -,
afinal os meios ganhavam uma importância cada vez maior no jogo democrático. Também na
campanha de Eisenhower foi feita a primeira pesquisa de boca de urna, processada por um
computador Univac I, do tamanho de um apartamento de tamanho médio e divulgada 45
minutos depois de encerrada a votação, dando a vitória ao general, fazendo ingressar o
marketing político.
No Brasil, Prudente de Morais em 1884, terceiro presidente do Brasil, foi quem
inaugurou o conceito de comunicação e marketing político no Brasil. Uma das suas ideias
58
iniciais foi usar jornais para alcançar a população e mostrar aos eleitores seu trabalho já
desenvolvido como “presidente de São Paulo” - governador da época -. Morais elaborou
cartões de boas festas de fim de ano e distribuiu para os eleitores. Além disso, também usava
o telégrafo e uma lista de eleitores para se aproximar do eleitorado. Suas ações de
comunicação eram baseadas no seu carisma para atrair eleitores. Além disso, visitava várias
cidades a cavalo. Isso lhe rendeu uma imagem de político preocupado com o país e com as
cidades além das capitais.
Os EUA, berço da difusão dos meios de comunicação e propaganda eleitoral, na
década de 60, teve Kennedy como um presidente da era da televisão, que venceu o seu
oponente Richard Nixon num debate. Já no Brasil Getúlio Vargas, por sua vez, foi o primeiro
ex-presidente a ter um profissional de marketing, o jornalista Lourival Fontes, que foi a Itália
fazer um estágio para aprender com os assessores do ditador fascista, Benito Mussolini, como
fazer campanhas eleitorais e programas de comunicação ideológica, que redundaram depois
na criação do Departamento de Imprensa e Propaganda (DIP) e do programa de rádio “A hora
do Brasil”. Jucelino Kubitschek40, o JK como era conhecido na época, foi outro político que
usou estratégias do marketing político. As suas campanhas eleitorais tiveram como premissa a
máxima “para ser político, é preciso tornar-se conhecido”. JK construiu com a ajuda do
marketing uma imagem de trabalhador incansável e modernizador (QUEIROZ, TAVARES,
2007).
Mas, foi na campanha eleitoral de 1989 que o marketing político brasileiro ganhou
notoriedade até mesmo nos estudos acadêmicos e científicos. Esse ano foi muito importante
para a história política do Brasil. Depois de 21 anos de ditadura militar e cinco anos de
mandato do Presidente Jose Sarney, eleito pelo Colégio Eleitoral, o país passa a ter a sua
primeira eleição presidencial desde 1962. A disputa se deu em torno de Fernando Collor de
Mello e o petista Luís Inácio Lula da Silva. A campanha de Fernando Collor foi a que mais
chamou atenção dos pesquisadores porque contava com um importante instrumento de
diferenciação que era o seu programa de televisão. Pela primeira vez na historia de uma
campanha política no Brasil um candidato explorava de forma inteligente a tecnologia e
efeitos especiais disponíveis na preparação dos programas de televisão. A respeito dessa
campanha Figueiredo e Figueiredo Jr. (1990) argumentam que Collor escolheu um caminho
totalmente novo, usando, pela primeira vez, a televisão de forma competente em uma
40
Durante todo o seu mandato como presidente da República (1956-1961), o Brasil viveu um período de
notável desenvolvimento econômico e relativa estabilidade política. Com um estilo de governo inovador
na política brasileira, Juscelino construiu em torno de si uma aura de simpatia e confiança entre os brasileiros
(WIKIPÉDIA, 2013).
59
campanha presidencial. Enquanto os grandes partidos ainda estavam discutindo quem seriam
os seus candidatos, Collor já estava enviando a sua mensagem aos brasileiros. O fenômeno
Collor representou um grande exemplo de sucesso do uso de marketing político e inteligência
de marketing. Para os especialistas, o marketing político no Brasil passou a existir no Brasil
graças às práticas e inovações introduzidas pela campanha presidencial de 1989 do candidato
Collor de Mello.
Nos dias atuais a era de democracia, o papel da mídia na política torna-se importante a
cada dia, pois a sociedade experimenta um novo mundo de informações e inovações que
propiciam o uso das ferramentas de comunicação.
Todos esses políticos sabiam da
importância da mídia, e sempre procuravam alguma forma de estar perto do povo, muitas
vezes até usaram o marketing como aliado das campanhas eleitorais.
É válido dizer que assim como o norte-americano Barack Obama em 2008 e 2012
inaugurou novas formas de se fazer campanhas políticas na atualidade com o uso intensivo
das tecnologias (redes sociais digitais) e dos instrumentos do big data, Collor de Mello em
1989 representava para Brasil uma grande inovação em campanhas eleitorais mediáticas.
Esses fatos representam maneiras diferenciadas de figuras públicas comunicarem ao
grande público suas mensagens. Elas o faziam da forma que lhes era acessível e, assim,
construíram suas imagens e se diferenciaram da maioria da população ao ostentar
publicamente sua capacidade de poder, força e liderança.
Nos dias de hoje estudiosos como Figueiredo (1994) e Kotler (1998) tomam como
ponto de partida do marketing político as necessidades e os desejos da população,
apresentadas pelo político, de forma que poderão ser melhores divulgadas por um profissional
de comunicação ou marketing. E para entender isso, o marketing político conta com diversos
recursos de monitoramento da opinião pública tais como pesquisas survey e qualitativas, que
informam os políticos sobre necessidades, expectativas e visões dos eleitores (RIBEIRO,
2002; KOTLER, 1999) Ele possibilita, aos candidatos, adaptar, rever, modificar ou reforçar
suas estratégias de apresentação, seus discursos e suas práticas, na cena pública.
Para Figueiredo:
O marketing político é um conjunto de técnicas e procedimentos cujo objetivo é
avaliar, através de pesquisas qualitativas e quantitativas, os humores do eleitorado,
para, a partir daí, encontrar o melhor caminho para que o candidato atinja a maior
votação possível (FIGUEIREDO, 2000, p.14).
A partir do conjunto de informações disponíveis, o marketing manipula os dados e os
políticos se esforçam, através do marketing político, para estabelecer um elo simbólico com o
60
eleitorado, recorrendo a saberes, normas, valores e universos de referência supostamente
partilhados.
Uma questão central, portanto, nessa discussão, é entender como as práticas de
marketing estão sendo desenvolvidas na política, principalmente a partir do uso que se faz do
big data. Assim como nas empresas, tais técnicas podem buscar objetivos de longo prazo
através da construção de relacionamentos, satisfação e, consequentemente, maior interesse e
confiança por parte do eleitor/cidadão.
Cabe aqui nessa discussão estabelecer relações e diferenças entre os tipos de
marketing empregados na política. Gomes (2001) relata que o emprego de formas
publicitárias na comunicação política é justificado pela introdução dos chamados “marketing
político” e “marketing eleitoral”. No Brasil, os dois termos vêm sendo usados
indiscriminadamente, porém, há diferenças semânticas entre eles: quando falamos em
marketing político, estamos tratando de uma estratégia permanente de aproximação do partido
e do candidato com o cidadão em geral. O marketing eleitoral trata de uma estratégia voltada
para o eleitor, com o objetivo de fazer o partido ou candidato vencer uma determinada
eleição. A união das duas estratégias deve ser entendida como uma técnica de reflexão
dirigida a procurar, criar e desenvolver as satisfações necessárias que se complementam a
curto, médio e longo prazo. O autor salienta ainda, por exemplo, que o conceito de marketing
político é mal empregado. Este se refere às ações estratégicas de marketing de longo prazo
por parte dos partidos e políticos.
Na prática, o que ocorre geralmente é que as ações de marketing restringem-se ao
processo exclusivamente eleitoral e perduram apenas até o momento do voto do eleitor.
Assim, o marketing eleitoral se aplica integralmente à eleição, a aplicação do marketing às
técnicas eleitorais no período eleitoral, a imagem que o candidato irá passar a seus eleitores
para a consecução dos votos.
É somente um instrumento de comunicação em campanhas. Abrange todas as técnicas
de comunicação disponíveis no mercado. É uma estratégia mais global, que inclui – além da
comunicação – a pesquisa, o planejamento estratégico, o uso de especialistas e a articulação
de um conjunto de decisões e ações necessárias para a atuação política de modo geral, além da
eleitoral estrito senso (RICHERS, 2007).
O objetivo do marketing eleitoral consiste em implantar técnicas de marketing político
e comunicação social integrados, de forma a angariar a aprovação e simpatia da sociedade,
construindo uma imagem do candidato que seja sólida e consiga transmitir confiabilidade e
segurança à população elevando o seu conceito em nível de opinião pública.
61
O marketing eleitoral preocupa-se, portanto, com a formação da imagem em curto
prazo. O fato crucial é o tempo. Assim, os candidatos precisam desenvolver um trabalho
contínuo e sistemático de formação de imagem, objetivando aumentar seu poder de influência
sobre o eleitor na decisão de voto. O tempo que é destinado a essa atividade não ultrapassa os
limites que envolvem os pleitos eleitorais, acabando, portanto, no dia da votação e não
passando de um processo de comunicação áudio visual que busca ofertar a imagem de um
candidato em busca do poder. Pode-se afirmar que o marketing eleitoral é um serviço de
venda enquanto marketing político é um serviço de pós-venda.
Pacheco (1994) afirma que o marketing eleitoral descende de Maquiavel, pois parte da
aceitação do "Homem como ele é", e não de "como gostaríamos que ele fosse". “De essência
realista e fenomenológica, o marketing "inveja" as ciências exatas, às quais se inclina. Daí,
seu apreço à quantificação e ao uso da pesquisa científica como seu instrumento principal:
"Marketing é Pesquisa”” (PACHECO, 1994, p.147).
4.5
COMUNICAÇÃO POLÍTICA E CAMPANHAS ELEITORAIS
Neste item busca-se uma discussão inicial sobre o que se entende por comunicação
política e campanhas eleitorais, bem como o papel das pesquisas na política, levando-se em
considerações as informações de eleitores presentes em diversos ambientes, principalmente
nas redes sociais digitais. O objetivo deste item, durante a investigação deste trabalho, é
apresentar as mudanças e transformações nas campanhas eleitorais a partir do uso do big data.
4.5.1 Comunicação Política (Em desenvolvimento)
A comunicação política moderna associada às campanhas eleitorais ocorre num
contexto de forte incorporação de saber, com aplicação dos esforços comunicativos em torno
das lideranças, e utilização significativa de recursos financeiros em terrenos dominados pelos
meios de comunicação de massas com destaque para a televisão e particularmente a internet.
A comunicação política é uma área vasta em expansão quer sob o ponto de vista da
reflexão teórica estudada por diversos pesquisadores, quer sob o ponto de vista da sua prática
em numerosos domínios da vida cívica.
Hoje em dia é importante destacar que a comunicação política engloba o estudo do
papel da comunicação na vida política em sentido amplo, integrando tanto os meios, como as
pesquisas. O marketing político e a publicidade, com um interesse particular nos períodos
eleitorais. Afinal, a comunicação política designa qualquer comunicação que tenha por objeto
62
a política. Esta definição demasiada extensiva tem, contudo, a vantagem de ter em conta duas
grandes características da política contemporânea: o alargamento da esfera política e o lugar
crescente concedido à comunicação, com o peso dos meios e da opinião pública através das
pesquisas. Assim, o conceito de comunicação política se torna apropriado para uma
investigação na área da Ciência da Informação, que consiste numa ciência interdisciplinar,
que busca em outras áreas metodologias e conceitos para suas investigações.
O que se entende por comunicação política? Canavilhas (2007) observa que a
comunicação política tem evoluído ao longo dos tempos. Do estudo das relações entre
governos e eleitorado, o seu objeto progrediu para um campo mais vasto que inclui tudo o que
está relacionado com o papel da comunicação na vida política.
4.5.2 Campanhas Eleitorais (Em desenvolvimento)
Norris (2000) diz que as campanhas eleitorais constituem um dos momentos mais
intensos do processo de competição política. O seu formato moderno associa-se às
transformações da democracia e dos partidos, bem como ao desenvolvimento das técnicas e
tecnologias de comunicação, instrumentos que obedecem a uma gestão profissionalizada,
largamente dominada por consultores externos às máquinas partidárias.
A autora destaca ainda que o modo de organização das campanhas eleitorais não
deixou de acompanhar as mudanças operadas no setor dos meios de comunicação de massas.
A reconfiguração da imprensa, o forte desenvolvimento da indústria televisiva e a
contribuição de novos instrumentos de comunicação interpessoal, pela via da Internet e de
outros meios, consolidam a sociedade da informação por onde se traçam, também, as
estratégias de comunicação política e eleitoral (NORRIS, 2000).
Ao se referir sobre as campanhas eleitorais em sua pesquisa Massuchin (2013) observa
que:
O processo denominado como modernização das campanhas diz respeito há uma
série de práticas tradicionais que foram sendo substituídas por outras ‘modernas’ e
que marcam o final do século XX e início do século XXI, sendo neste contexto de
mudança e transformação que emerge a internet como uma nova ferramenta
midiática apropriada pelos partidos e candidatos para colocar em prática estratégias
de campanha. Associado a isso também está a menor partidarização dos eleitores e o
enfraquecimento das bases ideológicas. Dessa forma, emerge também um novo tipo
de partido juntamente com novos meios de comunicação e de campanhas mais
elaboradas tecnicamente (MASSUCHIN, 2013, p. 04)
No que se refere às campanhas eleitorais é interessante contextualizar neste trabalho
como elas vem se evoluindo ao longo do tempo para posteriormente entender como elas se
configuram hoje diante das novas tecnologias da informação e no contexto do big data. Para
63
contextualizar esse item usam-se as considerações de vários autores da Ciência Política, que
se dedicam a estudar a comunicação e o marketing político (NORRIS, 2000;
ALBUQUERQUE, 1999; MANCINI, SWANSON, 1995)
Norris (2000) em seu trabalho subdivide as campanhas ocidentais em três grandes
períodos que marcam seu desenvolvimento. O primeiro momento é definido como prémoderno e marca as campanhas realizadas até 1950. Esse momento se distingue bastante das
fases posteriores, pois aqui ainda há formas mais diretas de comunicação entre eleitores e
candidatos e uma forte tendência de identificação e adesão aos partidos. Já em uma segunda
fase que marca a segunda metade do século XX, o auge das campanhas é a televisão que
substitui a campanha face a face e se transforma no cenário de competição eleitoral. Este é o
marco da profissionalização da campanha abordado por Mancini e Swanson (1995) onde há
pessoas específicas para produzir as campanhas eleitorais. Neste momento também já há uma
menor identificação dos partidos. No caso brasileiro, segundo Albuquerque (1999) essa fase
só ganha destaque, tratando-se de regimes democráticos e campanhas eleitorais, no final da
década de 1980 com o retorno da democracia.
Norris (2000) caracteriza uma terceira fase das campanhas chamada de pós-modernas,
pois se trata de uma total profissionalização de todas as atividades da campanha. Além disso,
há segmentação das mensagens e estudos mais aprofundados, baseando-se nas pesquisas de
opinião pública, para identificar as características do eleitorado e como atingi-lo por meio das
estratégias usadas pelos profissionais. É neste contexto da terceira fase apresentada por
Norris (2000) em que há a citação dos novos meios como ferramenta de campanha. Segundo a
autora, as novas tecnologias passam a ser usadas no marketing eleitoral, pois teriam
determinadas características relevantes para contatar o eleitor (Norris, 2000).
Pretende-se neste trabalho durante o desenvolvimento da pesquisa de tese, a partir das
fases apresentadas pelos autores acima citados, se aprofundar mais na caracterização das
campanhas eleitorais, principalmente a partir da adoção da internet como um novo canal de
comunicação e informação político. Esse item terá como objetivo também caracterizar as
campanhas eleitorais norte-americanas, que também é foco da investigação no uso do big
data.
4.5.3 Pesquisa e Política (em desenvolvimento)
As pesquisas procuram mensurar o conhecimento da população sobre determinados
assuntos como educação, saúde, segurança, economia, meio ambiente, entre outros.
64
As pesquisas de acompanhamento e desempenho administrativo levantam os
principais problemas da população, avaliam o desempenho dos governantes, aferem a imagem
da administração, o grau de conhecimento dos projetos e das obras realizadas e o grau de
satisfação com os serviços públicos. Já as pesquisas eleitorais, por sua vez, procuram detectar
as intenções de voto do eleitor a cada momento, aferindo o potencial de adesão ou rejeição a
cada candidato.
Os fatores de maior relevância em uma pesquisa são: a imagem do candidato, sua
trajetória política, seu carisma e empatia com o eleitor, seu programa de governo, sua
principal meta de governo, sua profissão, seu partido político, seus apoiadores, e o grupo
social em que está inserido ou com o qual se identifica.
Casartelli (2005) diz que as pesquisas são dotadas de critérios metodológicos e são
interpretadas para se observar o que é fundamental, para aprimorar a disputa entre os
candidatos ou avaliar tendências que possam trazer modificações de cenário. A análise deve
se basear no dinamismo e na falta de unidade da sociedade, com seus diversos grupos, que
pensam de forma diferente.
A utilização de métodos qualitativos na Ciência Política e no Marketing Político
cresceu a partir dos últimos anos da década de 80, de acordo com Veiga e Godim (2001),
especificamente através da técnica dos grupos focais, completando abordagens quantitativas
habitualmente utilizadas em pesquisas de opinião pública.
Os objetivos das pesquisas qualitativas, de acordo com Veiga e Godim (2001), são
mapear demandas e frustrações dos eleitores, conhecer sua percepção do quadro político e as
expectativas dos eleitores. Além disso, deve-se avaliar a imagem dos candidatos e seu
programa de governo e as razões para votar neles.
De acordo com Almeida (2001), o conjunto de informações levantadas numa pesquisa
de opinião permite ao analista compreender o cenário de representação da política. Assim,
esse cenário é identificado a partir de instrumentos que investiguem as opiniões do público,
de modo quantitativo e qualitativo. Esse cenário de disputa da representação política está em
constante mutação. A leitura dessas pesquisas não pode ser feita de forma isolada, mas de
modo sequencial no contexto político e ideológico, isto é, as alterações sociais, eventos,
acontecimentos significativos irão influenciar diretamente a opinião do público e alterar o
cenário naquele momento e dentro daquele contexto.
Na visão de Aldé (2001), a opinião de um povo sempre foi estratégica no campo da
política, mesmo em regimes autoritários. Maquiavel aconselhava ao príncipe que conhecesse
os costumes e opiniões do povo, pois consenso sempre foi vantajoso para o exercício do
65
poder. Manter favorável a “opinião popular”, torna a política menos onerosa, socialmente e
financeiramente. Os cidadãos contracenam com quadros de referência que alimentam as
explicações que eles constroem para a política. Cada um busca se informar sobre a política de
acordo com a satisfação que obtém do que considera informação suficiente. Nesse contexto,
para Aldé (2001), o cidadão comum é receptor da comunicação de massa e usuário de um
sistema diferenciado de informação e conhecimento político. A população que elege se
distribui entre ávidos, assíduos, consumidores de escândalos, frustrados e desinformados. A
pesquisa qualitativa usada no contexto do marketing político objetiva mostrar as relações
entre as atitudes políticas e os tipos de recepção de comunicação dos indivíduos, com
implicações importantes para o que se pode dizer acerca das possibilidades e expectativas
políticas deste cidadão e sua decisão de voto (ALDÉ, 2001). Segundo Aldé (2001) a mídia se
torna referência para todos os indivíduos, pela sua homogeneidade discursiva ao repetir os
principais enquadramentos, e pela acessibilidade praticamente universal, recente e frequente
dos meios de massa.
Considerando todas essas percepções que se busca conhecer, ao longo do
desenvolvimento desta pesquisa, como vem sendo usado as redes sociais digitais pelos
políticos, como ambientes de comunicação, interação e também de pesquisas para finalidades
de estratégias eleitorais.
Redes sociais remetem a um conjunto de pessoas (ou organizações) conectadas por
relacionamentos sociais, estimulados pela amizade, por relações de trabalho ou
compartilhamento de informações e, por meio dessas vinculações, vão construindo e
reconstruindo a estrutura social (MARTELLETO, 2001).
Redes sociais digitais podem ser definidas também como diálogos interativos entre
diferentes pessoas, realizados com o apoio de tecnologias web e mobile, capazes de gerar
mudanças pervasivas na comunicação, entre organizações, comunidades e indivíduos
(WIKIPEDIA, 2013).
O estudo das redes traz a tona um dado da realidade social contemporânea de que as
pessoas, dotadas de recursos e capacidades propositivas, organizam suas ações nos próprios
espaços políticos em função de socializações e mobilizações suscitadas pelo próprio
desenvolvimento das redes (MARTELETO, 2001).
De acordo com Recuero (2009) as redes sociais digitais possuem elementos (atores,
conexões e relações) característicos, que servem de base para que a rede seja percebida e as
informações a respeito dela sejam apreendidas.
66
Vale aqui destacar, que a análise de redes sociais digitais admite como pressupostos
que as relações sociais (ou laços sociais) constituídas por indivíduos (eleitores), organizações,
atores sociais e políticos, instituições, e entre eles, formam por excelência o elemento de
estruturação da vida social. Para analisar redes sociais usa-se uma ferramenta que permite que
se conheça as interações e classes de indivíduos, partindo principalmente mais de dados
qualitativos, do que quantitativos com o apoio do software UCINET41.
41
UCINET é um software que foi desenvolvido por Lin Freeman, Everett Martin e Steve Borgatti para analisar
relações e informações nas redes sociais digitais.
67
5
ESTRUTURA PRELIMINAR DA TESE
O presente trabalho está estruturado da seguinte forma, que poderão ser ampliados de
acordo com o desenvolvimento da pesquisa:
1. Explosão Informacional – que vai tratar dos conceitos, causas e consequências do
aparecimento e aumento das informações, principalmente no ambiente da internet.
Discutimos o fenômeno da dataficação da informação na atual sociedade, com
destaque para a coleta e análise de dados em mídias sociais, bem como buscará
apresentar uma discussão em torno da ética da informação, no que se refere ao uso das
informações dos usuários das mídias sociais digitais, para fins de estratégias
informacionais e comunicacionais em campanhas eleitorais.
2. Big data – neste item serão apresentados os conceitos, tendências, características e
evolução do tema. Além disso, serão apresentadas as experiências dos usos do big data
em diversos segmentos da sociedade.
3. Informação, Comunicação e Marketing Político – neste item terá por finalidade
mostrar discussões em torno dos teóricos da Ciência da Informação, da Comunicação
e também da Ciência Política. Serão apresentados conceitos e particulares a respeito
da informação, da comunicação política, do marketing político e eleitoral e das
campanhas eleitorais. Ainda serão discutidos os tipos de pesquisas que são usadas em
períodos eleitorais que ajudam na construção de estratégias de comunicação e
marketing político e eleitoral, com enfoque para as redes sociais digitais.
4. Usos do big data em campanhas eleitorais estrangeiras e brasileiras – é a pesquisa
de campo em torno da aplicação do big data no âmbito da política eleitoral. Serão
tomadas como observações as campanhas eleitorais americanas de 2013 e as
brasileiras, especificamente a que acontecerá em 2014.
5. Considerações finais a respeito da investigação e da pesquisa de tese.
68
6
CRONOGRAMA DE TRABALHO
As atividades, referente a este trabalho de doutorado, estão distribuídas como
demonstra a Tabela 2.
Cronograma de Atividades do Trabalho
Tabela 2
Atividades
J F M
1. Revisão do projeto com as
X
considerações
da
banca
A M J
J
A S
O
N
D
X
X
J
F
M
de
qualificação
2.Pesquisas bibliográficas
X X X
X X
X
X
X X
X
3 .Elaboração de capítulos
X X X
X X
X
X
X X
X
4. Coleta de informações e
X X X
X X
X
X
X X
X
X
X
X
X X
X
X X
X
X
X
X
X X
X
X
X X
X
X
X
X
X
X X
X
X
X
X
X
dados da pesquisa
5. Entrevistas com profissionais
e
políticos
envolvidos
em
campanhas eleitorais nos EUA
e no Brasil.
6.
Escrita
da
Tese
com
a
partir
das
pesquisa
de
informações
entrevistas
e
campo.
7.Observações ao processo de
campanha eleitoral brasileira
de
2014.
Enfoque
nas
estratégias comunicacionais e
de marketing em ambientes da
Internet.
8.
Considerações
finais
da
X
X
pesquisa
9. Defesa da Tese
10. Escrita e publicação de
artigos
X
X X X
X X
X
X
X X
X
X
X
X
X
X
69
7
REFERÊNCIAS
ALBUQUERQUE, Afonso. (1999). “Aqui você vê a verdade na tevê”: A propaganda política
na televisão. Niterói: MCII.
ALDÉ, A. A construção da política: cidadão comum, mídia e atitude política. Rio de
Janeiro, 2001. 234 p. (Tese de Doutorado, Ciência Política). Instituto Universitário
de Pesquisas do Rio de Janeiro – Iuperj.
ALMEIDA, Jorge. Marketing político, hegemonia e contra-hegemonia. São Paulo,
Editora Fundação Perseu Abramo e Xamã Editora, 2002.
ALMEIDA, Jorge. Pesquisas de opinião e cenário de representação da política,
2001. Disponível em: <http://www.unb.br/fac/comunicacaoepolitica/Jorge2001.pdf
> Acessado em: 26 de maio de 2008.
AMA – American Marketing Association - The American Marketing Association Releases New
Definition for Marketing – Press Release - Chicago – 14 de Janeiro de 2008- disponível em
http://www.marketingpower.com/AboutAMA/Documents/American%20Marketing%20Association%
20Releases%20New%20Definition%20for%20Marketing.pdf acessado em 21 de Fevereiro de 2010.
AMARAL, S.A. do. Marketing: abordagem em unidades de informação. Brasília:
Thesaurus, 1998.
ANÁLISE em larga escala de dados não convencionais e diferentes. 2013. Disponível em:
<http://www-03.ibm.com/software/products/br/pt/infobigibasiedit/>. Acesso em: 06 mai.
2013.
ANHAIA, Valéria dos Santos. O Marketing de Relacionamento na Campanha Eleitoral de
Yeda Crusius. Santa Maria – RS, 2007. Disponível em:
http://lapecpp.files.wordpress.com/2011/05/valc3a9ria-anhaia.pdf
ANTONIUTTI, Cleide Luciane. De operário a presidente. A imagem política de Lula no
Horário Eleitoral da televisão nas campanhas presidências de 1989 e 2002. Dissertação
de Mestrado em Sociologia Política, UFPR, Curitiba – Pr, 2004. Disponível em:
http://www.educadores.diaadia.pr.gov.br/arquivos/File/2010/artigos_teses/SOCIOLOGIA/clei
de.PDF. Acessado em set de 2013.
ARAUJO, Eliany Alvarenga de. A construção social da informação: dinâmicas e
contextos. Data Grama Zero – Revista de Ciência da Informação, v. 2, n. 5, out. 2001.
Disponível em: < http://dgz.org.br/dez08/F_I_aut.htm >. Acesso em: set 2013.
ARAUJO, V.M.R.H. de. Informação: instrumento de dominação e de submissão.
Ciência da Informação, v. 20, n. 1, 1991
70
________. Sistemas de Recuperação da Informação: Nova abordagem teórico conceitual.
Rio de Janeiro: Universidade Federal do Rio de Janeiro, 1994. Tese
(Doutorado em Comunicação e Cultura, Escola de Comunicação).
ARAÚJO, V.M.R.H. de; FREIRE, I.M. A rede Internet como canal de comunicação, na
perspectiva da Ciência da Informação. Transinformação, v.8, n.2, 1996
ÁREA do Brasil. 2013. Disponível em: <http://www.brasilescola.com/brasil/area-brasil.htm>.
Acesso em: 04 jun. 2013.
ARRIGONI, Rodrigo (2013). Big data, a ciência do grande. Disponível em:
http://convergecom.com.br/tiinside/21/06/2013/big-data-a-ciencia-do-grande/#.Uoy0-sRJ6s1
BARBOSA, D. Information Extraction for Social Media Analysis. 2013. Disponível em:
<http://emcbigdataschool.nce.ufrj.br/images/downloads/Denilson_Barbosa_InfoExtraction.pd
f>. Acesso em: 16 mai. 2013.
BORKO, H. Information science: what is it? American Documentation, Jan. 1968.
BARRETO, Aldo de Albuquerque. A questão da informação. São Paulo em perspectiva,
São Paulo, v. 8, n. 4, p. 3-8, 1994.
____________________________. Mudança estrutural no fluxo do conhecimento: a
comunicação eletrônica. Ciência da Informação, v. 27, n. 2, p. 122-127, maio/ago. 1998.
Disponível em: <http://dx.doi.org/10.1590/S0100-19651998000200003>
____________________________. A oferta e a demanda da informação: condições
técnicas, econômicas e políticas. Ciência da Informação, 1999b, vol.28, n.2, p.168-168.
Disponível
em:
http://www.scielo.br/scielo.php?script=sci_arttext&pid=S010019651999000200009&lng=en&nrm=iso. Acesso em: 18out.2013.
BIG DATA. 2013. Disponível em: <http://www.gartner.com/it-glossary/big-data/>. Acesso
em: 14 abr. 2013.
CALVO, Tereza Cristina Mate. Distinção entre informação e Conhecimento. Disponível
em:http://www.microkids.com.br/artigos/distincao_entre_informacao_e_conhecimento.pdf
Acessado em Set de 2013.
CANAVILHAS, João. A Comunicação Política na Era da Internet. Universidade da Beira
Interior, 2009. Disponível em: http://www.bocc.ubi.pt/pag/canavilhas-joao-comunicacaopolitica-na-era-da-internet.pdf , acessado em setembro de 2013.
CASARTELLI, A. O. Proposição de um modelo de comunicação e marketing político.
São Paulo: INTERCOM, v. 10, p. 10-11, 2005.
71
CASTELLS, M. A sociedade em rede. São Paulo: Paz e Terra, 1999. (A era da informação;
economia, sociedade e cultura, v.1)
CHOO, C. W. A organização do conhecimento: como as organizações usam a informação
para criar significado, construir conhecimento e tomar decisões. São Paulo: Editora Senac
São Paulo, 2003.
CONSULTAS e artigos com a palavra “análise”. 2005. Disponível em:
<http://origemdapalavra.com.br/palavras/analise/>. Acesso em: 19 abr. 2013.
COX, M.; ELLSWORTH, D. Application-Controlled Demand Paging for Out-of-Core
Visualizatoin. 2004. Disponível em: <http://www.evl.uic.edu/cavern/rg/20040525_renambot/
Viz/parallel_volviz/paging_outofcore_viz97.pdf>. Acesso em: 12 mai. 2013.
DAHLBERG, L. Computer-Mediated Communication and the Public Sphere: A Critical
Analysis. Journal of Computer-Mediated Communication, v. 7, n. 1, 2001
DANTAS, Edmundo Brandão. A informação como insumo da prática do marketing na
gestão do conhecimento do cliente. Universidade de Brasília, 2006. Disponível:
http://www.bocc.ubi.pt/pag/dantas-edmundo-informacao-pratica-marketing.pdf
DAVENPORT, T. H., PRISAK, L. Conhecimento empresarial. Rio de Janeiro: Campus,
1998.
DEMCHENKO, Y. Defining extra Vs: Value and Veracity for Big Data 3V: Volume,
Velocity, Variety. 2013. Disponível em:
<http://staff.science.uva.nl/~demch/////presentations/sne2013-01-03-bigdata-5V-infrav04.pdf>. Acesso em: 03 fev. 2013.
DUMBRILL, Edd. Big Data Now: Current Perspectives from O’Relly Media. 2012.
Disponível em: <http://oreilly.com/data/radarreports/big-data-now-2012/thankyou.csp>.
Acesso em: 11 mar. 2013.
EATON, Chris. Understanding Big Data. IBM. Ebook. 2012.
FIGUEIREDO, Ney Lima. FIGUEIREDO JUNIOR, José Rubens de Lima. Como ganhar
uma eleição: lições de campanha e marketing político. Cultura Editores Associados: São
Paulo, 1990.
FREIRE, Gustavo Henrique de Araujo. Ética da Informação: Conceitos, Abordagens,
Aplicações. Simpósio Brasileiro de Ética da Informação. Idéia, João Pessoa (PB), 2010
GOMES, Wilson. Participação Política Online: Questões e hipóteses de trabalho. In:
GOMES, W.; MAIA, R. C. M.; MARQUES, F. P. J. A. Participação política e internet 2011.
Porto Alegre: Editora Sulina.
GOMES, Wilson. Propaganda política, ética e democracia. In: RUBIM, Antonio C (Org).
72
Mídia, eleições e democracia. São Paulo, 1994. P. 53-90
GOUVEIA, Sônia Mara. A informação como produto de alto valor no mundo dos
negócios. CRB-8 Digital, São Paulo, v. 1, n. 1, p. 43-54, jul. 2008 | http://www.crb8.org.br/ojs
INTEL IT Center. Big Data 101: Unstructured Data Analytics. 2012. Disponível em:
<http://www.intel.com/content/www/us/en/big-data/unstructured-data-analytics-paper.html>.
Acesso em: 04 abr. 2013.
ISSENBERG, Sasha. How President Obama’s campaign used big data to rally individual
voters, Part 1 Disponível em:. http://www.technologyreview.com/featuredstory/508836/howobama-used-big-data-to-rally-voters-part-1/ . Acessado em 17 de novembro de 2013.
KOTLER, Philip. Administração de marketing. São Paulo : Atlas, 1975.
KOTLER, Philip. Marketing para o Século XXI – Como criar, conquistar e dominar
mercados – 3ª Edição – São Paulo – Editora Futura 1999.
LAS CASAS, Alexandre Luzzi. Marketing de Serviços. 4ª edição. São Paulo: Atlas, 2006
LASTORI, A. MySQL e Big Data. 2013. Disponível em:
<http://www.slideshare.net/MySQLBR/mysql-e-big-data>. Acesso em: 08 mai. 2013.
LAZER, David. et al. Computacional Ciências Sociais. 2006. Disponível em:
http://www.sciencemag.org/search?author1=David+Lazer&sortspec=date&submit=Submit.
Acessado em set 2013.
LE COADIC, Yves-Françoes. A Ciência da Informação. Brasília – DF, Briquet de
Lemos/Livros, 1996.
LÉVY, Pierre. A inteligência coletiva: por uma antropologia do ciberespaço. 2. ed.
Tradução de Luiz Paulo Rouanet. São Paulo: Loyola, 1999.
____________. O que é virtual?. Tradução de Paulo Neves. São Paulo: Editora 34,
1996.
____________. As tecnologias da inteligência: o futuro do pensamento na era da
informática. Rio de Janeiro : Editora 34, 1993. 208 p.
LITTLE Jonh, Stephen W. Teoria da informação. In: ______. Fundamentos teóricos da
comunicação humana. Rio de Janeiro: Guanabara, [197-]. p. 152-161.
LORENA, Karin Mestriner. 2013. Qual o custo da comunicação fragmentada?. Disponível
em: <http://www.ibm.com/midmarket/br/pt/library_dicas_comunicacao.html>. Acesso em: 06
abr. 2013.
MCKENNA, R. Marketing de Relacionamento – 1ª Edição– Editora Campus – 1993
73
MANCINI, P.; SWANSON, D. L. (1995). Politics, Media and Modern Democracy: an
International Study of Innovations in Electoral Campaigning and their Consequences.
Westport, London: Praeger.
MANHANELLI, Carlos Augusto. Estratégias Eleitorais – Marketing Político. Ed.
Summus, 1988.
MARTELETTO, Regina. Análise de redes sociais aplicação nos estudos de transferência da
informação. Ci. Inf., Brasília, v. 30, n. 1, p. 71-81, jan./abr. 2001. Disponível em:
http://www.scielo.br/pdf/ci/v30n1/a09v30n1.pdf
MASSUCHIN, Michele Goulart. Quais as funções do Websites durante as campanhas
eleitorais? As eleições brasileiras de 2012 e o cenário de Curitiba. UFSCar- SC. II
Congreso de Comunicación Politica Estratégias de Campaña. Toluca (México), 2013.
MIGUEL, Luis Felipe. Os meios de comunicação e a prática política. Lua Nova º 55-56—
2002. Disponível em: http://www.scielo.br/pdf/ln/n55-56/a07n5556.pdf , acessado em 10 de
setembro de 2013.
MIRANDA, R. C. da R. O uso da informação na formulação de ações estratégicas pelas
empresas. Ciência da Informação, Brasília, v.28, n.3, p.284-290, set./dez. 1999.
MORIN, Edgar. O problema epistemológico da complexidade. Lisboa: Mem Martins:
Europa-América, 1996.
NAFFAH, S. ANÁLISE CONFIÁVEL. 2012. Disponível em:
<http://www.sas.com/offices/latinamerica/brazil/sascom/revistas/pdfs/sascom_2012q2-ed19.pdf>. Acesso em: 19 abr. 2013.
NORRIS, P. (2000). Democratic divide? The impact of the internet on parliaments
worldwide. Harvard University: John Kennedy School of Government.
________. (2001). Digital divide; civic engagement, information poverty, and the internet
worldwide. CAMBRIDGE: CAMBRIDGE UNIVERSITY PRESS.
RADFAHRER, LULI. Uma nova ciência social. Folha de
http://www1.folha.uol.com.br/fsp/tec/76084-uma-nova-ciencia-social.shtml.
publicada em 05 de novembro de 2012.
São Paulo.
Reportagem
RIBEIRO, Rodrigo Mendes. Marketing político: o poder das estratégias nas campanhas
eleitorais. Belo Horizonte: C/Arte, 2002. 191p. (Política & sociedade).
74
ROSSI, Gabriel. Big Data e a pesquisa brasileira. Disponível
http://gabrielrossi.com.br/artigo-de-gabriel-rossi-e-novamente-destaque-no-correiobraziliense-edicao-de-natal/ publicada em 25 de dezembro de 2012.
em:
O ESTADO DE SÃO PAULO. Big Data. Disponível em: http://www.estadao.com.br/
O GLOBO. Como funciona o Big Data. Disponível em:
<http://oglobo.globo.com/infograficos/bigdata/> Acessado em maio de 2013.
QUEIROZ, Adolfho Carlos Françoso; TAVARES, Débora Cristina. Marketing Político,
História e Evolução no Brasil Republicado. Trabalho apresentado ao GT02 do V Congresso
Nacional de História da Mídia, Facasper e Ciee, São Paulo em 2007. Disponível em:
http://www.ufrgs.br/alcar/encontros-nacionais-1/5o-encontro-2007
1/201cMarketing%20Politico%20Historia%20e%20Evolucao%20no%20Brasil%20Republicano201d.pdf. Acessado em
out 2013.
PACHECO, Cid. Marketing Eleitoral: A Política Apolítica. In: Revista "Comunicação e
Política". Rio de Janeiro: Ed. Cebela, 1994. Ano I, n° I, p. 147 / 153.
PRESS, Gil. What’s the Big Data?. 2012. Disponível em:
<http://whatsthebigdata.com/2012/06/06/a-very-short-history-of-big-data/>. Acesso em: 17
nov. 2012
RECUERO, Raquel. Big Data: apontamentos e limitações. Postagem em 14.05.2013. Blog
Disponível em: < http://www.raquelrecuero.com/arquivos/2013/05/big-data-apontamentos-elimitacoes.html>. Acessado junh de 2013.
RECUERO, Raquel. Redes Sociais na internet. Porto Alegre: Sulina, 2009.
REVISTA IMASTERS. Disponível: http://issuu.com/imasters/docs/revistaimasters5
REVISTA ISTO É DINHEIRO. Disponível em:
http://www.istoedinheiro.com.br/noticias/130282_ESTRATEGISTA+VE+VALETUDO+EM
+CAMPANHA+ELEITORAL+NA+WEB . Acessado em set de 2013.
RUBIM, Antonio.A. C.; AZEVEDO, F. Mídia e Política no Brasil. Lua Nova, São Paulo, n.
43, 1998, p. 189-216.
SAGAN, C. The dragons of Eden; speculations on the evolution of human intelligence.
New York: Ballantine Books, 1977
SARACEVIC, Tefko. Ciência da Informação: origem, evolução e relações. Perspectivas
em Ciência da Informação, Belo Horizonte, v. 1, n. 1, p. 41-62, jan./jun. 1996.
______. Interdisciplinarity nature of Information Science. Ciência da Informação,
Brasília, v. 24, n. 1, p. 36-41, 1995.
Disponível em: < http://www.uff.br/ppgci/editais/saracevicnatureza.pdf>. Acesso em: n.
2008.
75
SCHONS, Claudio Henrique. O volume de informações na internet e sua desorganização:
reflexões e perspectivas. I n f . I n f . , L o n d r i n a , v . 1 2 , n . 1 , j a n . / j u n . 2 0 0 7.
SILVA, Alzira Karla Araújo da; CORREIA, Anna elizabeth Galvão Coutinho; LIMA, Izabel
França de. O conhecimento e as tecnologias na sociedade da informação. Rev. Interam.
Bibliot vol.33 no.1 Medellín Jan./June 2010 Disponível em:
http://www.scielo.org.co/scielo.php?pid=S0120-09762010000100009&script=sci_arttext,
acessado em setembro de 2013.
SIQUEIRA, Ethevaldo. O mundo na Era do Zettabyte. Economia&Negócio. O Estado de S.
Paulo. Maio de 2012. Disponível em:< http://blogs.estadao.com.br/ethevaldosiqueira/2012/05/18/o-mundo-na-era-do-zettabyte/>. Acessado em Ago 2013.
STIVANIN, Taíssa. Obama o tuiteiro mais “curtido” do mundo. Artigo publicado em 07
de novembro de 2012. Disponível em: http://www.portugues.rfi.fr/americas/20121107obama-o-tuiteiro-mais-curtido-do-mundo. Acessado em: jan de 2013.
TERRA, J. C. C. Gestão do conhecimento: o grande desafio empresarial. São Paulo:
Negócio Editora, 2000. 283p.
URDANETA, I. P. Gestión de la inteligencia, aprendizaje tecnológico y modernización
del trabajo informacional: retos y oportunidades. Caracas: Universidad Simón Bolivar,
1992.
VEIGA, Luciana; GONDIM, Sônia Maria Guedes. A utilização de métodos qualitativos na
Ciência Política e no Marketing Político. Opin. Publica, Campinas, v. 7, n. 1, 2001.
Disponível em: <http://www.scielo.br/scielo.php?script=sci_arttext&pid=S010462762001000100001&lng=en&nrm=iso>. Acesso em: 26 de maio de 2008.
VEJA. São Paulo: Abril, n. 2321, 15 mai. 2013.
WIKIPEDIA. https://pt.wikipedia.org/wiki/Wikip%C3%A9dia:P%C3%A1gina_principal
WHITCH Industries Use More Unstructured Data?. 2012. Disponível
<http://sites.tcs.com/big-data-study/tag/unstructured-data/>. Acesso em: 15 mai. 2013
em:
XEXÉO, Geraldo. Big data: computação para uma sociedade conectada e digitalizada.
Ciência Hoje, v. 51, n. 306, ago. 2013.
ZEFERINO, André. A Gestão Estratégica de Dados em Social Media – “Make the big
data small or die!”. Disponível: http://cibertransistor.com/2013/06/17/a-gestao-estrategicade-dados-em-social-media-make-the-big-data-small-or-die/. Acesso em agosto de 2013.