DAVID DESTRO NETO JAILTON DOS SANTOS MARAN JOÃO

Transcrição

DAVID DESTRO NETO JAILTON DOS SANTOS MARAN JOÃO
1
FUNDAÇÃO DE ENSINO “EURÍPIDES SOARES DA ROCHA “
CENTRO UNIVERSITARIO “EURÍPIDES DE MARÍLIA”- UNIVEM
CURSO DE ADMINISTRAÇÃO
ANÁLISE DE SISTEMAS
DAVID DESTRO NETO
JAILTON DOS SANTOS MARAN
JOÃO DIAS CHAVES FILHO
BUSINESS INTELLIGENCE:
CONCEITOS E ESTRATÉGIA DE NEGÓCIOS
MARÍLIA
2007
2
DAVID DESTRO NETO
JAILTON DOS SANTOS MARAN
JOÃO DIAS CHAVES FILHO
BUSINESS INTELLIGENCE:
CONCEITOS E ESTRATÉGIA DE NEGÓCIOS
Trabalho de Conclusão apresentado ao
Programa de Graduação da Fundação de
Ensino “Eurípides Soares da Rocha”,
Mantenedora do Centro Universitário de
Marília – UNIVEM, como requisito para
obtenção do grau de Bacharel em
Administração de Empresas com habilitação
em Análise de Sistemas.
Orientador:
Prof. Mr. Elvis Fusco
MARILIA
2007
3
NETO, David Destro; MARAN, Jailton dos Santos; FILHO, João
Dias Chaves. Business Intelligence: Conceitos e Estratégia de
Negócios / David Destro Neto, Jailton dos Santos Maran, João Dias
Chaves Filho; orientador: Elvis Fusco. Marília, SP: [s.n.], 2007. 66
fls.
Trabalho de Conclusão (Graduação em Administração de
empresas com habilitação em Analise de Sistemas) – Fundação de
Ensino Eurípides Soares da Rocha - UNIVEM, 2007.
1.Business Intelligence 2.Data Warehouse 3.Data Mart 4.OLAP
5. Data Minig 6.Tomada de Decisão
CDD: 658.4038
4
5
Ao nosso Deus, Senhor criador de todas as coisas,
e às nossas famílias.
6
AGRADECIMENTOS
Agradecemos Deus, que nos permitiu tudo e nos amparou em todos os
momentos.
A Nossa Senhora, nossa Mãe Maria, que sempre intercedeu por nós.
Às nossas famílias, que nos suportaram e apoiaram.
Ao nosso orientador, prof. Mr. Elvis Fusco, que muito contribuiu para nosso
aprendizado.
Aos demais professores e pessoas que de alguma forma nos ajudaram por
esse caminho que nos trouxe até aqui.
Também
agradecemos
à
empresa
Ariacom
Business
Reports,
disponibilizar sua ferramenta, o Report Manager, gratuitamente para testes.
por
7
Não há nada que seja maior evidência de insanidade
do que fazer a mesma coisa dia após dia
e esperar resultados diferentes.
Albert Einstein
8
NETO, David Destro; CHAVES, João Dias; MARAN, Jailton dos Santos. Business
Intelligence: Conceitos e Estratégia de Negócios.2007. 66 f. Trabalho de Conclusão
(Graduação em Admininstração com Habilitação em Análise de Sistemas) – Centro
Universitário Eurípedes de Marília, Fundação de Ensino Eurípedes Soares da Rocha –
UNIVEM, Marília, 2007.
RESUMO
Para que as empresas venham a ter sucesso atualmente é importantíssimo que ela venha a
fazer uso de uma grande aliada, que é a informação. Porém, o que interessa não é a
informação jogada ao esmo, mas sim contar com informações relevantes para a tomada de
decisão sobre seus negócios e, assim, elevar sua riqueza. Para tanto, as organizações podem
vir a lançar mão de conceitos e metodologias, geralmente disponibilizadas em ferramentas de
software que, dentre as quais, destaca-se o Business Intelligence. Este, utilizando-se de banco
de dados poderosos, os Data Warehouses ou Data Marts que surgiram do conceito de
modelagem multidimensional e contém informações históricas dos negócios da empresa,
podem vir a obter informações preparadas, com as tecnologias das funções do OLAP e até do
Data Mining, especificamente para a tomada de decisão. Em vista disso, esse trabalho procura
abordar, de forma geral, o cenário em que essa solução está inserida, e como, pelo
envolvimento do modelo de negócios da empresa, ela pode ser útil à tomada de decisão.
Desse modo, não é pretendido demonstrar como se dá a construção de um sistema de
Business Intelligence. Porém, são apresentados seus conceitos tecnológicos principais e como
eles atuam para que o Business Intelligence venha cumprir o que propõe. Ocorrerá também
uma apresentação da utilização prática de uma ferramenta.
Palavras-chave: Business Intelligence, Data Warehouse, Data Mart, OLAP, Data Minig,
Tamada de Decisão.
9
NETO, David Destro; CHAVES, João Dias; MARAN, Jailton dos Santos. Business
Intelligence: Conceitos e Estratégia de Negócios.2007. 66 f. Trabalho de Conclusão
(Graduação em Admininstração com Habilitação em Análise de Sistemas) – Centro
Universitário Eurípedes de Marília, Fundação de Ensino Eurípedes Soares da Rocha –
UNIVEM, Marília, 2007.
ABSTRACT
So that the companies come to have success at this moment is important that come to do use
of a big one allied, that is the information. However, do what interests is not the information
played to the guess, but to count with important information for the take of decision on your
businesses and, like this, to elevate your wealth. For much, the organizations can come to lay
hold of concepts and methodologies, usually arranged in software a tool that, among which,
stands out the Business Intelligence. This, being used of powerful database, it Data
Warehouses or Data Marts that appeared of the concept of multidimensional modeling and
contain historical information of the businesses of the company, can come to obtain prepared
information, with the technologies of the functions of OLAP and to of the Data Mining,
specifically for the take of decision. In mind of that, that work tries to approach, in a general
way, the scenery in how that solution is inserted, and as, for the involvement of the model of
businesses of the company, she can be useful to the make of decision. In such, it is not
intended to demonstrate as if offer the construction of a system of Business Intelligence.
However, your main technological concepts are presented and like them they act so that
Business Intelligence comes to accomplish what proposes. Will also happen a presentation of
the practical use of a tool.
Key-Words: Business Intelligence, Data Warehouse, Data Mart, Data Mining, Take of
Decision.
10
LISTA DE ILUSTRAÇÕES
FIGURA 01 – Os Níveis Básicos de uma Organização ...........................................................14
FIGURA 02 – O Ambiente Organizacional e o Lugar do Business Intelligence ....................20
FIGURA 03 – As Tabelas Dimensão (Produto, Dia e Filial) Relacionadas com a Tabela
Fato Vendas ............................................................................................................................. 31
FIGURA 04 – Um Data Warehouse que Recebe Informações de Diversas Fontes .................38
FIGURA 05 – Um Data Warehouse Composto de Vários Data Marts ....................................39
FIGURA 06 – As Arquiteturas, na Seqüência, Cliente Gordo, Cliente Médio e
Cliente/Servidor Web ..............................................................................................................43
FIGURA 07 – Um Exemplo de Formato Lógico de uma Árvore de Decisão .........................50
FIGURA 08 – A Interface Principal da Ferramenta da Ariacom Business Reports.................54
FIGURA 09 – Relatório por Meio de Gráficos ........................................................................55
FIGURA 10 – Relatórios de dados informativos..................................................................... 56
FIGURA 11 – Exemplo de Planilha .........................................................................................57
FIGURA 12 – Exemplo de uso do Drill-Down, com a Granularidade Tempo Ano ................58
FIGURA 13 – Uso do Drill-Down, com a Granularidade Tempo Partindo de Ano para
Trimestre .................................................................................................................................. 58
FIGURA 14 – Uso do Drill-Down, com a Granularidade Tempo Trimestre para Mês ...........59
FIGURA 15 – Uso da Tabela Dimensão de Espaço e a Possibilidade de Acessos às
Granularidades ..........................................................................................................................60
FIGURA 16 – Uso da Tabela Dimensão de Espaço no Nível de Granularidades Cidade........61
FIGURA 17 – Uma tela do Free SQL Reports .........................................................................62
FIGURA 18 – O acesso ao menu Published e suas opções de formatos para listagem de
produtos ....................................................................................................................................63
11
LISTA DE ABREVIAÇÕES
BI: Business Intelligence.
CI: Competitive Intelligence.
CRM: Costumer Relationship Management.
DM: Data Mart.
DOLAP: Desktop On Line Analytical Processing.
DW: Data Warehouse.
EIS: Executive Information System.
ERP: Enterprise Resource Planning.
HOLAP: Hybrid On Line Analytical Processing.
KM: Knowledge Management.
MOLAP: Multidimensional On Line Analytical Processing.
OLAP: On Line Analytical Process
ROLAP: Relational On Line Analytical Processing.
SAD: Sistemas de Apoio à Decisão.
SQL: Structured Query Language.
TI: Tecnologia da Informação.
TPC: Transaction Processing Council.
12
SUMÁRIO
INTRODUÇÃO........................................................................................................................11
CAPÍTULO 1 – SOBRE O BUSINESS INTELLIGENCE......................................................13
1.1 Sistema de informação........................................................................................................13
1.1.1
Sistema de Apoio à Decisão..........................................................................................14
1.1.2
Sistema de Informação Gerencial.................................................................................15
1.2 Histórico do Business Intelligence......................................................................................16
1.3 Inteligência Competitiva.....................................................................................................18
1.4 Conceito geral de Business Intelligence.............................................................................19
CAPÍTULO 2 – APLICABILIDADE E UTILIDADE DO BI.................................................21
2.1 Necessidade da empresa e Modelo de Negócio..................................................................21
2.2 O que uma ferramenta de Business Intelligence oferece....................................................23
2.3 Diferencial Competitivo......................................................................................................25
2.4 Tendências..........................................................................................................................26
2.5 Produtos de Business Intelligence.......................................................................................29
CAPÍTULO 3 – AS TECNOLOGIAS QUE COMPÕEM O BI..............................................30
3.1 A modelagem multidimensional…….................................................................................30
3.1.1 As Tabelas Dimensão.......................................................................................................33
3.1.2 As Tabelas Fato................................................................................................................35
3.2 Data Warehouse e Data Mart..............................................................................................37
3.3 OLAP (On Line Analytical Process)…..............................................................................41
3.3.1 A arquitetura cliente / servidor no OLAP........................................................................42
3.3.2 As funções no OLAP.......................................................................................................43
3.3.3 Estratégias de armazenamento para o OLAP...................................................................45
3.4 Data Mining........................................................................................................................46
3.4.1 Etapas do Projeto de Data Maning...................................................................................48
3.4.2 Uso da Estatística no Data Mining...................................................................................49
13
CAPÍTULO 4 – ESTUDO DE CASO………………………………………………………..54
4.1 O que a ferramenta oferece na prática.................................................................................55
CONCLUSÃO..........................................................................................................................64
REFERÊNCIAS........................................................................................................................66
11
INTRODUÇÃO
As empresas atualmente lidam com muitos dados de diversas fontes internas ou
externas a ela, acarretando em uma grande quantidade de informações que absorvem ou
podem vir gerar, o que faz com que, às vezes, ocorra de não serem aproveitadas do melhor
modo para a tomada de decisões, especialmente concernentes aos negócios e estratégias da
organização. Assim, elas necessitam de auxílio para a formulação, adequação ou recriação,
muitas vezes, do seu modelo de negócio.
Com esse alvo em mira é que se envolvem conceitos e metodologias, que podem vir a
serem disponibilizados em softwares e normalmente o são, para auxiliar nesse processo.
Dentre estes, o Business Intelligence se destaca.
Além de uma ferramenta, o Business Intelligence é um verdadeiro suporte aos
negócios da empresa, pois vai de encontro à sua necessidade, no que tangem a tomada de
decisão por focar justamente o ambiente de negócios no qual a organização está inserida. Isso
tudo utilizando-se de análises de dados para a obtenção de informações de alta qualidade e
com grande utilidade, condições de uso enquanto cruzamento de dados, sumarização e
organização de informações, bem como sua aplicação para aferições de vários cenários em
que os negócios da organização podem vir a estar envoltos.
Para que se possa entender como tudo funciona, no capítulo 1 serão tratadas as
principais características e tipologias de sistemas de informação, e qual o posicionamento do
Business Intelligence nele. Seu histórico, os conceitos gerais de Inteligência Competitiva e a
participação do Business Intelligence nela, além dos conceitos gerais dele, é o que esse
capítulo procurará atingir.
No capítulo 2 será discorrido sobre o relacionamento entre o modelo de negócios das
empresas e a utilização do Business Intelligence. Para que as empresas devem vir a utiliza-lo,
12
as vantagens que ela poderia vir a obter, os diferenciais propostos por essa solução, bem como
as tendências da aplicação da informação de forma estratégica que são permitidos pelo
Business Intelligence será o foco desse capítulo.
O capítulo 3 trata de como ocorre o uso dos conceitos das tecnologias que envolvem o
Business Intelligence. Desde os de modelagem dimensional com as tabelas Fato e Dimensão,
os conceitos e assuntos relacionados ao Data Warehouse e ou de sua fragmentação para
abordagem de aspectos específicos, o Data Mart, o que é e as funcionalidades permitidas pelo
Processamento Analítico On Line , até a conceituação, as etapas e o uso da estatística que
envolvem Data Mining, este capítulo procurará discorrer.
Já no capítulo 4 será efetuado um estudo com utilização prática de uma ferramenta real
de Business Intelligence. Os princípios de utilização da ferramenta, o que ela permite ou não
será demonstrado. Onde está cada funcionalidade permitida pelo Processamento Analítico On
Line, e os tipos de informação que nele existem, onde efetuar consultas dinâmicas e outras
funcionalidades, ou seja, identificar a importância da utilização de uma ferramenta de
Business Intelligence e, especificamente, da viabilidade da ferramenta que será utilizada no
estudo, é o que pretende alcançar esse capítulo.
13
CAPÍTULO 1 – SOBRE O BUSINESS INTELLIGENCE
Nesse capítulo irá ocorrer a classificação do Business Intelligence dentro dos tipos de
sistemas de informação. Também irá ser abordado sobre seu histórico e sobre sua
conceituação geral.
1.1 Sistema de Informação
Sistema de Informação é toda geração ou manipulação da informação, utilizando-se ou
não de tecnologia. Pessoas, aparelhos, formas de comunicação, etc., são fontes do sistema de
informação. Todo sistema gera algum tipo de informação.
[...] Para conceituação inicial, informação é todo dado trabalhado, útil,
tratado, com valor significativo atribuído ou agregado a ele e com um
sentido natural e lógico para quem usa a informação. O dado é entendido
como um elemento da informação, um conjunto de letras, números ou
dígitos que, tomado isoladamente não transmite nenhum conhecimento, ou
seja, não contém um significado claro. [...] (REZENDE, ABREU. 2003,
p.60)
Concentrando no recurso da informática, como parte do sistema de informação e como
amplificador de capacidade dos outros recursos, é possível verificar e analisar como uma
ferramenta tecnológica pode vir a ser uma solução para auxiliar a organização para atingir
seus objetivos. Dentro de um ambiente empresarial existem vários níveis, mas que podemos
dividir em três principais, conforme a figura 1.
14
Figura 1 - Os níveis básicos de uma organização
Fonte – Elaborado pelos autores.
No nível operacional há tarefas programadas dentro de cronogramas de curto prazo,
onde ocorrem os processos produtivos ou mercadológicos (O’BRIEN. 2004, p.282). No nível
tático existe o desenvolvimento de planos de curto e médio prazo, estabelecendo políticas,
procedimentos e objetivos de negócio, com gerentes médios administrando recursos e
controlando o desempenho de suas respectivas divisões. Por fim, existe o nível estratégico,
dentro da identidade da organização, com os objetivos e metas de longo prazo, definidos pelos
diretores e executivos da empresa (O’BRIEN. 2004, p.281).
O sistema de informação deve ser estruturado de modo a oferecer um grande
embasamento de informações tornando possíveis os processos e a tomada de decisões de
interesse da organização. Os tipos de sistema de informação mais comuns em um ambiente
empresarial são os Sistemas de Apoio às Operações e os Sistemas de Apoio Gerencial, que
serão discutidos a seguir.
1.1.1 Sistema de Apoio às Operações
Os Sistemas de Apoio (ou suporte) às Operações são aqueles que controlam
transações, processos industriais e comunicações entre colaboradores. Eles inserem
informações no banco de dados, porém segundo O’brien (2004, p.24) não possuem a
15
preocupação com a criação de melhores produtos de informação para os gerentes. Assim, é
comum que as informações que geram necessitarem de processamento por Sistemas de Apoio
Gerenciais.
Existem três tipos de Sistemas de Apoio às Operações. São eles:
Sistema de Processamento de Transações: eles efetuam o registro e o processamento
de dados que resultam de transações da organização de duas formas basicamente. Quando o
faz por meio de lotes ocorre acumulo de dados por certo tempo e o processamento é
periódico, já quando ocorre em tempo real, o processamento acontece ao término da
transação, de modo imediato (O’BRIEN. 2004, p.24);
Sistemas de controle de Processo: efetuam o controle e monitoram processos físicos
em tempo real, continuamente (O’BRIEN. 2004, p.24);
Sistemas Colaborativos: sistemas de automação de escritório, que possuem como
objetivo principal o aumento da comunicação e produtividade pessoal dos trabalhadores e
grupos de trabalho de uma empresa (BATISTA, 2006, p.24).
1.1.2 Sistema de Apoio Gerencial
Procura munir os gerentes de vários níveis de informações adequadas para tomada de
decisão eficaz. Ele pode ser classificado de três formas principais:
Sistema de Informação Gerencial: oferece relatórios e informações resumidas sobre o
desempenho da organização. Desse modo, realimenta o planejamento de diretivas por parte
dos administradores;
São desenvolvidos com base no conhecimento específico do negócio,
chamado de método de trabalho. E, com uma metodologia adequada para
selecionar informações estratégicas e atividades críticas da empresa, os
sistemas de informação gerencial usam ferramentas que permitem uma visão
analítica dos dados/processos, gerando uma visão agregada, integrada e
16
gráfica dos principais indicadores de desempenho da empresa. (Batista.
2006, p.25).
Sistema de Apoio à Decisão: fornece suporte interativo à decisão do gerente no nível
tático. Conforme Batista (2006, p.25), ele oferece dados e modelos para solucionar problemas
semi-estruturados, focado a tomada de decisão;
Sistema de Informação Executiva: permite formar uma combinação dos sistemas
anteriores. Possui uma interface amigável, de fácil acesso, aos executivos de nível estratégico
da organização disponibilizando informações de cunho crítico de áreas competitivas e de
atribuições empresariais. Batista (2006, p.26) fala que é um sistema de suporte ao
planejamento estratégico da empresa e que ajuda no desenvolvimento de objetivos.
Exatamente no auxílio às decisões da camada estratégica da organização, em sua necessidade
de obtenção de dados úteis, organizados e de fácil visualização pelos acionistas, presidente,
diretores e gerentes de alto padrão onde procura atuar o Business Intelligence, objeto desse
estudo.
1.2 Histórico do Business Intelligence
O conceito de Business Intelligence, como hoje visto, não é tão recente. Segundo
Ribeiro et al (2003, p.1-2):
[...] A história do BI que conhecemos hoje, começa na década de 70, quando
alguns produtos de BI foram disponibilizados para os analistas de negócio. O
grande problema era que esses produtos exigiam intensa e exaustiva
programação, não disponibilizavam informação em tempo hábil nem de
forma flexível, e além de tudo tinham alto custo de implantação [...].
Efetivamente, só depois da chegada dos bancos de dados relacionais e interfaces
gráficas, somados a transações empresariais mais complexas, é que vieram a surgir
17
ferramentas mais voltadas para as necessidades de analistas de negócios. O que não
demoraria.
Foi na década de 80 que ocorreu a busca de novas metodologias, onde, como informa
Barbieri (2001, p.2), ocorreu a administração e modelagem de dados, a engenharia de
informação e a análise de dados, em contraposição ao modo empírico de processamento.
Barbieri (2001, p.2) diz ainda que também foi a época da modelagem relacional, o que
facilitava o tratamento dos dados em matrizes bidimensionais, porém ainda sem grande
preocupação com as relações de negócio das empresas.
Na época de 90 ocorreu o advento da internet e de outras fontes de informação e
comunicação. Contando com um grande apoio das formas de transmissão de dados,
computadores e outros aparatos, as pessoas tinham acesso a um enorme número de dados: é a
Revolução Tecnológica (BARBIERI. 2001,p.3).
[...] Diferentemente da Revolução Industrial, onde as benesses não
chegavam a todos diretamente, a revolução dos dados e da informação,
capitaneada pela Internet, tornou-se democrática, invasiva e de amplo
alcance.[...] (BARBIERI. 2006, p.3)
Depois do alarido do “bug do milênio”, entrou-se em um momento em que as
empresas procuravam formas de obterem mais clientes e mantê-los fiéis, serem mais flexíveis
em seus processos e se posicionarem estrategicamente com o uso inteligente de suas
informações. As grandes corporações iniciaram uma busca de ferramentas para
disponibilizarem aos tomadores de decisão informações mais seguras, completas e com maior
facilidade de interação. Surgem os data warehouses, o conceito de mineração de dados e a
possibilidade de simulações com dados históricos. Conforme Barbieri (2006, p.5), “chegamos
a era do BI-Business Intelligence, com a informação usinada a partir dos dados sendo
diretamente aplicada aos negócios[...]”. O Business Intelligence está dentro do conceito de
Inteligência Competitiva, que será conceituado a seguir.
18
1.3 Inteligência Competitiva
Mattos et al (2003, p.1) informa que “no atual contexto, as empresas estão competindo
em dois mundos: um mundo físico feito de recursos que os gerentes podem ver e tocar e o
virtual feito de informações. [...]”. Dessa forma, tem-se que a informação direciona os valores
e cria riquezas para a organização.
Não só fatores internos, mas também os externos à organização, o mercado,
influenciam no conceito de utilização da informação como uma função que agrega vantagem
competitiva. Assim, uma estratégia TI pode vir a mudar a estratégia de negócios da empresa,
porque normalmente ela é considerada ponto de partida para o planejamento de TI (MATTOS
et al. 2003, p.4).
Torna-se claro, dessa forma que a organização pode fazer uso da informação para se
tornar, cada vez mais, um player forte dentro no mercado. O uso da Competitive Intelligence
(CI), ou Inteligência Competitiva, nesse cenário, é um grande diferencial. Barbieri (2001, p.6)
informa que “a idéia básica de CI é a de explorar o outro lado da trincheira, obtendo
informações detalhadas sobre os competidores e o mercado onde se guerreia pela opção do
cliente”.
Dentro de um mundo de informações, encontrar aquelas que realmente podem vir a ser
úteis a empresa para competir com seus concorrentes, não é tarefa fácil. É importante utilizar
mecanismos de rastreamento para conseguir dados importantes, para futuramente, ocorrer a
possibilidade de uso de ferramentas como o Planejamento Analítico On Line, geradora de
informações úteis. Ainda segundo Barbieri (2001, p.7), “podemos entender CI como um BI
aplicado ao mundo fora de nossas fronteiras empresariais focado primariamente em
informações textuais e factuais que dizem respeito aos movimentos do mercado e dos
concorrentes”.
19
Não é difícil entender assim que os dados, devidamente filtrados, podem vir a ser
processados de modo a tornarem-se informações úteis que, bem trabalhadas e empregadas,
tornam-se conhecimento. Esse conhecimento utilizado de forma estratégica torna-se fator de
ganho de competitividade pela empresa. O Business Intelligence, que será tomado a seguir,
procura criar esse cenário para a organização.
1.4 Conceito geral de Business Intelligence
Business Intelligence, inteligência de negócios, em português, base da Inteligência
Competitiva, é um conjunto de metodologias e conceitos disponibilizados em ferramentas que
procuram dar condições para organizações tomar decisões e a possibilidade de obtenção,
armazenamento e filtragem para a formatação de dados úteis para a análise e criação de
informações relevantes, como indicadores de desempenho. O Business Intelligence é uma
ferramenta de auxílio da análise e geração de informações úteis para tomada de decisão,
especialmente do gerente de alto nível.
[...] Da mesma forma que as montadoras de automóveis criam novas versões
de modelos antigos para gerar demanda, o mercado de tecnologia inventa
siglas e diferentes abordagens para temas já existentes. BI é um exemplo
clássico. A sigla é uma roupagem nova para os já conhecidos Sistemas de
Apoio à Decisão (SAD) baseados em fatos, ou Executive Information System
(EIS), que existem há muito tempo mas carregavam no passado um
impeditivo para sua difusão em larga escala: o custo das ferramentas.[...]
(MYLIUS. 2003, p. 21)
Essa é uma ferramenta poderosa, capaz de utilizar de modo eficaz os dados oferecido
pelo Data Warehouse ou Data Marts (bancos de dados dimensionais que serão abordados mais
a frente), com conceitos de cubos de informações e mineração de dados, possibilidade de
sumarização e expansão de informações. A grande vantagem do uso do Business Intelligence
é essa: a possibilidade de contar com uma aplicação robusta que vem em auxílio ao processo
20
de decisão crítica, com velocidade e confiabilidade. Valle et al (2005, p.112) considera que o
Business Intelligence é um veículo que permite as empresas definir, estabelecer e manter a
vantagem competitiva, mesmo num momento em que os dados de negócio são tão complexos
e volumosos. A figura 2 pode ilustrar o posicionamento do Business Intelligence na empresa.
Inteligência
Competitiva
- Dados
- Metadados
- Combinações
Figura 2 - o ambiente organizacional e o lugar do Business Intelligence
Fonte – Elaborado pelos autores.
Em vista de todo o exposto até o momento, pode-se entender que o Business
Intelligence, que é o resultado de conceitos amadurecidos ao longo dos anos, vem oferecer
uma proposta de informações de alta qualidade para que uma organização possa vir a tomar
decisões e até re-planejar seu negócio essencial. Essa metodologia oferecida às organizações
será discutida a seguir.
21
CAPÍTULO 2 – APLICABILIDADE E UTILIDADE DO BI
Não basta saber o que é Business Intelligence. É importante saber efetivamente para
que o utilizar, o que ele faz e quais são os diferencias de vantagens agregados a ele, além das
tendências do ambiente que o contém.
2.1 Necessidade das empresas e modelo de negócio
As empresas hoje necessitam serem extremamente ágeis e flexíveis em suas decisões e
operações para que consigam galgar maior competitividade, almejando maior riqueza,
reconhecimento e lucratividade. Sem o uso de informações críticas, se torna impraticável esse
processo decisório.
[...] Com o advento da globalização ficou praticamente inadmissível ficar
desinformado. O mundo ficou mais competitivo, as empresas e clientes,
ficaram mais ágeis. As empresas fazem parte do mundo dos negócios e esse
visa lucro, com retorno dos investimentos no menor tempo possível. Numa
esfera altamente competitiva como esta, as informações assumem um papel
fundamental no sucesso das organizações. [...](RIBEIRO; et al. 2003, p.1)
A forma de negócio que a empresa vem a utilizar, seu modelo de negócio, é baseada
em uma série de decisões, fundadas em variáveis provindas do relacionamento com os
parceiros, bem como com o cliente (no valor das ofertas a ele oferecidas, nas formas de
distribuição). Além disso, depende também da formatação da competência essencial, da
estrutura de custo e canais de lucratividade, e das operações produtivas ou negociais. Assim,
de acordo com a forma como se executa cada atividade, somada ao valor que é adicionado,
bem como as despesas, é possível determinar se a empresa possui alto ou baixo custo em
relação à sua concorrência.
22
Para melhor entendimento do que seria modelo de negócios, pode-se considerar que
ele é a forma como a empresa responde ao seu ambiente de negócios, ou seja, é como ela
conduz os negócios. Para exemplificar, é possível considerar as formas de duas empresas que
vendem os mesmos produtos, porém para tipos de clientes, canais de venda, formas de entrega
e suprimentos diferentes. Um modelo de empresa poderia vir a se valer de uma forma mais
tradicional, com vendas no seu estabelecimento, e comprando de fornecedores que ofereçam o
preço mais baixo.
Um outro modelo existente poderia ser de uma empresa que efetua negócios pelo
ambiente web, abordando clientes que compram pela internet, efetuando entrega por correio e
comprando de fornecedores estratégicos, que garantam qualidade e velocidade na entrega. São
exemplos de duas formas diferentes de fazer negócio, ou seja, são duas formas diferentes de
modelos de negócio, entre muitos. É possível observar que dentro de um modelo de negócios
existem várias regras de negócios, que são as prescrições pontuais do negócio. Por exemplo, a
forma como o cliente efetua um pedido, é uma regra de negócio dentro de um modelo de
negócios que forma um cenário de alguma organização.
O modelo de negócio, desse modo, deve estar corretamente estabelecido com as
diretrizes estratégicas da organização, bem como deve ser corretamente acercado por alguma
análise para que possa vir, efetivamente, a ser passível de tomada de decisão. Com
informações transviadas uma tomada de decisão acerca de estratégia, objetivo ou modelo de
negócio da empresa pode vir a ser enviesada. Porém, com informações corretas na mão, um
líder pode vir a estabelecer melhores estratégias, objetivos, metas e posicionar,
adequadamente, um modelo de negócios viável e competitivo.
[...] A tecnologia da informação pode ajudar todos os tipos de empresas a
melhorarem a eficiência e eficácia de seus processos de negócios, tomada de
decisões gerenciais e colaboração de grupos de trabalho e com isso pode
fortalecer suas posições competitivas em um mercado em rápida
transformação. [...] (O’BRIEN. 2004, p.3)
23
No momento atual o que a organização precisa é: informações relevantes que
permitem um ato resolutivo eficiente, que possibilita o estabelecimento de objetivos, metas,
análise dinâmica de riscos e demais outras variáveis concernentes à sua sobrevivência e
competitividade. Afinal o que ela quer é trabalhar com conjeturas e simulações, analisar
contextos, relações de causa e efeito, saber quem pode ser seu concorrente, onde pode ou deve
investir, além de outros informes.
[...] Os negócios de hoje encontram-se em transição em função do cenário
econômico, da competitividade e da evolução tecnológica. As corporações
buscam mais eficiência na tomada de decisões, logo necessitam de
ferramentas que transformem os dados em informações estratégicas para
agilizar a gestão do complexo empresarial. [...] (RIBEIRO. 2003, p.2)
Essa necessidade que a empresa possui demanda a utilização de metodologias e
conceitos adequados. A concepção para essa solução pode ser encontrada no Business
Intelligence.
2.2 O que uma ferramenta de Business Intelligence oferece
Uma ferramenta de Business Intelligence oferece a possibilidade de levantamento de
informações de diversas formas, com o uso de uma interface para o usuário final
relativamente amigável. Esse levantamento de informação tem o ponto de partida em
armazenamento de dados, em bancos multidimensionais, e sua garimpagem, com a utilização
de ferramentas de mineração de dados. Essas tecnologias serão discutidas futuramente.
Como os dados históricos da empresa e outros dados internos e externos estão em um
repositório simples de dados, é possível utilizá-los em buscas e formas de obtenção de
informações úteis. Uma ferramenta de Business Intelligence permite obter resultados com
variáveis esperadas como, por exemplo, quando se pretende efetuar uma projeção do valor de
24
seus ativos perante o mercado, tanto quanto resultados inesperados, como o apontamento da
existência de um possível novo concorrente. Mylius (2003, p.54) diz que “as necessidades de
geração de informações mais conhecidas são aquelas referentes a clientes, faturamento,
margem e custos [...]”.
Como já citado, o perfil da interface para o usuário final é importante. Em geral, as
ferramentas de BI possibilitam a utilização de vários formatos de interface. Conforme Mylius
(2003, p.37) “a vontade do usuário é ter uma interface amigável e intuitiva para acessar,
analisar e compartilhar informações. Ele precisa obtê-las através de uma interface de sua
própria escolha, como Web, Windows, Excel ou e-mail [...]”.
Os administradores necessitam de uma ferramenta segura, que permitam comunicação
em rede e com escalabilidade, ou seja, que supra a demanda de utilização por parte dos
usuários. O Business Intelligence ainda deve suprir as necessidades de informação de áreas
específicas, possibilitando informações expressas por gráficos, por indicadores de
desempenho, como Margem de contribuição e outros, considerando cenários alternativos, e
relatórios que geralmente estão dispostos em planilhas obtidas em menor tempo, abrindo
caminho para utilizar a maior parte do tempo nos principais processos estratégico, que são
analisar e decidir.
Segundo Mylius (2003, p.37), os desenvolvedores necessitam de uma ferramenta de
alta tecnologia para gerar qualquer tipo de análise. Estes relatórios podem exigir que a
ferramenta disponha de análises matemáticas, financeiras e estatísticas, entre outras.
[...] Sistemas de BI se destinam a atender usuários da área de negócios que
esperam extrair informações a partir dos dados coletados. Muitas vezes
milhares de transações são compiladas para se calcular um único indicador
(ou métrica). [...] (CRIVELINI. 2006, p.7)
25
A solução de Business Intelligence que não possibilitar esse tipo de recurso, não pode
ser considerada como tal. Já para aquelas que configuram este tipo de solução e são
corretamente implementadas nas empresas, é comum esperar bons resultados.
Para que uma organização venha a entrar em um projeto de Business Intelligence, é
importante que defina e entenda muito bem sua missão, seus objetivos, ou seja, qual é a
necessidade que possui e onde quer chegar, pois o Business Intelligence disponibilizará
apenas o resultado da inserção e processamento de modo adequado da inteligência potencial
da empresa em um sistema.
2.3 Diferencial Competitivo
Pelos benefícios já expressos anteriormente, o tipo de abordagem que o Business
Intelligence oferece ao utilizar o conhecimento potencial da empresa possibilita uma
visualização integral do negócio da empresa e uma correta disposição dos dados para os
usuários, com diversas origens. Isso cria maior potencial para a empresa focar esforços
negociais e, assim, aumentar sua competitividade.
[...]O uso dessas ferramentas integra os dados existentes nos sistemas ERP e
CRM, proporcionando a fidelização de clientes, a otimização de alocação de
recursos, o aumento de vendas cruzadas e casadas e a melhoria de qualidade
de produtos e serviços prestados. [...](Batista. 2006, p.122)
Em um cenário global em que as organizações estão, com muitos competidores e com
formas diferentes de competir, como a internet já vem oferecendo há algum tempo, faz com
que seja mais importante entender o que o cliente quer do que como produzir da melhor forma
um produto, e isso é oferecido pelo Business Intelligence. Desse modo, ele permite adequar
seu negócio e processos correlatos rapidamente.
26
Conforme Borges (2005, p.14), o uso de Business Intelligence pelo Grupo Shell cria
condições de geração de 18 milhões de dólares por ano, reduzindo custos. Assim, só no
Brasil, em 2005, o grupo teria investido 600 mil reais em um ano nesse recurso.
Conhecendo profundamente seus clientes uma empresa poderia criar formas pró-ativas
de abordá-los, com bons programas de marketing. Ou, com um cruzamento de dados entre
produtos defeituosos devolvidos e vendas efetuadas gerando um relatório adequado, poderia
gerenciar suas relações com parceiros e fornecedores. Ou ainda, obter a possibilidade de
verificar a manutenção dos clientes que iriam mudar de fornecedor. Esses exemplos e outros
mais poderiam expressar vantagens da utilização do Business Intelligence.
[...] O que importa, no fundo, é o cultivo de um bom relacionamento com o
elemento principal do circuito, que é o cliente. O que se vende, e como se
vende parece ganhar status de menor importância do que o fato de poder
estar mais próximo dele: sua majestade o cliente. (BARBIERI. 2001, p.11)
A tomada de decisão da empresa visa atingir o cliente. Afinal é Inteligência de
Negócio, e o negócio é a relação entre cliente e seu fornecedor, principalmente.
A organização não dispõe apenas de dados formalizados para poder efetuar seu
trabalho. Ela conta também com o conhecimento empírico e subjetivo das pessoas que a
compõem. A tendência de se aproveitar esse tipo de conhecimento, além de outros fatores, faz
com que a busca por ferramentas de auxílio não cesse. Isso pode ser visto na seqüência.
2.4 Tendências
O sucesso de uma empresa nesse século será daquela que melhor tirar proveito das
informações e conhecimento como riquezas, bem como geradoras de outras riquezas. No
momento atual, onde as organizações já dispõem e empregam o Business Intelligence para
27
obter informações passíveis a serem diretamente empregadas nos negócios, já existem outras
tendências que já começaram ou iniciaram sua caminhada. Um exemplo poderia ser o
Knowledge Management System que, conforme BABIERI (2001, p.5), é a próxima fase de
transformação do gerenciamento do conhecimento, que seria uma outra abordagem para
suporte a tomada de decisão menos compartimentada e estruturada, como o Business
Intelligence, e mais trabalhada com o ativo de informações da empresa, tanto formais quanto
informais.
[...] As tecnologias de Gestão do Conhecimento mais recentes e, portanto, a
caminho da maturidade, podem combinar os sistemas de gestão de conteúdo
atuais e a Web, como as funções e capacidades de mineração de texto, para a
geração de maior valor a partir da exploração de fontes de informações
textuais. [...] (VALLE. 2005, p.168)
Segundo Barbieri (2001, p.6) o grande desafio das empresas hoje, não é somente
organizar o Knowledge Management System, mas também estabelecer uma ponte entre
ambos, fazendo com que Business Intelligence possa ser colado com Knowledge
Management System. O papel do Business Intelligence seria disponibilizar as informações,
enquanto o do Knowledge Management System seria as combinações e disseminações de
forma a transformarem a informação em conhecimento. As tecnologias poderão se fundir
acoplando e disponibilizando ferramentas entre si, o que pode inspirar outros conceitos.
[...] A gestão do conhecimento ou Knowledge Management (KM) e a
inteligência de negócios ou Business Intelligence (BI), aplicados juntamente
com os recursos dos Sistemas de Informação e da Tecnologia da Informação,
podem facilitar a geração de informações oportunas para favorecer os
decisores empresariais em suas atividades estratégicas. Esses recursos devem
estar alinhados com os objetivos estratégicos da organização, contemplados
em planejamento formal, competente e contextualizando com inovação
tecnológica competitiva. [...] (REZENDE, ABREU. 2003, p.221)
28
Outro fator importante a ser considerado são os negócios feitos pelas internet. É
necessário viabilizar a união entre tecnologia e os novos modelos de negócio.
Sempre quando aparecem propostas negociais inovadoras como Comércio
Eletrônico, torna-se fundamental observar como se dará o encaixe, neste
novo cenário, das tecnologias existentes e daquelas que se encontram em
fase de maturação. [...] (BARBIERI. 2001, p.234)
Informações antes pouco importantes, como a visita de um cliente ao ambiente onde
efetuará a sua compra, quando no meio web devem ser registrados, mesmo que seja para
levantar informações de comportamento dele antes da compra, ou mesmo que não a efetue.
Esse conhecimento de comportamento é necessário para poder efetuar ações que impeçam os
clientes migrarem para a página de compra do concorrente. Essa proposta deve ser acatada
pelo e-Business Intelligence, que é o uso do Business Intelligence no ambiente web, seja puro
ou misto (web mais negócio direto).
[...] Isso claramente aumenta o sentido de competitividade da empresa,
impedindo brechas de indisponibilidade que possam ensejar aos seus clientes
saltos para sites de competidores e até possíveis quebras de fidelização.
Quanto mais não fosse, por causa do ambiente dinâmico e volúvel dos
comércios digitais, onde um simples clique separa duas opções de negócios.
(BARBIERI. 2001, p.235)
Focando no que toca diretamente o Business Intelligence, Ribeiro et al (2003, p.6)
informa que na América Latina 40% das empresas pesquisadas estão avaliando ou planejando
implementar aplicativos de Business Intelligence, o que no Brasil atinge 50%. Conforme
Batista (2006, p.122), o Business Intelligence é o segundo maior investimento das
organizações.
Desse modo, é possível perceber que uma empresa que considera a informação como
um bem ativo e a utiliza de uma forma inteligente pode melhorar significativamente seus
resultados. É importante observar também que, como as empresas não são estáticas e mudam
29
de cenário, as metodologias de inteligência competitiva ou de negócios também tem que
evoluir, criando similaridades e condições de relação entre si, e criando condições de se
adequar aos vários modelos de negócio existentes. O Business Intelligence procura criar
condições para melhor utilização da informação por quem tem que tomar decisão, o que
depende da forma de como ele é modelado para poder ser explorado.
2.5 Produtos de Business Intelligence
No mercado existem vários produtos de Business Intelligence disponibilizados às
organizações. Além da forma tradicional de Business Intelligence, várias empresas de
tecnologia criaram ou criarão produtos que se fundirão ou que incorporarão funcionalidades
de outras ferramentas.
Barbieri (2001, p.214) fala sobre três ferramentas que poderão vir a ser importantes:
O BW (Business Information Warehouse) da SAP tem alta chance de
trilhar o caminho de sucesso de seu produto irmão R/3, com quem se unirá
formando a parelha ERP e BI que deverá estar presente nas grandes
empresas nesse milênio que se inicia. É um componente opcional da nova
arquitetura Mysap.com da SAP.
O Oracle Express, produto oferecido como solução de BI, da Oracle,
empresa dominante no cenário de Banco de Dados e uma das líderes do
segmento de Data Warehouse e Data Marts.
O produto Analysis Services da Microsoft, que provavelmente cumprirá
um importante papel de democratização dos conceitos OLAP, levando, ao
capilarizado mundo MS, uma alternativa de implementação de BI.
Além dos produtos citados acima, existem muitos outros, como o Report Manager da
Ariacom Business Reports, a ferramenta que será utilizada para o estudo de caso do capítulo
4. Afora essas ferramentas, existem muitas outras no mercado que as empresas podem vir a
utilizar, de acordo com sua necessidade e do que os fornecedores podem vir a disponibilizar.
30
CAPÍTULO 3 – AS TECNOLOGIAS QUE COMPÕEM O BI
Nesse capítulo serão abordadas as partes de um sistema de Business Intelligence, em
linhas gerais. Isso para que se possa entender de uma melhor forma como a ferramenta capta,
trabalha e disponibiliza as informações.
3.1 A modelagem multidimensional
A base do Business Intelligence é o Data Warehouse. Esse é um projeto que utiliza o
modelo multidimensional em sua criação, disponibilizando os dados na forma de um cubo,
com várias perspectivas.
[…] Quando falamos em modelagem multidimensional, estamos nos
referindo à definição de um modelo que se destina à análise de dados. No
que diz respeito à análise de dados, o que se espera do modelo de dados é
que:
Seja uma representação simples do modelo de negócios estudado;
Seja um modelo físico de fácil interpretação, de modo que usuários
sem treinamento formal em TI, possam entendê-lo;
Facilite a implementação física do modelo de modo a maximizar
performance das consultas de dados. […] (CRIVELINI. 2006, p.6)
Em geral, utiliza-se dos mesmos métodos da modelagem relacional para a modelagem
multidimensional, como o uso de tabelas, atributos e relacionamentos. Porém, dentro dessa
abordagem a normalização não é uma premissa, pois pode haver dados redundantes. Isso
ocorre porque dados replicados permitem maior performance. Barbieri (2001, p.80) fala que
“a rígida blindagem da normalização, por exemplo, se curva, vez por outra nesses projetos, à
necessidade de estruturas mais ágeis, mesmo com um sintomático aumento no custo de
armazenamento”.
31
Nesse modelo existem duas tabelas que o compõe: a Fato e a Dimensão. A tabela Fato
armazena um ou mais fatos que são números de medida decorrentes de eventos do cenário de
negócios. Essa tabela possui uma chave-primária composta, advinda do relacionamento com
as tabelas dimensão que mantém. O tipo de dado nela existente, normalmente, é aditivo, que
permite operações matemáticas, além de certo modo estático. Já as tabelas Dimensão são
aquelas que filtram os valores da tabela fato. Seu relacionamento com a tabela fato é um para
muitos, e possuem chave-primária que compõe a chave-primária da tabela Fato com a qual se
relacionam. Ela representa a entidade do cenário como, por exemplo, cliente, produto, etc.
Também é por onde se efetua consultas no Data Warehouse ou no Data mart. As duas tabelas
serão abordadas novamente adiante. O relacionamento entre os dois tipos de tabela pode ser
exemplificado na figura 3.
VENDAS
PRODUTO
Cod_Produto
1/N
Cod_Dia (FK)
Cod_Filial (FK)
Cod_Produto (FK)
FILIAL
1/N
Cod_Filial
Qtde_Vendida
Valor_Total
1/N
DIA
Cod_Dia
Figura 3 - As tabelas Dimensão (Produto, Dia e Filial) relacionadas com a tabela Fato Vendas.
Fonte – Elaborado pelos autores.
Na figura 3 é possível verificar o relacionamento um pra muitos que as tabelas
Dimensão Produto, Filial e Dia possuem com a tabela Fato Vendas. Nesse tipo de
relacionamento, um para muitos, a tabela Fato recebe a chave-primária das tabelas Dimensão,
que perfazem uma chave-primária composta para ela.
32
Para efetuar uma modelagem dimensional é necessário definir claramente a área de
negócio que se quer abordar de acordo com a prioridade da organização (BARBIERI. 2001,
p.82). Em seguida, deve-se definir seus processos. Por exemplo, dentro da área de negócio
Vendas da empresa, um dos principais processos poderia ser o de controlar pedidos.
Tudo isso deve ser abordado de modo a ser compreendido completamente em seus
relacionamentos, objetos, etc. Logo após esta fase, é necessário determinar a granularidade
para o controle do processo, ou seja, a combinação de dimensões para armazenar dados em
determinados fatos.
Um exemplo seria considerar as vendas diárias de determinada filial, o que exigiria a
granularidade Produto-Filial-Dia. Um outro seria as vendas mensais da filial, ajustando a
dimensão tempo de dia para mês, perfazendo a granularidade Produto-Filial-Mês. É
importante observar mais duas coisas sobre granularidade, uma é a relação com a tarefa à
executar, por exemplo, se o processamento deve ser feito diariamente, então usa-se a
dimensão dia. Outro ponto é o custo dos dados históricos em contrapartida da informação
requerida.
O volume pode ser estimado através de uma média de combinação entre as
dimensões. Por exemplo,suponha que em cada loja, na média, num
determinado dia, são vendidos 10.000 produtos. Se tivermos 200 lojas e
desejarmos armazenar os dados por 2 anos (365*2) teríamos algo em torno
de (10.000*200*730)1,46 bilhão de registro . Se considerarmos que teremos
três chaves (chave-produto, chave-loja, chave-dia, cada qual com 5 bytes) e
três valores numéricos (cada qual com 4 bytes) teremos a bagatela de 1.46
bilhões de registros x 27 bytes (15+12), o que levaria a um montante de 39,4
gigabytes, sem contar gastos com índices e outra tabelas acessórias. Note
que estamos considerando somente uma tabela Fato.perceba que qualquer
acréscimo em uma das variáveis dimensionais, pode elevar o volume
calculado à patamares estratosféricos. Aqui caberia, entre outros um
questionamento sobre a dimensão temporal.Dois anos são suficientes para se
perceber os padrões escondidos de comportamento de vendas de produtos
em lojas, que as ferramentas de Data Mining se propõem revelar?
(BARBIERI. 2001, p.83-84).
33
3.1.1 As Tabelas Dimensão
Para as tabelas dimensão é importante a seqüência de três passos: Sua definição, sua
normalização e o relacionamento de seus atributos.
As dimensões, geralmente, relacionam-se com o objeto, o tempo e o espaço de
determinado cenário. Quanto melhor definida as dimensões, maior a possibilidade de se
utilizar delas em análises. Por exemplo, um objeto importante de ser definido é o Cliente. Já
um espaço a ser definido poderia ser Cidade. Geralmente o Ano é uma das noções de tempo
utilizadas nos projetos de Business Intelligence.
Depois de identificar uma dimensão é necessário identificar a existência de hierarquia.
Por exemplo, para a dimensão tempo poderia existir a hierarquia ano, mês e dia entre outros.
Essa hierarquia irá compor os atributos da tabela dimensão de tempo: Td_Dia (cod_dia, ano,
mês). Deve existir a conformidade das dimensões, ou seja, elas devem conter o mesmo
conteúdo semântico, segundo Barbieri (2001, p.92). Isso deve ser feito com uma
granularidade o mais detalhada possível, conforme a necessidade, e com o sentido de
hierarquia correto, o que diminui possíveis impactos de relacionamentos incompatíveis.
Para que ocorra a normalização das tabelas dimensão é necessário escolher entre dois
esquemas. Um deles é o de Estrela, onde não ocorre normalização. O outro é o de Flocos de
neve, onde ocorre normalização por camadas.
No esquema Estrela as informações são mantidas todas na tabela, mesmo que estas já
estejam contidas em outras tabelas, havendo redundância. Porém, essa redundância permite
uma maior performance, por isso é normalmente o esquema mais utilizado. Conforme
Barbieri (2001, p.86), “a utilização do esquema estrela (Star schema) é extremamente
recomendável, pelos aspectos de ganho de performance, quando comparado com o esquema
de flocos de neve (snowflake) [...]”.
34
O modelo de flocos de neve que, por seu lado, mantém a informação sem redundância
guardando em apenas uma tabela, permite uma redução no uso do espaço. Essa redução,
todavia, é ínfima perto do espaço utilizado pelas Tabelas Fato.
Para os atributos da Tabela Dimensão, quando se quando se fala em relacionamentos,
pode haver três formas. A primeira é o não relacionamento entre si, o que confere
independência para as tabelas. A segunda é o relacionamento um para muitos, provindo da
hierarquia. Por fim existe o relacionamento muitos para muitos, onde uma característica
representada na tabela dimensão pode se relacionar uma ou mais vezes com uma outra, e vice
versa.
Entre as dimensões ainda pode ocorrer combinações, ocorrendo de serem colocadas
em uma única tabela. Isso se dá quando elas ocorrem constantemente juntas e ocorre a
combinação de seus valores.
Deve-se ainda atentar para o que Barbieri (2001, p.99) chama de dinâmica das
dimensões, que consiste na forma de gerenciamento e armazenamento de informações quando
ocorrem mudanças ou atualizações em tabelas já existentes. Existem três estratégias para
resolver esse problema. A primeira é simplesmente substituir os dados antigos pelos novos, o
que faz perder os registros históricos dessas informações. A segunda forma poderia ser criar
versões da dimensão, com o uso de delimitadores como data de início dessa versão, o que
permite a permanência dos registros históricos dessas dimensões em seus diversos perfis ao
longo do tempo. Por fim, existe a criação de dois campos de registros, o que mantém parte do
histórico dos registros, o atual e o anterior somente.
No caso de projetos de dimensões com alto volume e alta volatilidade, a
estratégia recomendada é a divisão dos dados da dimensão em dois registros
diferentes, separando-se os dados estáticos dos dados voláteis. Essa
estratégia, comum nos projetos de Bancos de Dados, criará uma situação
onde os atributos da dimensão estarão em dois registros diferentes, com
chaves separadas para identificá-los em um relacionamento que permita a
junção deles. [...] (BARBIERI. 2001, p.101)
35
Existem ainda algumas dimensões que são consideradas descartáveis. São aquelas que
não mantém muita relação com a tabela Fato. São dimensões que guardam informações
diferenciadas e geralmente pequenas como, por exemplo, sexo (masculino/feminino). São
importantes para efetuar filtros nas buscas e permitem abordar situações específicas através de
combinações entre elas.
Tanto para as tabelas Dimensão e, consequentemente, para as tabelas Fato em sua
chave composta, é recomendável o uso de chaves artificiais, ou seja, de identificadores
inteiros gerados pelo Sistema Gerenciador de Banco de Dados. Isso gera vantagens como
garantia de unicidade de chave, chaves menores do que as naturais em geral, implementação
automática de chaves, entre outras.
3.1.2 As Tabelas Fato
Além de identificar quando da existência de tabela Fato e como é formada sua chave
primária, o que já foi abordado anteriormente, é importante identificar os valores que deverão
ser armazenados, ou seja, os atributos que irão guardar as informações mais importantes para
a tomada de decisão. Esses atributos recebem, assim, valores provenientes das dimensões e
que são calculados como, por exemplo, valor total de vendas, entre outros. Esses valores são
chamados também de métricas.
Existem basicamente três tipos de métricas. Essa tipologia provém da capacidade de
efetuação de soma dos valores, e ocorre da seguinte forma:
-
Métrica aditiva: ocorre quando é possível somar os valores em todas as dimensões;
-
Métrica Semi-aditiva: é quando faz sentido efetuar soma em uma só dimensão;
-
Métrica Não-aditiva: é quando não tem sentido efetuar soma nos valores em dimensão
qualquer. Conforme Barbieri (2001, p.89), “observe que dependendo da modelagem do
36
negócio, poderão aparecer várias tabelas Fato necessárias aos registros dos produtos nas suas
dimensões. [...]”.
Existem tabelas Fato sem métricas, ou seja, sem atributos de nenhum tipo. Essas
tabelas servem para relacionar as tabelas Dimensão envolvidas, onde o resultado é gerado
justamente por esse relacionamento. Também podem existir subtipos de tabelas Fato de
acordo com a necessidade do modelo de negócio, onde ocorrem classificações para abordar
dimensões de um mesmo tipo, porém com métricas diferentes. É o conceito de entidades Tipo
e Subtipo focado para a modelagem dimensional (BARBIERI. 2001, p.107).
É possível ainda que venha existir tabelas agregadas. São aquelas que são predefinidas
que disponibilizam informações gerenciais costumeiras. Porém é necessário cuidados no
momento de definir e criar tabelas desse tipo.
[...] Os valores agregados representam paradoxalmente uma solução e alguns
problemas. Solução, porque estabelece a definição e a criação de tabelas
prontas, trabalhadas e sumariadas em várias dimensões, e que facilitam os
acessos aos dados e agilizam os processos decisórios. Problemas, pois
agridem de certa forma os processos canônicos de não-redundância,
estabelecidos nos preceitos de projetos de Banco de Dados desde a sua
criação. Além disso, obviamente, gastam mais espaço, pois exigiram uma
coleção de tabelas Fatos ou Dimensão, agora dedicadas ao armazenamento
de dados num estado já pré-processado. (BARBIERI. 2001, p.109-110)
A definição de metadados (ou metainformações) é muito importante para o ambiente o
Data Warehouse / Data Mart e de ferramentas Processamento Analítico On Line (BARBIERI.
2001, p.114). Estes são os dados que definem que tipos de dados as métricas recebem e
colocam limites em sua apresentação. Eles permitem o uso eficiente do ambiente de Data
Warehouse, pois são gerados pelo levantamento de requisitos, bem como pela disposição da
informação para ser visualizada, e mantém informação tanto para a área técnica, criando uma
estrutura de dados técnicos, quanto para a área gerencial, possibilitando uma estrutura de
informações negociais.
37
São pelos metadados que ocorre a conversão dos dados quando serão inseridos nos
Data Warehouse / Data Mart, a definição de como serão modelados e como as informações
deverão alimentar os repositórios, bem como a forma a serem apresentados em cubos de
informações. Segundo Barbieri (2001, p.115), significa que uma certa aplicação
Processamento Analítico On Line poderia utilizar vários Marts, e que cada Data Mart poderia
estar presente em várias aplicações.
Essas informações são úteis, porém exigem cuidados. Isto se deve ao fato de que os
metadados geralmente estão dispostos em vários repositórios, o que compromete a
construção, manutenção e aplicação do Data Warehouse.
3.2 Data Warehouse (DW) e Data Mart (DM)
O Data Warehouse é um banco de dados que se utiliza da modelagem dimensional.
Segundo Mylius (2003, p.31-32) o Data Warehouse deve ser orientado para atendimento dos
principais assuntos, integrar dados de diferentes sistemas, e conter informações não voláteis e
históricas.
[...] Para uso efetivo desta tecnologia de DW nos Sistemas de Informação
Executivos, ela deve ser trabalhada de forma integrada a outras tecnologias,
incluindo as ferramentas e recursos de Decision Support System, Sistemas
Gerenciadores de Banco de Dados, Executive Information System,
aplicações On-Line Transaction Processing (OLTP) e Data Mining [...]
(REZENDE, ABREU. 2003, p.212)
Como se pode observar, ele armazena os dados que podem ser extraídos de diversos meios ou
bancos de dados (O’BRIEN. 2004, p.142). É o repositório que centraliza as informações de
um modelo de negócios de modo organizado, e permite o acesso a elas para aplicações de
ferramentas analíticas, conforme indica a figura 4.
38
Figura 4 - Um Data Warehouse que recebe informações de diversas fontes
Fonte – Elaborado pelos autores.
O Data Warehouse pode ser composto de vários Data Marts, que nada mais é que a
aplicação da modelagem dimensional para uma parte de um modelo de negócios, ou seja,
como informa O’brien (2004, p.142) os Data Marts focam aspectos específicos, como um
departamento, de uma empresa. A figura 5 pode esclarecer de como esse mecanismo
funciona.
39
Figura 5 - um Data Warehouse composto de vários Data Marts
Fonte – Elaborado pelos autores.
Geralmente, os Data Warehouses / Data Marts possuem uma ferramenta
Processamento Analítico On Line, que permite análises de dados em grande quantidade
rapidamente, criando visões dos aspectos que mais interessam. Para isto, na criação do Data
Warehouse / Data Mart é necessário definir os fatos, as dimensões, os atributos e a
granularidade das informações (conceitos da modelagem multidimensional) realmente
importantes para o negócio.
[...] Gostaríamos de destacar que devem ser avaliados e escolhidos os
atributos que sejam importantes para a análise. O Data Warehouse / Data
Mart não deve ser confundido com um grande cadastro de informações,
muitas vezes repletos de dados não utilizados pelos usuários. [...]
(ITALIANO, ESTEVES. 2005, p.38)
São pontos da criação do Data Warehouse / Data Mart :
Tamanho: é importante estimar o tamanho que o banco de dados ficará. Para tanto,
primeiro se calcula o espaço necessário à tabela fato (a maior parte do tamanho do banco),
para as tabelas dimensão e para os índices. Também é importante cuidar da área de trabalho
40
que será utilizada no momento da execução de comandos SQL e dos agregados (BARBIERI.
2001, p.150-151). Segundo Crivelini (2006, p.8-9) as tabelas Fato representam 95% do
tamanho do banco de dados porque, além de gigantescas, elas tendem a crescer com o tempo,
pois o Business Intelligence faz uso de informações históricas, que não param de acontecer.
Tabelas e atributos: é importante observar os metadados que serão utilizados na tabela
para representar determinados dados, pois poderão impactar no tamanho que será necessário
para as tabelas e, consequentemente, no espaço utilizado por elas, bem como é importante
atentar para atributos que permitam valores nulos, que deverão ser evitados nas tabelas Fato.
Também é interessante lembrar do uso de chaves artificiais, que além de outras vantagens
permitem a neutralidade semântica, não interferindo nas regras de negócios e relacionamentos
(BARBIERI. 2001, p.155).
Inserção das informações nos bancos de dados e sua atualização: como é crescente o
tamanho do Data Warehouse / Data Mart, é necessário às organizações Segundo Barbieri
(2001, p.163) é importante o cuidado do mapeamento dos dados entre a fonte e o Data
Warehouse / Data Mart, bem como na forma de transformação efetuada nos dados. É
imprescindível essa transformação de modelos.
Existem algumas atividades básicas que compõe o processo de
transformação do modelo de dados da empresa em um modelo de Data
Warehouse. São elas:
1. Remoção de dados puramente operacionais;
2. Adição de um elemento de tempo à estrutura da chave do data
warehouse, se um desses elementos já não estiver presente;
3. Adição de dados derivados apropriados;
4. Criação de artefatos de relacionamentos;
5. Acomodação dos diferentes níveis de granularidade encontrados no data
warehouse;
6. Fusão (merge) de dados semelhantes provenientes de diferentes tabelas;
7. Criação de arrays de dados;
8. Separação dos atributos de dados de acordo com suas características de
estabilidade. (ITALIANO, ESTEVES. 2005, p.60)
41
Performance: segundo Barbieri (2001, p.165) fala do problema que pode vir ser o caso
da performance:
[...] Os altos volumes de dados, definidos pela necessidade de granularidades
finas que permitam a captura dos indicadores de negócios, aliados às
possibilidades variadas de combinações de dimensões, sugerem problemas
potenciais de performance [...]
Para criar um padrão de performance, algumas empresas que formavam o TPC
(Transaction Processing Council), como IBM, Sun, etc., reuniram-se e definiram o TPC-D,
que servia para medir a relação custo / benefício do Data Warehouse ou Data Mart, onde eles
deveriam efetuar certo número de comandos SQL em diversas situações. Futuramente esse
padrão foi substituído por outros padrões como o TPC-R e o TPC-H.
3.3 OLAP (On Line Analytical Process)
O On Line Analytical Process ou Processamento Analítico On Line, é uma ferramenta
de análise de relacionamentos complexos entre as informações inseridas nos repositórios
multidimensionais, para descobrir padrões, tendências e situações incomuns. Permite também
que os gerentes e analistas examinem de modo interativo e possam manusear grande
quantidade de informações (O’BRIEN. 2004, p.284). Assim, conforme Rezende e Abreu
(2003, p.221), “ o Olap suporta a análise da tendência, os cenários e as projeções de negócios,
como instrumento de suporte às decisões gerenciais e estratégicas[...]”. A forma principal da
disposição das informações levantadas por ele é a de um cubo de dados.
[...]De forma resumida, o cubo é uma estrutura multidimensional que
armazena os dados tornando-os mais fáceis de se analisar. Cada cubo contém
uma tabela de fatos e várias dimensões. Por exemplo, um cubo contendo
informações de vendas poderá ser composto pelas dimensões tempo, região,
produto, cliente, cenário (orçado ou real) e medidas. Medidas típicas seriam,
42
por exemplo, valor de venda, unidades vendidas, custos, margem de lucro,
etc.[...] (FELBER. 2005, p.35)
Três pontos importantes ainda devem ser vistos no Processamento Analítico On Line:
a arquitetura cliente / servidor, as funções e as formas de armazenamento. Esses pontos serão
vistos a seguir.
3.3.1 A arquitetura cliente / servidor no OLAP
Na arquitetura cliente / servidor de aplicações do Processamento Analítico On Line é comum
o fato de ocorrer alternativas ou situações para disponibilizar as informações. As três
alternativas são as que seguem, depois exemplificadas pela figura 6:
Cliente Gordo: possui uma cópia particular do Repositório multidimensional. Usado,
geralmente, na computação móvel, precisa ter atualizações periódicas do repositório base e
sofre limitação de espaço de disco (BARBIERI. 2001, p.168);
Cliente médio: é o modo comum de arquitetura, onde o cliente solicita informações ao
servidor de Processamento Analítico On Line. Possui a vantagem de relacionamento direto
com a base de dados, só dependendo dos meios de rede (BARBIERI. 2001, p.169);
Cliente/Servidor Web: existe o browser na estação cliente, facilitando a manutenção
do Processamento Analítico On Line, que está em um servidor de aplicações, seja para
internet ou intranet. É a alternativa mais leve (BARBIERI. 2001, p.169).
43
Figura 6 - As arquiteturas, na seqüência, Cliente Gordo, Cliente Médio e Cliente/Servidor Web.
Fonte – Elaborado pelos autores.
Acessando o servidor, os clientes poderão efetuar operações no Processamento
Analítico On Line. Essas operações são funções de demonstração de informação:
sumarização, detalhamento, entre outros. Essas funções serão apresentadas abaixo.
3.3.2 As funções no OLAP
O Processamento Analítico On Line efetua cinco funções basicamente. Elas são:
interface, consulta, processo, formato e exibição (REZENDE, ABREU. 2003, p.221).
Para
que se efetue o Processamento Analítico On Line, é necessário também que ocorram algumas
operações, dentre as são principais:
Drill-Down: é quando ocorre a desagregação dos dados, ou seja, seu detalhamento
(O’BRIEN. 2004, p.285). Para ilustrar o que seria um uso de Drill-Down, poder-se-ia
considerar as vendas anuais detalhadas por meses ou dias;
44
Drill-up: é o contrário do drill-down. Relaciona-se com a agregação de dados, ou seja,
junções dos dados, seja de modo simples ou complexo (O’BRIEN. 2004, p.285). Isso
significa que ele sumariza as informações. Um exemplo poderia ser o total de vendas de uma
empresa agrupadas por um determinado período, como um ano;
Drill-across: ocorre quando se efetua uma consulta na tabela dimensão pulando níveis
da hierarquia (FELBER. 2005, p.37). Por exemplo, em uma dimensão de espaço composta
por País, Região, Estado e Cidade, se o usuário viesse a passar de País para Cidade direto,
sem passar pelos outros níveis, ele estaria efetuando um drill-across;
Drill-through: é quando o usuário requer uma informação de menor nível do que o
contido na hierarquia armazenada na tabela fato, dentro da estrutura granular, ou seja,
conforme Felber (2005, p.37), é uma informação de menor nível do que o contido na
granularidade da tabela fato. Um exemplo poderia ser a requisição de alguma informação em
determinado turno de uma empresa, considerando que a granularidade só vai até dia;
Slicing and Dicing: implica o processo de fatiar em cubos as informações de modo a
criar várias perspectivas, o que possibilita a visualização dessas informações de diferentes
pontos de vista (O’BRIEN. 2004, p.285). Para exemplificar, é possível considerar as
informações de vendas totais de um determinado produto da empresa pelo ponto de vista de
regiões, e pelo ponto de vista de período, vendedores, etc.;
Pivoting: Pivoteamento. É quando ocorre alguma mudança do arranjo das linhas e
colunas em um relatório tabular, onde, em geral, as linhas ou as colunas são derivadas de
dimensões diferentes, com inversões em seus eixos, obtendo visões diferentes (FELBER.
2005, p.38).
Ainda faltam serem vistas as formas de armazenamento para o Processamento
Analítico On Line. Estas estratégias estão apresentadas na seqüência.
45
3.3.3 Estratégias de armazenamento para o OLAP
Segundo Barbieri (2001, p.174), existem método ou estratégias de armazenamento de
dados, ou dos cubos extraídos do Data Warehouse / Data Mart. Essas estratégias são as que
seguem:
ROLAP (Relational On Line Analytical Processing): significa Processo analítico
Relacional On Line. É quando se utiliza os Sistemas Gerenciadores de Bancos de Dados
Relacionais, com as vantagens próprias neles contidos, como o processamento de enormes
quantidades de dados. Porém, requer cuidado no que diz respeito à performance. Conforme
Barbieri (2001, p.174), “As tabelas básicas e os agregados (visões ou cubos) são armazenadas
nesse formato. [...]”;
MOLAP
(Multidimensional
On
Line
Analytical
Processing):
que
significa
Processamento Analítico Multidimensional On Line, é onde são utilizados gerenciadores de
banco de dados com detalhes distintos e tratamento dimensional de dados, o que,
teoricamente, representaria melhor desempenho. Permitem ao usuário o trabalho, a montagem
e a manipulação direta dos dados do cubo no servidor (FELBER. 2005, p.38). Porém é
necessário cuidados com sua limitação na capacidade de armazenamento, atualização e
mapeamento;
HOLAP (Hybrid On Line Analytical Processing): significa Processamento Analítico
Híbrido On Line, e nada mais é que a combinação do uso das duas abordagens anteriores.
Esse uso misto permite o aproveitamento da maior performance do MOLAP, pelo foco dado
ao tipo de aplicação, e da maior escalabilidade do ROLAP, ou seja, ampliação da capacidade
armazenamento sem perda de funcionalidades. Isso ocorre pelos motivos apresentados por
Barbieri (2001, p.175) que diz que a estrutura relacional é utilizado para os dados de grande
46
granularidade geralmente, enquanto que as dimensional nativa armazena os agregados, com
menor granularidade;
DOLAP (Desktop On Line Analytical Processing): ou Processamento Analítico On
Line na Estação Cliente. Ocorre quando se transfere as estruturas do Data Warehouse / Data
Mart, ou seja, o cubo de informações, para a estação cliente. Isso causa menos tráfego na rede
e melhora a performance das análises, pois o processamento ocorre na máquina do cliente,
agilizando o processo e não causando sobrecarregando o servidor. Porém, conforme Felber
(2005, p.40), “a desvantagem é que o tamanho do cubo de dados não pode ser muito grande,
caso contrário, a análise passa a ser demorada e/ou a máquina do cliente pode não suportar em
função de sua configuração [...]”.
3.4 Data Mining
Data Mining significa Mineração de Dados. Mesmo não sendo obrigatório sua
existência no Business Intelligence, é uma proposta de tratamento de dados e informações.
[...] Os conceitos de garimpagem de dados (Data Mining) estão relacionados
com a nova tendência (para aplicações comerciais) de se buscar correlações
escondidas em altos volumes de dados, nem sempre evidentes,
principalmente no tratamento cotidiano dos sistemas de informações.
(BARBIERI. 2001, p.178)
Ainda segundo Barbieri (2001, p.178) o conceito de mineração de dados surgiu com o
propósito de melhorar a utilização desses arsenais de informação, visto que geralmente seus
projetos são de alto custo. Para isso, o Data Mining procura identificar padrões e
relacionamentos entre dados espalhados pelo cenário abordado pelo Data Warehouse / Data
Mart, levantando informações que não são muito evidentes. Porém, a despeito dos benefícios
que essa ferramenta pode vir a trazer, Barbieri (2001, p.178) informa a possibilidade de a
47
abordagem vir a levantar relacionamentos inúteis, ou em uma quantidade tão grande que
venha a impedir a análise delas, e, portanto, é importante o uso de algoritmos inteligentes, que
selecionem padrões relevantes.
O processo de Mining tem certas diferenças com relação ao que vimos até
agora, nos capítulos anteriores. Enquanto as técnicas OLAP objetivam
trabalhar os dados existentes, buscando consolidações em vários níveis,
trabalhando fatos em dimensões variadas, a técnica de Mining busca algo
mais que a interpretação dos dados existentes. Visa fundamentalmente
realizar inferências, tentando com que “adivinhar” possíveis fatos e
correlações não explicitadas nas montanhas de dados de um DW/DM.
(BARBIERI. 2001, p.178)
Além disso, o Data Mining procura definir situações de causa. Para exemplificar,
poder-se-ia considerar que, enquanto o Processamento Analítico On Line (OLAP), em certa
situação, procuraria respostas do tipo: “Qual é o total de vendas do produto Y, na região X,
em determinado período?”, o Data Mining procuraria levantar as informações relativas aos
padrões de comportamento, ou seja, o motivo que levariam os clientes a comprar em
determinado lugar, ou em outro. Dessa forma, é possível identificar as diferenças entre o Data
Mart e o Processamento Analítico On Line.
Barbieri (2001, p.179) ainda define três espaços de conhecimentos:
[...] O espaço de dados, relacionado com os Bancos de Dados; o espaço de
informação analítica, relacionado aos Data Warehouses e Data Marts; e os
espaços de influência e de variação, que estão relacionados com as
aplicações de Data Mining, onde a influência de uma variável sobre outras e
as variações provocadas por sua influência estão entre os objetivos mais
importantes.
Para que um projeto de Data Mining seja bem sucedido, é importante que seja
considerados a vários fatores relativos aos objetivos, metas, estratégias, modelo de negócios,
entre outros aspectos que venham existir na organização. Além disso, também é importante
saber detalhar o problema, identificar pontualmente o que se espera do Data Mining, ter
48
conhecimento de que tem altos custos, é necessário ter uma equipe muito bem preparada,
enfim, entender que um projeto desse tipo possui uma série de desafios que nem todas as
organizações estão preparadas para enfrentar.
3.4.1 Etapas do Projeto de Data Mining
Um projeto de Data Mining possui etapas. Segundo Barbieri (2001, p.181), essas
etapas são: Preparação, Mineração, Análise e Aplicação.
Preparação: essa fase depende do algoritmo escolhido, pois é por eles que esses dados
serão formatados. Barbieri (2001, p.183) diz que “este processo pode envolver desde a
limpeza dos dados, incluindo-se aí campos omissos ou dados muito fora do normal (os
outliers) até a junção de variáveis ou linhas, combinação de campos e transformação de
variáveis [...]”;
Mineração: Barbieri (2001, p.183-184) diz que nessa fase é necessário estabelecer os
modelos de Data Mining, seguido da definição de amostras. Logo após, deve-se treinar o
modelo, selecionado dados. A formatação utilizada pelas ferramentas devem ser definidas e
criar os previsores do negócio;
Análise: conforme informa Barbieri (2001, p.184-187) essa fase conta com algumas
técnicas: Associação, Padrões seqüenciais, Classificação e Agregação, além delas poderem
ser usados de forma integrada.
Associação é aquela que verifica a afinidade entre registros de determinados fatos, ou
seja, a influência de um fato sobre outro como, por exemplo, “qual é o percentual de vendas
do produto A junto com o produto B?”;
Os Padrões seqüenciais procuram identificar como um fato implica em um outro fato
de um outro momento. Um exemplo seria uma constatação de uma agência financeira que
49
quando uma ação C cresce 5%, uma outra ação D, depois de alguns dias, cai
aproximadamente 2%, em seu valor;
Na Classificação, por sua vez, ocorrem agrupamentos por classes, de acordo com
formas estabelecidas previamente, e para isso se pode utilizar de várias abordagens, como
redes neurais, árvores de decisão, entre outras. Para exemplificar, poder-se-ia considerar um
sistema de crédito que classifica os clientes entre aprovados e não aprovados;
Já na Agregação também existem agrupamentos, porém sem prévia classificação.
Nenhuma classe é conhecida e os dados são agrupados por similaridades. Um exemplo seria
alguma análise de defeitos;
Aplicação: assim que o modelo for testado e aprovado, ocorre a utilização dos
algoritmos que acarretarão na execução da aplicação em situações reais.
3.4.2 Uso da Estatística no Data Mining
Como pode-se perceber, o emprego de técnicas estatísticas nas etapas do projeto do
Data Mining tem grande influência. Existem várias técnicas estatísticas utilizadas, dentre as
quais, as principais são as que seguem abaixo:
Árvores de Descisão: Barbieri (2001, p.190) diz que “é uma técnica que, a partir de
uma massa de dados, cria e organiza regras de classificação e decisão em formato de
diagrama de árvores, que irão classificar suas observações ou predizer resultados futuros [...]”.
Ela pode ser criada para a classificação precisa de casos existentes ou novos.
Existe um único grupo de caso de estudo, inicialmente. Este grupo vai criando
ramificações que contém casos de estudo categorizados, que, em seguida se abrem em
nódulos de subgrupos exclusivos. Galhos ou nódulos demonstram, proporcionalmente, a
resposta do estudo. A figura 7 pode ilustrar o formato lógico de uma árvore de decisão.
50
Figura 7 - um exemplo de formato lógico de uma Árvore de Decisão
Fonte – Elaborado pelos autores.
Existem variadas formas de empregar a Árvore de Decisão. Algumas dessas formas
são:
Segmentação: onde ocorre agrupamento por base na identificação de características
comuns (BARBIERI. 2001, p.190). Um exemplo poderia ser a divisão de categorias de
clientes de acordo com seu perfil de consumo;
Estratificação: é quando se determina regras para cada caso em alguma categoria
(BARBIERI. 2001, p.190). Para exemplificar, poder-se-ia considerar a classificação de ações
da bolsa de acordo com o grupo de risco;
Predição: é quando se cria regras para entender ou aplicar casos futuros (BARBIERI.
2001, p.190). Para ilustrar, é possível considerar o exemplo de sintomas que venham a receber
determinado diagnostico, e que algum paciente vindo a apresentar esses sintomas, seja
encaminhado para os exames daquela doença;
Redução de dados: procura efetuar filtros para reduzir a quantidade de variáveis de um
processo, identificando as que são mais influentes (BARBIERI. 2001, p.191).
Análise de Conglomerados: procura identificar conjuntos de grupos dentro de um
conjunto de dados, e depois agrupa-los de acordo com similaridades entre si
51
(BARBIERI.2001, p.196). Os métodos de formação de conglomerados podem ser do tipo
Hierárquico e do tipo Não-Hierárquico.
As técnicas do tipo Hierárquico são classificadas como Aglomerativas e Divisivas.
Barbieri (2001, p.196) diz que “dada uma amostra de n elementos, as técnicas aglomerativas
iniciam-se com n conglomerados de tamanho 1 cada, e a cada estágio estes vão sendo
agrupados e vão formando novos conglomerados[...]”. Nessa técnica, uma vez unidos os
elementos, eles não mais se separam. Porém,conforme informa Barbieri(2001, p.196), “as
Divisivas, como o nome diz, são o contrário. Partem de um único conglomerado de tamanho n
e, a cada estágio do processo, este conglomerado inicial vai se subdividindo em novos
grupos”.
Podemos exemplificar o uso da Análise de Conglomerados considerando uma empresa
que classifica seus clientes como Especiais e Padrões. Isso considerando seus hábitos e
comportamentos, entre outras variáveis.
Redes Neurais: é uma tecnologia de uso crescente no ambiente o Data Mining, pois
possui a vantagem de aprender com suas experiências, possuindo, assim, menores limitações
(BARBIERI. 2001, p.199). Elas possuem algoritmos que pretendem imitar funcionalidades do
cérebro, utilizando-se de nódulos que imitam neurônios. Conforme Barbieri (2001, p.199),
apesar de não ser uma técnica estatística, esse recurso permite o emprego de estatística em
modelos não-lineares. Barbieri (2001, p.199-200), explica como se constituem as redes
neurais:
52
[...] Os nódulos são conectados como uma rede e funcionam paralelamente.
A primeira fase de nódulos é composta pelos nódulos de entrada. Eles
recebem o input das variáveis fornecidas pelo Banco de Dados,
transformam-no de acordo com uma função (chamada função de ativação),
produzindo uma informação de saída que será enviada à próxima fase de
nódulos. Esta, por sua vez, receberá diversas informações dos nódulos de
entrada com seu input. Essa fase é formada pelos nódulos ocultos, que, em
redes neurais mais complexas, podem formar diversas camadas. Por fim,
tem-se os nódulos de saída. Estes processam as informações recebidas e
produzem uma resposta, mas não a enviam para outro nódulo, pois esta saída
já é o resultado final da rede. Se a rede é de classificação, o nódulo de saída
já é a classe final. Para o caso de modelos de previsão, o nódulo de saída já
representa um valor preditivo. [...]
É importante, antes do uso das redes neurais, efetuar seu treinamento estimulando os
valores dos parâmetros das funções de ativação y = f (x,0), de forma que os valores preditos
estejam próximos dos valores observados (BARBIERI. 2001, p.200-201). Porém, deve-se ter
cuidado com o excesso de treinamentos nas redes neurais, pois isso poderia fazer com que
elas viessem a representar erros aleatórios contidos no modelo. Nesse caso é só instituir
limites de tolerância a erros no modelo.
Para exemplificar um uso de redes neurais, pode-se considerar a análise de crédito dos
clientes de uma operadora de crédito. Como existem muitas variáveis a serem consideradas
nesse cenário, o uso de redes neurais é importantíssimo para identificar usos fraudulentos de
cartão de crédito.
Análise de regressão: é uma técnica de fácil execução e interpretação, o que a torna
uma das mais usadas. É uma técnica que procura criar equações dos relacionamentos.
[...] A Análise de Regressão processa as informações de umas base de dados
de maneira a determinar um modelo (uma equação) que represente o
relacionamento existente entre as variáveis em estudo. Os principais
objetivos da análise de regressão são: sumarização dos dados, predição,
controle e estimação. Uma só análise pode atender a mais de um objeto ao
mesmo tempo. (BARBIERI. 2001, p.204)
Existem dois tipos mais comuns de análise de regressão, a Regressão Linear Simples e
a Regressão Linear Múltipla. A Regressão Linear Simples possui apenas duas variáveis, uma
53
de resposta (dependente) e a variável explicativa (independente). Já na Regressão Linear
Múltipla ocorre a variável resposta, porém ocorre mais de uma explicativa (BARBIERI. 2001,
p.205).
Para exemplificar a utilização da Análise de Regressão, é possível considerar a
premiação de vendedores, onde impactam vários aspectos como novos clientes conquistados,
clientes mantidos, etc., onde a Análise de Regressão poderia sumarizar as informações de
modo a se poder elencar os vendedores do melhor ao pior.
Séries Temporais: segundo Barbieri (2001, p.208), “é uma técnica estatística utilizada
principalmente no cálculo de previsão de um conjunto de observações, dados seus valores ao
longo do tempo [...]”. Essa análise permite considerar sazonalidades nos períodos,
necessitando de armazenamento informações relativas a estes períodos ao longo de um espaço
temporal não curto. Ela pode ser parametrizada por outros parâmetros físicos, além do tempo,
que é o mais comum.
Uma utilidade para a série poderia ser a previsão de vendas para um período futuro de
uma indústria de chocolates. É importante levar em conta os períodos sazonais de vendas,
como época da Páscoa.
54
CAPÍTULO 4 – ESTUDO DE CASO
Nesse capítulo será efetuado um estudo sobre uma ferramenta real de Business
Intelligence para exemplificação prática do que foi estudado. Para tanto, será utilizado uma
ferramenta da Ariacom Business Reports, o Report Manager, como já falado no capítulo 2,
que para testes é uma ferramenta gratuita, fazendo uso do caso exemplo Northwind. A figura
8 mostra a interface da ferramenta.
Figura 8 – A interface principal da ferramenta da Ariacom Business Reports
Fonte – Elaborado pelos autores.
Percebe-se que existem dois grupos na figura 8, o caso Northwind e o BR Audit. O
Northwind é um caso de estudo, como uma empresa global, contendo várias formas de
relatórios como o de produtos, entre outros, com a possibilidade de criar outros, através do
uso pessoal (personal). Já o BR Audit permite efetuar uma auditoria de uso do sistema, ou
seja, ele permite consultar quem utilizou pela última vez, quando determinado usuário fez
55
uso, quantidade e constância de utilização por usuário, sucessos de acesso ao software, etc.,
em diversas granularidades.
O foco será dado na utilização da ferramenta para a tomada de decisão sobre negócios
e, para tanto, será utilizado o caso Northwind. Sobre os diversos meios de relatórios, formas
de apresentação, sumarização e detalhamento da informação para o tomador de decisão é que
será abordado.
4.1 O que a ferramenta oferece na prática
De uma ferramenta de Business Intelligence se espera diversas formas de relatos de
informações. Como já citado anteriormente, das várias formas existentes, os mais utilizados
são gráficos, textuais ou explicativos e planilhas. As figura 9, 10 e 11, concomitantemente,
podem ilustrar essas formas.
Figura 9 – Relatório por meio de gráficos
Fonte – Elaborado pelos autores.
56
É possível perceber que a figura 8 se refere às vendas de alguns tipos de produtos no
ano de 1994. Ela relata a quantidade vendida de cada categoria (coluna verde), utilizando-se
dos valores gráficos posicionados no lado direito, e o montante em valor e em formato
percentual de contribuição em relação ao todo (coluna vermelha), utilizando-se dos valores
posicionados à esquerda e o valor percentual estando acima da coluna. Por exemplo, para a
categoria Beverages (bebidas), a coluna de verde informa que para o ano de 1994 foram
vendidos 1500 itens, e a coluna vermelha informa que o montante em valor é $ 45.000,00, o
que corresponde a 34,38% do total dos itens pesquisados para o ano.
Figura 10 – Relatórios de dados informativos
Fonte – Elaborado pelos autores.
A figura 10, especificamente no quadro tracejado, exemplifica o uso de texto
informativo sobre um fornecedor. No exemplo, pode-se observar que se trata das informações
de contato e endereço da empresa Refrescos Americanas Ltda.
57
Figura 11 – Exemplo de Planilha
Fonte – Elaborado pelos autores.
A figura 11 exemplifica o uso de planilhas. Nesse caso, refere-se à categoria de
Beverages (bebidas), onde aparecem o identificador do produto, o nome, o preço unitário e o
fornecedor.
A ferramenta Report Manager também possui funcionalidades como o Processamento
Analítico On Line. Um exemplo é o caso do drill-down e drill-up nela presentes, que no caso
a ferramenta oferece como padrão para a granularidade tempo a posição por ano, trimestre e
mês. As figuras 12, 13 e 14 exemplificam o exposto.
58
Acesso ao
drill-down
Figura 12 – Exemplo de uso do Drill-down, com a granularidade tempo Ano.
Fonte – Elaborado pelos autores.
A figura 12 mostra as vendas de produtos no ano de 1995. O ano é o primeiro nível
que a ferramenta permite para a exploração por meio do drill-down da granularidade Tempo.
Para verificar os outros níveis, como o da figura 13, é só clicar sobre o ícone em forma de
triângulo com a ponta para baixo, conforme indicado pela seta.
Acessos ao Drill-down e
ao Drill-up
Figura 13 – Uso do Drill-down, com a granularidade tempo partindo de Ano para trimestre.
Fonte – Elaborado pelos autores.
59
A figura 13 exemplifica o caso do detalhamento da informação do ano de 1995 em
trimestres, no caso, o primeiro, como é possível verificar ao lado dos ícones de acesso Drilldown e Drill-up. Esses ícones funcionam da seguinte maneira: quando clica-se sobre o ícone
com a ponta direcionada para baixo, acessa-se a função Drill-down, detalhando ainda mais o
período, partindo de trimestre e indo para o nível de granularidade mês daquele trimestre,
conforme a figura 14; quando clica-se sobre o ícone com a ponta direcionada para cima,
efetua-se a operação inversa, o Drill-up, voltando-se para o nível de granularidade ano.
Acesso Drill-up
Figura 14 – Uso do Drill-down, com a granularidade tempo trimestre para mês.
Fonte – Elaborado pelos autores.
Na figura 14 ocorre um detalhamento maior ainda relativo ao período de vendas dos
produtos, partindo de trimestre para mês. Pode-se verificar também que aparece apenas o
60
ícone de Drill-up, o que significa que não é possível descer a menores níveis de granularidade
tempo como semana ou dia.
Não só os níveis de granularidade da Dimensão tempo são possíveis. Também as
granularidades relativas às tabelas Dimensão objeto e local são possíveis, conforme
exemplifica as figuras 15 e 16.
Entrega para o
Brasil, pela
empresa de
navegação
United Package
Figura 15 – Uso da tabela Dimensão de Espaço e a possibilidade de acessos às granularidades.
Fonte – Elaborado pelos autores.
A figura 15 exemplifica o uso da tabela Dimensão espaço. Nesse exemplo, a planilha
mostra a quantidade de dias previstos de demora para uma a embarcação de algumas
empresas de navegação chegar aos países destinos. No caso indicado, Brasil, a demora é de
8,6 dias aproximadamente. O nível mais alto é o de País, no caso indicado o Brasil, porém é
permitido acessar outros níveis de granularidade, como Estado e cidade, como ilustrado na
figura 16.
61
Figura 16 – Uso da tabela Dimensão de Espaço no nível de granularidades Cidade.
Fonte – Elaborado pelos autores.
No exemplo da figura 16 é possível verificar o nível de granularidade da tabela
Dimensão Espaço chegar até cidade, como São Paulo, Campinas e Rio de Janeiro, e seus
tempos de entregas pelas empresas de navegação. É possível acessar o nível de granularidade
Estado também.
Além de funcionalidades como o Drill-down e Drill-up para os vários graus de
granularidades, a ferramenta permite consultas customizadas. A figura 17 mostra uma das
possibilidades de consulta customizada, a Free SQL reports, para efetuar relatórios dinâmicos
SQL (Strutured Query Language).
62
Figura 17 – Uma tela do Free SQL reports
Fonte – Elaborado pelos autores.
Essa tela, a Products search (samples of prompted restriction), possibilita efetuar
vários tipos de consultas sobre produtos. Por exemplo, no primeiro quadrante, o de Product
Name Contains, permite efetuar consulta de produtos colocando-se todo ou parte do nome do
produto, efetuando o tipo de consulta like no SQL.
Além das consultas customizadas existe também algumas facilidades para relatórios
que a ferramenta possibilita, como os do menu Published.Ele permite, não só a listagem de
produtos com todas as informações importantes (como as de fornecedores) , mas também a
emissão do relatório de produtos em vários tipos de formatos: HTML, PDF, DOC, etc. A
figura 18 mostra onde se encontra o menu e as opções de formato.
63
Menu de
acesso
Published
Figura 18 – O acesso ao menu Published e suas opções de formatos para listagem de produtos.
Fonte – Elaborado pelos autores.
O menu Published, na indicação, permite várias formas de consulta de produtos,
conforme indicam as opções selecionadas. Ele é um exemplo das possibilidades de
levantamentos para relatórios que a ferramenta dispõe.
A ferramenta Report Manager possui outras funcionalidades, porém essas são as
principais. Como é possível perceber, a apresentação para utilização dela pelo gestor foi o
objetivo desse capítulo.
64
CONCLUSÃO
Pode-se observar que realmente o Business intelligence propõe e pode ajudar de modo
considerável o que concerne à tomada de decisão. Como ele baseia as informações que
disponibiliza principalmente nos dados históricos da organização, as informações se tornam
diretamente voltadas ao modelo de negócios dela.
A possibilidade que essa metodologia e solução oferece de verificar em diversas
granularidades as informações de suas unidades de negócio, produtos, etc., torna-se uma arma
poderosa para que a organização possa vir a galgar mais espaço dentro do cenário competitivo
no qual se insere. É a ferramenta que mais se adequou ás necessidades relativas à decisão,
principalmente a camada estratégica da organização, porque os relatórios que ela vem a
disponibilizar são fáceis de verificar e entender e realmente voltados para essa necessidade
específica. Isso somado ao fato de ser comum às ferramentas de Business Intelligence
possuírem interfaces relativamente amigáveis, como foi possível verificar com o uso da
ferramenta estudada, o Report Manager.
Especificamente, diante do exposto sobre essa ferramenta é possível a considera uma
boa ferramenta, mesmo que seja para determinados tipos de modelos de negócio. Ela permite
as funcionalidades importantes do Business Intelligence, como o uso das funções OLAP, o
Drill-Down e o Drill-Up, consultas dinâmicas e auditoria de uso da ferramenta por máquina e
usuário, mesmo não possuindo as tecnologias do Data Mining, que como já informado não é
obrigatório nos projetos de BI, é uma ferramenta simples de utilizar e de fácil aprendizagem,
principalmente por parte dos gestores.
Porém, quando é falado que determinadas necessidades de algumas organizações
poderem vir a não serem satisfeitas, ao menos plenamente, pela ferramenta é devido ao fato
de ela não ter pré-definido alguns graus de granularidade como, por exemplo, a granularidade
65
Dia, na tabela Dimensão Tempo, onde o mínimo permitido é mês. Caso a organização tenha a
necessidade de tomar decisões diárias sobre seus produtos, entre outras, será necessário que
ela efetue consultas SQL mais avançadas, efetuando operações matemáticas, o que
descaracterizaria a simplicidade da ferramenta. Mesmo assim, esta é uma ferramenta
interessante, principalmente e de forma especial, aqueles que querem ter o primeiro contato
com esse tipo de solução, pois ela é viável para utilização.
66
REFERÊNCIAS
BARBIERI, Carlos. BI - Business Intelligence – Modelagem e Tecnologia. Rio de Janeiro:
Editora Axcel Books, 2001.
BATISTA, Emerson de O.. Sistema de Informação: o uso consciente da tecnologia para o
gerenciamento. 3ª ed., São Paulo: Editora Saraiva, 2004.
BORGES, André. Business Intelligence no DNA. ComputerWorld. São Paulo, ano 12, 30ª
ed., p.14, 2005.
CRIVELINI, Wagner. Mitos e verdades sobre modelagem multidimensional. SQL Magazine.
Rio de Janeiro, ano 3, 39ª ed., p.6-14, 2006.
FELBER, Edimilson J. W.. Proposta de uma Ferramenta OLAP em um Data Mart
Comercial: uma aplicação prática na indústria calçadista. 2005. 60 f. Grau: Trabalho de
Conclusão de Curso (Graduação em Ciências da Computação) - Instituto de Ciências Exatas e
Tecnológicas, Centro Universitário Feevale, Novo Hamburgo, 2005.
ITALIANO, Isabel Cristina; ESTEVES, Luiz Antonio. Modelagem de Data Warehouses e
Data Marts: parte 2. SQL Magazine. Rio de Janeiro, ano 2, 14ª ed., p.37-43, 2005.
ITALIANO, Isabel Cristina; ESTEVES, Luiz Antonio. Modelagem de Data Warehouses e
Data Marts: parte 3. SQL Magazine. Rio de Janeiro, ano 2, 16ª ed., p.59-66, 2005.
MYLIUS, Marcos. Business Intelligence: mais fácil do que você imagina. São Paulo:
Edições Inteligentes Editora, 2003.
O’BRIEN, James A.. Sistemas de Informação: e as decisões gerenciais na era da internet. 2ª
ed., São Paulo: Editora Saraiva, 2004.
REZENDE, Denis Alcides; ABREU, Aline França de. Tecnologia da Informação –
Aplicada a sistemas de informação empresariais. 3ª ed., São Paulo: Editora Atlas S.A., 2003.
RIBEIRO, Jeferson; et al. O impacto na utilização de inteligência de negócios no ambiente
empresarial. In: Congresso Brasileiro Gestão e Desenvolvimento de Produtos, IV, 2003,
Gramado. Resumos... Gramado, 2003. p.1-7.
VALLE, Rogério, et al. Que ferramenta devo usar? Rio de Janeiro: Qualitymark Editora
Ltda, 2005.
This document was created with Win2PDF available at http://www.win2pdf.com.
The unregistered version of Win2PDF is for evaluation or non-commercial use only.
This page will not be added after purchasing Win2PDF.

Documentos relacionados