DAVID DESTRO NETO JAILTON DOS SANTOS MARAN JOÃO
Transcrição
DAVID DESTRO NETO JAILTON DOS SANTOS MARAN JOÃO
1 FUNDAÇÃO DE ENSINO “EURÍPIDES SOARES DA ROCHA “ CENTRO UNIVERSITARIO “EURÍPIDES DE MARÍLIA”- UNIVEM CURSO DE ADMINISTRAÇÃO ANÁLISE DE SISTEMAS DAVID DESTRO NETO JAILTON DOS SANTOS MARAN JOÃO DIAS CHAVES FILHO BUSINESS INTELLIGENCE: CONCEITOS E ESTRATÉGIA DE NEGÓCIOS MARÍLIA 2007 2 DAVID DESTRO NETO JAILTON DOS SANTOS MARAN JOÃO DIAS CHAVES FILHO BUSINESS INTELLIGENCE: CONCEITOS E ESTRATÉGIA DE NEGÓCIOS Trabalho de Conclusão apresentado ao Programa de Graduação da Fundação de Ensino “Eurípides Soares da Rocha”, Mantenedora do Centro Universitário de Marília – UNIVEM, como requisito para obtenção do grau de Bacharel em Administração de Empresas com habilitação em Análise de Sistemas. Orientador: Prof. Mr. Elvis Fusco MARILIA 2007 3 NETO, David Destro; MARAN, Jailton dos Santos; FILHO, João Dias Chaves. Business Intelligence: Conceitos e Estratégia de Negócios / David Destro Neto, Jailton dos Santos Maran, João Dias Chaves Filho; orientador: Elvis Fusco. Marília, SP: [s.n.], 2007. 66 fls. Trabalho de Conclusão (Graduação em Administração de empresas com habilitação em Analise de Sistemas) – Fundação de Ensino Eurípides Soares da Rocha - UNIVEM, 2007. 1.Business Intelligence 2.Data Warehouse 3.Data Mart 4.OLAP 5. Data Minig 6.Tomada de Decisão CDD: 658.4038 4 5 Ao nosso Deus, Senhor criador de todas as coisas, e às nossas famílias. 6 AGRADECIMENTOS Agradecemos Deus, que nos permitiu tudo e nos amparou em todos os momentos. A Nossa Senhora, nossa Mãe Maria, que sempre intercedeu por nós. Às nossas famílias, que nos suportaram e apoiaram. Ao nosso orientador, prof. Mr. Elvis Fusco, que muito contribuiu para nosso aprendizado. Aos demais professores e pessoas que de alguma forma nos ajudaram por esse caminho que nos trouxe até aqui. Também agradecemos à empresa Ariacom Business Reports, disponibilizar sua ferramenta, o Report Manager, gratuitamente para testes. por 7 Não há nada que seja maior evidência de insanidade do que fazer a mesma coisa dia após dia e esperar resultados diferentes. Albert Einstein 8 NETO, David Destro; CHAVES, João Dias; MARAN, Jailton dos Santos. Business Intelligence: Conceitos e Estratégia de Negócios.2007. 66 f. Trabalho de Conclusão (Graduação em Admininstração com Habilitação em Análise de Sistemas) – Centro Universitário Eurípedes de Marília, Fundação de Ensino Eurípedes Soares da Rocha – UNIVEM, Marília, 2007. RESUMO Para que as empresas venham a ter sucesso atualmente é importantíssimo que ela venha a fazer uso de uma grande aliada, que é a informação. Porém, o que interessa não é a informação jogada ao esmo, mas sim contar com informações relevantes para a tomada de decisão sobre seus negócios e, assim, elevar sua riqueza. Para tanto, as organizações podem vir a lançar mão de conceitos e metodologias, geralmente disponibilizadas em ferramentas de software que, dentre as quais, destaca-se o Business Intelligence. Este, utilizando-se de banco de dados poderosos, os Data Warehouses ou Data Marts que surgiram do conceito de modelagem multidimensional e contém informações históricas dos negócios da empresa, podem vir a obter informações preparadas, com as tecnologias das funções do OLAP e até do Data Mining, especificamente para a tomada de decisão. Em vista disso, esse trabalho procura abordar, de forma geral, o cenário em que essa solução está inserida, e como, pelo envolvimento do modelo de negócios da empresa, ela pode ser útil à tomada de decisão. Desse modo, não é pretendido demonstrar como se dá a construção de um sistema de Business Intelligence. Porém, são apresentados seus conceitos tecnológicos principais e como eles atuam para que o Business Intelligence venha cumprir o que propõe. Ocorrerá também uma apresentação da utilização prática de uma ferramenta. Palavras-chave: Business Intelligence, Data Warehouse, Data Mart, OLAP, Data Minig, Tamada de Decisão. 9 NETO, David Destro; CHAVES, João Dias; MARAN, Jailton dos Santos. Business Intelligence: Conceitos e Estratégia de Negócios.2007. 66 f. Trabalho de Conclusão (Graduação em Admininstração com Habilitação em Análise de Sistemas) – Centro Universitário Eurípedes de Marília, Fundação de Ensino Eurípedes Soares da Rocha – UNIVEM, Marília, 2007. ABSTRACT So that the companies come to have success at this moment is important that come to do use of a big one allied, that is the information. However, do what interests is not the information played to the guess, but to count with important information for the take of decision on your businesses and, like this, to elevate your wealth. For much, the organizations can come to lay hold of concepts and methodologies, usually arranged in software a tool that, among which, stands out the Business Intelligence. This, being used of powerful database, it Data Warehouses or Data Marts that appeared of the concept of multidimensional modeling and contain historical information of the businesses of the company, can come to obtain prepared information, with the technologies of the functions of OLAP and to of the Data Mining, specifically for the take of decision. In mind of that, that work tries to approach, in a general way, the scenery in how that solution is inserted, and as, for the involvement of the model of businesses of the company, she can be useful to the make of decision. In such, it is not intended to demonstrate as if offer the construction of a system of Business Intelligence. However, your main technological concepts are presented and like them they act so that Business Intelligence comes to accomplish what proposes. Will also happen a presentation of the practical use of a tool. Key-Words: Business Intelligence, Data Warehouse, Data Mart, Data Mining, Take of Decision. 10 LISTA DE ILUSTRAÇÕES FIGURA 01 – Os Níveis Básicos de uma Organização ...........................................................14 FIGURA 02 – O Ambiente Organizacional e o Lugar do Business Intelligence ....................20 FIGURA 03 – As Tabelas Dimensão (Produto, Dia e Filial) Relacionadas com a Tabela Fato Vendas ............................................................................................................................. 31 FIGURA 04 – Um Data Warehouse que Recebe Informações de Diversas Fontes .................38 FIGURA 05 – Um Data Warehouse Composto de Vários Data Marts ....................................39 FIGURA 06 – As Arquiteturas, na Seqüência, Cliente Gordo, Cliente Médio e Cliente/Servidor Web ..............................................................................................................43 FIGURA 07 – Um Exemplo de Formato Lógico de uma Árvore de Decisão .........................50 FIGURA 08 – A Interface Principal da Ferramenta da Ariacom Business Reports.................54 FIGURA 09 – Relatório por Meio de Gráficos ........................................................................55 FIGURA 10 – Relatórios de dados informativos..................................................................... 56 FIGURA 11 – Exemplo de Planilha .........................................................................................57 FIGURA 12 – Exemplo de uso do Drill-Down, com a Granularidade Tempo Ano ................58 FIGURA 13 – Uso do Drill-Down, com a Granularidade Tempo Partindo de Ano para Trimestre .................................................................................................................................. 58 FIGURA 14 – Uso do Drill-Down, com a Granularidade Tempo Trimestre para Mês ...........59 FIGURA 15 – Uso da Tabela Dimensão de Espaço e a Possibilidade de Acessos às Granularidades ..........................................................................................................................60 FIGURA 16 – Uso da Tabela Dimensão de Espaço no Nível de Granularidades Cidade........61 FIGURA 17 – Uma tela do Free SQL Reports .........................................................................62 FIGURA 18 – O acesso ao menu Published e suas opções de formatos para listagem de produtos ....................................................................................................................................63 11 LISTA DE ABREVIAÇÕES BI: Business Intelligence. CI: Competitive Intelligence. CRM: Costumer Relationship Management. DM: Data Mart. DOLAP: Desktop On Line Analytical Processing. DW: Data Warehouse. EIS: Executive Information System. ERP: Enterprise Resource Planning. HOLAP: Hybrid On Line Analytical Processing. KM: Knowledge Management. MOLAP: Multidimensional On Line Analytical Processing. OLAP: On Line Analytical Process ROLAP: Relational On Line Analytical Processing. SAD: Sistemas de Apoio à Decisão. SQL: Structured Query Language. TI: Tecnologia da Informação. TPC: Transaction Processing Council. 12 SUMÁRIO INTRODUÇÃO........................................................................................................................11 CAPÍTULO 1 – SOBRE O BUSINESS INTELLIGENCE......................................................13 1.1 Sistema de informação........................................................................................................13 1.1.1 Sistema de Apoio à Decisão..........................................................................................14 1.1.2 Sistema de Informação Gerencial.................................................................................15 1.2 Histórico do Business Intelligence......................................................................................16 1.3 Inteligência Competitiva.....................................................................................................18 1.4 Conceito geral de Business Intelligence.............................................................................19 CAPÍTULO 2 – APLICABILIDADE E UTILIDADE DO BI.................................................21 2.1 Necessidade da empresa e Modelo de Negócio..................................................................21 2.2 O que uma ferramenta de Business Intelligence oferece....................................................23 2.3 Diferencial Competitivo......................................................................................................25 2.4 Tendências..........................................................................................................................26 2.5 Produtos de Business Intelligence.......................................................................................29 CAPÍTULO 3 – AS TECNOLOGIAS QUE COMPÕEM O BI..............................................30 3.1 A modelagem multidimensional…….................................................................................30 3.1.1 As Tabelas Dimensão.......................................................................................................33 3.1.2 As Tabelas Fato................................................................................................................35 3.2 Data Warehouse e Data Mart..............................................................................................37 3.3 OLAP (On Line Analytical Process)…..............................................................................41 3.3.1 A arquitetura cliente / servidor no OLAP........................................................................42 3.3.2 As funções no OLAP.......................................................................................................43 3.3.3 Estratégias de armazenamento para o OLAP...................................................................45 3.4 Data Mining........................................................................................................................46 3.4.1 Etapas do Projeto de Data Maning...................................................................................48 3.4.2 Uso da Estatística no Data Mining...................................................................................49 13 CAPÍTULO 4 – ESTUDO DE CASO………………………………………………………..54 4.1 O que a ferramenta oferece na prática.................................................................................55 CONCLUSÃO..........................................................................................................................64 REFERÊNCIAS........................................................................................................................66 11 INTRODUÇÃO As empresas atualmente lidam com muitos dados de diversas fontes internas ou externas a ela, acarretando em uma grande quantidade de informações que absorvem ou podem vir gerar, o que faz com que, às vezes, ocorra de não serem aproveitadas do melhor modo para a tomada de decisões, especialmente concernentes aos negócios e estratégias da organização. Assim, elas necessitam de auxílio para a formulação, adequação ou recriação, muitas vezes, do seu modelo de negócio. Com esse alvo em mira é que se envolvem conceitos e metodologias, que podem vir a serem disponibilizados em softwares e normalmente o são, para auxiliar nesse processo. Dentre estes, o Business Intelligence se destaca. Além de uma ferramenta, o Business Intelligence é um verdadeiro suporte aos negócios da empresa, pois vai de encontro à sua necessidade, no que tangem a tomada de decisão por focar justamente o ambiente de negócios no qual a organização está inserida. Isso tudo utilizando-se de análises de dados para a obtenção de informações de alta qualidade e com grande utilidade, condições de uso enquanto cruzamento de dados, sumarização e organização de informações, bem como sua aplicação para aferições de vários cenários em que os negócios da organização podem vir a estar envoltos. Para que se possa entender como tudo funciona, no capítulo 1 serão tratadas as principais características e tipologias de sistemas de informação, e qual o posicionamento do Business Intelligence nele. Seu histórico, os conceitos gerais de Inteligência Competitiva e a participação do Business Intelligence nela, além dos conceitos gerais dele, é o que esse capítulo procurará atingir. No capítulo 2 será discorrido sobre o relacionamento entre o modelo de negócios das empresas e a utilização do Business Intelligence. Para que as empresas devem vir a utiliza-lo, 12 as vantagens que ela poderia vir a obter, os diferenciais propostos por essa solução, bem como as tendências da aplicação da informação de forma estratégica que são permitidos pelo Business Intelligence será o foco desse capítulo. O capítulo 3 trata de como ocorre o uso dos conceitos das tecnologias que envolvem o Business Intelligence. Desde os de modelagem dimensional com as tabelas Fato e Dimensão, os conceitos e assuntos relacionados ao Data Warehouse e ou de sua fragmentação para abordagem de aspectos específicos, o Data Mart, o que é e as funcionalidades permitidas pelo Processamento Analítico On Line , até a conceituação, as etapas e o uso da estatística que envolvem Data Mining, este capítulo procurará discorrer. Já no capítulo 4 será efetuado um estudo com utilização prática de uma ferramenta real de Business Intelligence. Os princípios de utilização da ferramenta, o que ela permite ou não será demonstrado. Onde está cada funcionalidade permitida pelo Processamento Analítico On Line, e os tipos de informação que nele existem, onde efetuar consultas dinâmicas e outras funcionalidades, ou seja, identificar a importância da utilização de uma ferramenta de Business Intelligence e, especificamente, da viabilidade da ferramenta que será utilizada no estudo, é o que pretende alcançar esse capítulo. 13 CAPÍTULO 1 – SOBRE O BUSINESS INTELLIGENCE Nesse capítulo irá ocorrer a classificação do Business Intelligence dentro dos tipos de sistemas de informação. Também irá ser abordado sobre seu histórico e sobre sua conceituação geral. 1.1 Sistema de Informação Sistema de Informação é toda geração ou manipulação da informação, utilizando-se ou não de tecnologia. Pessoas, aparelhos, formas de comunicação, etc., são fontes do sistema de informação. Todo sistema gera algum tipo de informação. [...] Para conceituação inicial, informação é todo dado trabalhado, útil, tratado, com valor significativo atribuído ou agregado a ele e com um sentido natural e lógico para quem usa a informação. O dado é entendido como um elemento da informação, um conjunto de letras, números ou dígitos que, tomado isoladamente não transmite nenhum conhecimento, ou seja, não contém um significado claro. [...] (REZENDE, ABREU. 2003, p.60) Concentrando no recurso da informática, como parte do sistema de informação e como amplificador de capacidade dos outros recursos, é possível verificar e analisar como uma ferramenta tecnológica pode vir a ser uma solução para auxiliar a organização para atingir seus objetivos. Dentro de um ambiente empresarial existem vários níveis, mas que podemos dividir em três principais, conforme a figura 1. 14 Figura 1 - Os níveis básicos de uma organização Fonte – Elaborado pelos autores. No nível operacional há tarefas programadas dentro de cronogramas de curto prazo, onde ocorrem os processos produtivos ou mercadológicos (O’BRIEN. 2004, p.282). No nível tático existe o desenvolvimento de planos de curto e médio prazo, estabelecendo políticas, procedimentos e objetivos de negócio, com gerentes médios administrando recursos e controlando o desempenho de suas respectivas divisões. Por fim, existe o nível estratégico, dentro da identidade da organização, com os objetivos e metas de longo prazo, definidos pelos diretores e executivos da empresa (O’BRIEN. 2004, p.281). O sistema de informação deve ser estruturado de modo a oferecer um grande embasamento de informações tornando possíveis os processos e a tomada de decisões de interesse da organização. Os tipos de sistema de informação mais comuns em um ambiente empresarial são os Sistemas de Apoio às Operações e os Sistemas de Apoio Gerencial, que serão discutidos a seguir. 1.1.1 Sistema de Apoio às Operações Os Sistemas de Apoio (ou suporte) às Operações são aqueles que controlam transações, processos industriais e comunicações entre colaboradores. Eles inserem informações no banco de dados, porém segundo O’brien (2004, p.24) não possuem a 15 preocupação com a criação de melhores produtos de informação para os gerentes. Assim, é comum que as informações que geram necessitarem de processamento por Sistemas de Apoio Gerenciais. Existem três tipos de Sistemas de Apoio às Operações. São eles: Sistema de Processamento de Transações: eles efetuam o registro e o processamento de dados que resultam de transações da organização de duas formas basicamente. Quando o faz por meio de lotes ocorre acumulo de dados por certo tempo e o processamento é periódico, já quando ocorre em tempo real, o processamento acontece ao término da transação, de modo imediato (O’BRIEN. 2004, p.24); Sistemas de controle de Processo: efetuam o controle e monitoram processos físicos em tempo real, continuamente (O’BRIEN. 2004, p.24); Sistemas Colaborativos: sistemas de automação de escritório, que possuem como objetivo principal o aumento da comunicação e produtividade pessoal dos trabalhadores e grupos de trabalho de uma empresa (BATISTA, 2006, p.24). 1.1.2 Sistema de Apoio Gerencial Procura munir os gerentes de vários níveis de informações adequadas para tomada de decisão eficaz. Ele pode ser classificado de três formas principais: Sistema de Informação Gerencial: oferece relatórios e informações resumidas sobre o desempenho da organização. Desse modo, realimenta o planejamento de diretivas por parte dos administradores; São desenvolvidos com base no conhecimento específico do negócio, chamado de método de trabalho. E, com uma metodologia adequada para selecionar informações estratégicas e atividades críticas da empresa, os sistemas de informação gerencial usam ferramentas que permitem uma visão analítica dos dados/processos, gerando uma visão agregada, integrada e 16 gráfica dos principais indicadores de desempenho da empresa. (Batista. 2006, p.25). Sistema de Apoio à Decisão: fornece suporte interativo à decisão do gerente no nível tático. Conforme Batista (2006, p.25), ele oferece dados e modelos para solucionar problemas semi-estruturados, focado a tomada de decisão; Sistema de Informação Executiva: permite formar uma combinação dos sistemas anteriores. Possui uma interface amigável, de fácil acesso, aos executivos de nível estratégico da organização disponibilizando informações de cunho crítico de áreas competitivas e de atribuições empresariais. Batista (2006, p.26) fala que é um sistema de suporte ao planejamento estratégico da empresa e que ajuda no desenvolvimento de objetivos. Exatamente no auxílio às decisões da camada estratégica da organização, em sua necessidade de obtenção de dados úteis, organizados e de fácil visualização pelos acionistas, presidente, diretores e gerentes de alto padrão onde procura atuar o Business Intelligence, objeto desse estudo. 1.2 Histórico do Business Intelligence O conceito de Business Intelligence, como hoje visto, não é tão recente. Segundo Ribeiro et al (2003, p.1-2): [...] A história do BI que conhecemos hoje, começa na década de 70, quando alguns produtos de BI foram disponibilizados para os analistas de negócio. O grande problema era que esses produtos exigiam intensa e exaustiva programação, não disponibilizavam informação em tempo hábil nem de forma flexível, e além de tudo tinham alto custo de implantação [...]. Efetivamente, só depois da chegada dos bancos de dados relacionais e interfaces gráficas, somados a transações empresariais mais complexas, é que vieram a surgir 17 ferramentas mais voltadas para as necessidades de analistas de negócios. O que não demoraria. Foi na década de 80 que ocorreu a busca de novas metodologias, onde, como informa Barbieri (2001, p.2), ocorreu a administração e modelagem de dados, a engenharia de informação e a análise de dados, em contraposição ao modo empírico de processamento. Barbieri (2001, p.2) diz ainda que também foi a época da modelagem relacional, o que facilitava o tratamento dos dados em matrizes bidimensionais, porém ainda sem grande preocupação com as relações de negócio das empresas. Na época de 90 ocorreu o advento da internet e de outras fontes de informação e comunicação. Contando com um grande apoio das formas de transmissão de dados, computadores e outros aparatos, as pessoas tinham acesso a um enorme número de dados: é a Revolução Tecnológica (BARBIERI. 2001,p.3). [...] Diferentemente da Revolução Industrial, onde as benesses não chegavam a todos diretamente, a revolução dos dados e da informação, capitaneada pela Internet, tornou-se democrática, invasiva e de amplo alcance.[...] (BARBIERI. 2006, p.3) Depois do alarido do “bug do milênio”, entrou-se em um momento em que as empresas procuravam formas de obterem mais clientes e mantê-los fiéis, serem mais flexíveis em seus processos e se posicionarem estrategicamente com o uso inteligente de suas informações. As grandes corporações iniciaram uma busca de ferramentas para disponibilizarem aos tomadores de decisão informações mais seguras, completas e com maior facilidade de interação. Surgem os data warehouses, o conceito de mineração de dados e a possibilidade de simulações com dados históricos. Conforme Barbieri (2006, p.5), “chegamos a era do BI-Business Intelligence, com a informação usinada a partir dos dados sendo diretamente aplicada aos negócios[...]”. O Business Intelligence está dentro do conceito de Inteligência Competitiva, que será conceituado a seguir. 18 1.3 Inteligência Competitiva Mattos et al (2003, p.1) informa que “no atual contexto, as empresas estão competindo em dois mundos: um mundo físico feito de recursos que os gerentes podem ver e tocar e o virtual feito de informações. [...]”. Dessa forma, tem-se que a informação direciona os valores e cria riquezas para a organização. Não só fatores internos, mas também os externos à organização, o mercado, influenciam no conceito de utilização da informação como uma função que agrega vantagem competitiva. Assim, uma estratégia TI pode vir a mudar a estratégia de negócios da empresa, porque normalmente ela é considerada ponto de partida para o planejamento de TI (MATTOS et al. 2003, p.4). Torna-se claro, dessa forma que a organização pode fazer uso da informação para se tornar, cada vez mais, um player forte dentro no mercado. O uso da Competitive Intelligence (CI), ou Inteligência Competitiva, nesse cenário, é um grande diferencial. Barbieri (2001, p.6) informa que “a idéia básica de CI é a de explorar o outro lado da trincheira, obtendo informações detalhadas sobre os competidores e o mercado onde se guerreia pela opção do cliente”. Dentro de um mundo de informações, encontrar aquelas que realmente podem vir a ser úteis a empresa para competir com seus concorrentes, não é tarefa fácil. É importante utilizar mecanismos de rastreamento para conseguir dados importantes, para futuramente, ocorrer a possibilidade de uso de ferramentas como o Planejamento Analítico On Line, geradora de informações úteis. Ainda segundo Barbieri (2001, p.7), “podemos entender CI como um BI aplicado ao mundo fora de nossas fronteiras empresariais focado primariamente em informações textuais e factuais que dizem respeito aos movimentos do mercado e dos concorrentes”. 19 Não é difícil entender assim que os dados, devidamente filtrados, podem vir a ser processados de modo a tornarem-se informações úteis que, bem trabalhadas e empregadas, tornam-se conhecimento. Esse conhecimento utilizado de forma estratégica torna-se fator de ganho de competitividade pela empresa. O Business Intelligence, que será tomado a seguir, procura criar esse cenário para a organização. 1.4 Conceito geral de Business Intelligence Business Intelligence, inteligência de negócios, em português, base da Inteligência Competitiva, é um conjunto de metodologias e conceitos disponibilizados em ferramentas que procuram dar condições para organizações tomar decisões e a possibilidade de obtenção, armazenamento e filtragem para a formatação de dados úteis para a análise e criação de informações relevantes, como indicadores de desempenho. O Business Intelligence é uma ferramenta de auxílio da análise e geração de informações úteis para tomada de decisão, especialmente do gerente de alto nível. [...] Da mesma forma que as montadoras de automóveis criam novas versões de modelos antigos para gerar demanda, o mercado de tecnologia inventa siglas e diferentes abordagens para temas já existentes. BI é um exemplo clássico. A sigla é uma roupagem nova para os já conhecidos Sistemas de Apoio à Decisão (SAD) baseados em fatos, ou Executive Information System (EIS), que existem há muito tempo mas carregavam no passado um impeditivo para sua difusão em larga escala: o custo das ferramentas.[...] (MYLIUS. 2003, p. 21) Essa é uma ferramenta poderosa, capaz de utilizar de modo eficaz os dados oferecido pelo Data Warehouse ou Data Marts (bancos de dados dimensionais que serão abordados mais a frente), com conceitos de cubos de informações e mineração de dados, possibilidade de sumarização e expansão de informações. A grande vantagem do uso do Business Intelligence é essa: a possibilidade de contar com uma aplicação robusta que vem em auxílio ao processo 20 de decisão crítica, com velocidade e confiabilidade. Valle et al (2005, p.112) considera que o Business Intelligence é um veículo que permite as empresas definir, estabelecer e manter a vantagem competitiva, mesmo num momento em que os dados de negócio são tão complexos e volumosos. A figura 2 pode ilustrar o posicionamento do Business Intelligence na empresa. Inteligência Competitiva - Dados - Metadados - Combinações Figura 2 - o ambiente organizacional e o lugar do Business Intelligence Fonte – Elaborado pelos autores. Em vista de todo o exposto até o momento, pode-se entender que o Business Intelligence, que é o resultado de conceitos amadurecidos ao longo dos anos, vem oferecer uma proposta de informações de alta qualidade para que uma organização possa vir a tomar decisões e até re-planejar seu negócio essencial. Essa metodologia oferecida às organizações será discutida a seguir. 21 CAPÍTULO 2 – APLICABILIDADE E UTILIDADE DO BI Não basta saber o que é Business Intelligence. É importante saber efetivamente para que o utilizar, o que ele faz e quais são os diferencias de vantagens agregados a ele, além das tendências do ambiente que o contém. 2.1 Necessidade das empresas e modelo de negócio As empresas hoje necessitam serem extremamente ágeis e flexíveis em suas decisões e operações para que consigam galgar maior competitividade, almejando maior riqueza, reconhecimento e lucratividade. Sem o uso de informações críticas, se torna impraticável esse processo decisório. [...] Com o advento da globalização ficou praticamente inadmissível ficar desinformado. O mundo ficou mais competitivo, as empresas e clientes, ficaram mais ágeis. As empresas fazem parte do mundo dos negócios e esse visa lucro, com retorno dos investimentos no menor tempo possível. Numa esfera altamente competitiva como esta, as informações assumem um papel fundamental no sucesso das organizações. [...](RIBEIRO; et al. 2003, p.1) A forma de negócio que a empresa vem a utilizar, seu modelo de negócio, é baseada em uma série de decisões, fundadas em variáveis provindas do relacionamento com os parceiros, bem como com o cliente (no valor das ofertas a ele oferecidas, nas formas de distribuição). Além disso, depende também da formatação da competência essencial, da estrutura de custo e canais de lucratividade, e das operações produtivas ou negociais. Assim, de acordo com a forma como se executa cada atividade, somada ao valor que é adicionado, bem como as despesas, é possível determinar se a empresa possui alto ou baixo custo em relação à sua concorrência. 22 Para melhor entendimento do que seria modelo de negócios, pode-se considerar que ele é a forma como a empresa responde ao seu ambiente de negócios, ou seja, é como ela conduz os negócios. Para exemplificar, é possível considerar as formas de duas empresas que vendem os mesmos produtos, porém para tipos de clientes, canais de venda, formas de entrega e suprimentos diferentes. Um modelo de empresa poderia vir a se valer de uma forma mais tradicional, com vendas no seu estabelecimento, e comprando de fornecedores que ofereçam o preço mais baixo. Um outro modelo existente poderia ser de uma empresa que efetua negócios pelo ambiente web, abordando clientes que compram pela internet, efetuando entrega por correio e comprando de fornecedores estratégicos, que garantam qualidade e velocidade na entrega. São exemplos de duas formas diferentes de fazer negócio, ou seja, são duas formas diferentes de modelos de negócio, entre muitos. É possível observar que dentro de um modelo de negócios existem várias regras de negócios, que são as prescrições pontuais do negócio. Por exemplo, a forma como o cliente efetua um pedido, é uma regra de negócio dentro de um modelo de negócios que forma um cenário de alguma organização. O modelo de negócio, desse modo, deve estar corretamente estabelecido com as diretrizes estratégicas da organização, bem como deve ser corretamente acercado por alguma análise para que possa vir, efetivamente, a ser passível de tomada de decisão. Com informações transviadas uma tomada de decisão acerca de estratégia, objetivo ou modelo de negócio da empresa pode vir a ser enviesada. Porém, com informações corretas na mão, um líder pode vir a estabelecer melhores estratégias, objetivos, metas e posicionar, adequadamente, um modelo de negócios viável e competitivo. [...] A tecnologia da informação pode ajudar todos os tipos de empresas a melhorarem a eficiência e eficácia de seus processos de negócios, tomada de decisões gerenciais e colaboração de grupos de trabalho e com isso pode fortalecer suas posições competitivas em um mercado em rápida transformação. [...] (O’BRIEN. 2004, p.3) 23 No momento atual o que a organização precisa é: informações relevantes que permitem um ato resolutivo eficiente, que possibilita o estabelecimento de objetivos, metas, análise dinâmica de riscos e demais outras variáveis concernentes à sua sobrevivência e competitividade. Afinal o que ela quer é trabalhar com conjeturas e simulações, analisar contextos, relações de causa e efeito, saber quem pode ser seu concorrente, onde pode ou deve investir, além de outros informes. [...] Os negócios de hoje encontram-se em transição em função do cenário econômico, da competitividade e da evolução tecnológica. As corporações buscam mais eficiência na tomada de decisões, logo necessitam de ferramentas que transformem os dados em informações estratégicas para agilizar a gestão do complexo empresarial. [...] (RIBEIRO. 2003, p.2) Essa necessidade que a empresa possui demanda a utilização de metodologias e conceitos adequados. A concepção para essa solução pode ser encontrada no Business Intelligence. 2.2 O que uma ferramenta de Business Intelligence oferece Uma ferramenta de Business Intelligence oferece a possibilidade de levantamento de informações de diversas formas, com o uso de uma interface para o usuário final relativamente amigável. Esse levantamento de informação tem o ponto de partida em armazenamento de dados, em bancos multidimensionais, e sua garimpagem, com a utilização de ferramentas de mineração de dados. Essas tecnologias serão discutidas futuramente. Como os dados históricos da empresa e outros dados internos e externos estão em um repositório simples de dados, é possível utilizá-los em buscas e formas de obtenção de informações úteis. Uma ferramenta de Business Intelligence permite obter resultados com variáveis esperadas como, por exemplo, quando se pretende efetuar uma projeção do valor de 24 seus ativos perante o mercado, tanto quanto resultados inesperados, como o apontamento da existência de um possível novo concorrente. Mylius (2003, p.54) diz que “as necessidades de geração de informações mais conhecidas são aquelas referentes a clientes, faturamento, margem e custos [...]”. Como já citado, o perfil da interface para o usuário final é importante. Em geral, as ferramentas de BI possibilitam a utilização de vários formatos de interface. Conforme Mylius (2003, p.37) “a vontade do usuário é ter uma interface amigável e intuitiva para acessar, analisar e compartilhar informações. Ele precisa obtê-las através de uma interface de sua própria escolha, como Web, Windows, Excel ou e-mail [...]”. Os administradores necessitam de uma ferramenta segura, que permitam comunicação em rede e com escalabilidade, ou seja, que supra a demanda de utilização por parte dos usuários. O Business Intelligence ainda deve suprir as necessidades de informação de áreas específicas, possibilitando informações expressas por gráficos, por indicadores de desempenho, como Margem de contribuição e outros, considerando cenários alternativos, e relatórios que geralmente estão dispostos em planilhas obtidas em menor tempo, abrindo caminho para utilizar a maior parte do tempo nos principais processos estratégico, que são analisar e decidir. Segundo Mylius (2003, p.37), os desenvolvedores necessitam de uma ferramenta de alta tecnologia para gerar qualquer tipo de análise. Estes relatórios podem exigir que a ferramenta disponha de análises matemáticas, financeiras e estatísticas, entre outras. [...] Sistemas de BI se destinam a atender usuários da área de negócios que esperam extrair informações a partir dos dados coletados. Muitas vezes milhares de transações são compiladas para se calcular um único indicador (ou métrica). [...] (CRIVELINI. 2006, p.7) 25 A solução de Business Intelligence que não possibilitar esse tipo de recurso, não pode ser considerada como tal. Já para aquelas que configuram este tipo de solução e são corretamente implementadas nas empresas, é comum esperar bons resultados. Para que uma organização venha a entrar em um projeto de Business Intelligence, é importante que defina e entenda muito bem sua missão, seus objetivos, ou seja, qual é a necessidade que possui e onde quer chegar, pois o Business Intelligence disponibilizará apenas o resultado da inserção e processamento de modo adequado da inteligência potencial da empresa em um sistema. 2.3 Diferencial Competitivo Pelos benefícios já expressos anteriormente, o tipo de abordagem que o Business Intelligence oferece ao utilizar o conhecimento potencial da empresa possibilita uma visualização integral do negócio da empresa e uma correta disposição dos dados para os usuários, com diversas origens. Isso cria maior potencial para a empresa focar esforços negociais e, assim, aumentar sua competitividade. [...]O uso dessas ferramentas integra os dados existentes nos sistemas ERP e CRM, proporcionando a fidelização de clientes, a otimização de alocação de recursos, o aumento de vendas cruzadas e casadas e a melhoria de qualidade de produtos e serviços prestados. [...](Batista. 2006, p.122) Em um cenário global em que as organizações estão, com muitos competidores e com formas diferentes de competir, como a internet já vem oferecendo há algum tempo, faz com que seja mais importante entender o que o cliente quer do que como produzir da melhor forma um produto, e isso é oferecido pelo Business Intelligence. Desse modo, ele permite adequar seu negócio e processos correlatos rapidamente. 26 Conforme Borges (2005, p.14), o uso de Business Intelligence pelo Grupo Shell cria condições de geração de 18 milhões de dólares por ano, reduzindo custos. Assim, só no Brasil, em 2005, o grupo teria investido 600 mil reais em um ano nesse recurso. Conhecendo profundamente seus clientes uma empresa poderia criar formas pró-ativas de abordá-los, com bons programas de marketing. Ou, com um cruzamento de dados entre produtos defeituosos devolvidos e vendas efetuadas gerando um relatório adequado, poderia gerenciar suas relações com parceiros e fornecedores. Ou ainda, obter a possibilidade de verificar a manutenção dos clientes que iriam mudar de fornecedor. Esses exemplos e outros mais poderiam expressar vantagens da utilização do Business Intelligence. [...] O que importa, no fundo, é o cultivo de um bom relacionamento com o elemento principal do circuito, que é o cliente. O que se vende, e como se vende parece ganhar status de menor importância do que o fato de poder estar mais próximo dele: sua majestade o cliente. (BARBIERI. 2001, p.11) A tomada de decisão da empresa visa atingir o cliente. Afinal é Inteligência de Negócio, e o negócio é a relação entre cliente e seu fornecedor, principalmente. A organização não dispõe apenas de dados formalizados para poder efetuar seu trabalho. Ela conta também com o conhecimento empírico e subjetivo das pessoas que a compõem. A tendência de se aproveitar esse tipo de conhecimento, além de outros fatores, faz com que a busca por ferramentas de auxílio não cesse. Isso pode ser visto na seqüência. 2.4 Tendências O sucesso de uma empresa nesse século será daquela que melhor tirar proveito das informações e conhecimento como riquezas, bem como geradoras de outras riquezas. No momento atual, onde as organizações já dispõem e empregam o Business Intelligence para 27 obter informações passíveis a serem diretamente empregadas nos negócios, já existem outras tendências que já começaram ou iniciaram sua caminhada. Um exemplo poderia ser o Knowledge Management System que, conforme BABIERI (2001, p.5), é a próxima fase de transformação do gerenciamento do conhecimento, que seria uma outra abordagem para suporte a tomada de decisão menos compartimentada e estruturada, como o Business Intelligence, e mais trabalhada com o ativo de informações da empresa, tanto formais quanto informais. [...] As tecnologias de Gestão do Conhecimento mais recentes e, portanto, a caminho da maturidade, podem combinar os sistemas de gestão de conteúdo atuais e a Web, como as funções e capacidades de mineração de texto, para a geração de maior valor a partir da exploração de fontes de informações textuais. [...] (VALLE. 2005, p.168) Segundo Barbieri (2001, p.6) o grande desafio das empresas hoje, não é somente organizar o Knowledge Management System, mas também estabelecer uma ponte entre ambos, fazendo com que Business Intelligence possa ser colado com Knowledge Management System. O papel do Business Intelligence seria disponibilizar as informações, enquanto o do Knowledge Management System seria as combinações e disseminações de forma a transformarem a informação em conhecimento. As tecnologias poderão se fundir acoplando e disponibilizando ferramentas entre si, o que pode inspirar outros conceitos. [...] A gestão do conhecimento ou Knowledge Management (KM) e a inteligência de negócios ou Business Intelligence (BI), aplicados juntamente com os recursos dos Sistemas de Informação e da Tecnologia da Informação, podem facilitar a geração de informações oportunas para favorecer os decisores empresariais em suas atividades estratégicas. Esses recursos devem estar alinhados com os objetivos estratégicos da organização, contemplados em planejamento formal, competente e contextualizando com inovação tecnológica competitiva. [...] (REZENDE, ABREU. 2003, p.221) 28 Outro fator importante a ser considerado são os negócios feitos pelas internet. É necessário viabilizar a união entre tecnologia e os novos modelos de negócio. Sempre quando aparecem propostas negociais inovadoras como Comércio Eletrônico, torna-se fundamental observar como se dará o encaixe, neste novo cenário, das tecnologias existentes e daquelas que se encontram em fase de maturação. [...] (BARBIERI. 2001, p.234) Informações antes pouco importantes, como a visita de um cliente ao ambiente onde efetuará a sua compra, quando no meio web devem ser registrados, mesmo que seja para levantar informações de comportamento dele antes da compra, ou mesmo que não a efetue. Esse conhecimento de comportamento é necessário para poder efetuar ações que impeçam os clientes migrarem para a página de compra do concorrente. Essa proposta deve ser acatada pelo e-Business Intelligence, que é o uso do Business Intelligence no ambiente web, seja puro ou misto (web mais negócio direto). [...] Isso claramente aumenta o sentido de competitividade da empresa, impedindo brechas de indisponibilidade que possam ensejar aos seus clientes saltos para sites de competidores e até possíveis quebras de fidelização. Quanto mais não fosse, por causa do ambiente dinâmico e volúvel dos comércios digitais, onde um simples clique separa duas opções de negócios. (BARBIERI. 2001, p.235) Focando no que toca diretamente o Business Intelligence, Ribeiro et al (2003, p.6) informa que na América Latina 40% das empresas pesquisadas estão avaliando ou planejando implementar aplicativos de Business Intelligence, o que no Brasil atinge 50%. Conforme Batista (2006, p.122), o Business Intelligence é o segundo maior investimento das organizações. Desse modo, é possível perceber que uma empresa que considera a informação como um bem ativo e a utiliza de uma forma inteligente pode melhorar significativamente seus resultados. É importante observar também que, como as empresas não são estáticas e mudam 29 de cenário, as metodologias de inteligência competitiva ou de negócios também tem que evoluir, criando similaridades e condições de relação entre si, e criando condições de se adequar aos vários modelos de negócio existentes. O Business Intelligence procura criar condições para melhor utilização da informação por quem tem que tomar decisão, o que depende da forma de como ele é modelado para poder ser explorado. 2.5 Produtos de Business Intelligence No mercado existem vários produtos de Business Intelligence disponibilizados às organizações. Além da forma tradicional de Business Intelligence, várias empresas de tecnologia criaram ou criarão produtos que se fundirão ou que incorporarão funcionalidades de outras ferramentas. Barbieri (2001, p.214) fala sobre três ferramentas que poderão vir a ser importantes: O BW (Business Information Warehouse) da SAP tem alta chance de trilhar o caminho de sucesso de seu produto irmão R/3, com quem se unirá formando a parelha ERP e BI que deverá estar presente nas grandes empresas nesse milênio que se inicia. É um componente opcional da nova arquitetura Mysap.com da SAP. O Oracle Express, produto oferecido como solução de BI, da Oracle, empresa dominante no cenário de Banco de Dados e uma das líderes do segmento de Data Warehouse e Data Marts. O produto Analysis Services da Microsoft, que provavelmente cumprirá um importante papel de democratização dos conceitos OLAP, levando, ao capilarizado mundo MS, uma alternativa de implementação de BI. Além dos produtos citados acima, existem muitos outros, como o Report Manager da Ariacom Business Reports, a ferramenta que será utilizada para o estudo de caso do capítulo 4. Afora essas ferramentas, existem muitas outras no mercado que as empresas podem vir a utilizar, de acordo com sua necessidade e do que os fornecedores podem vir a disponibilizar. 30 CAPÍTULO 3 – AS TECNOLOGIAS QUE COMPÕEM O BI Nesse capítulo serão abordadas as partes de um sistema de Business Intelligence, em linhas gerais. Isso para que se possa entender de uma melhor forma como a ferramenta capta, trabalha e disponibiliza as informações. 3.1 A modelagem multidimensional A base do Business Intelligence é o Data Warehouse. Esse é um projeto que utiliza o modelo multidimensional em sua criação, disponibilizando os dados na forma de um cubo, com várias perspectivas. […] Quando falamos em modelagem multidimensional, estamos nos referindo à definição de um modelo que se destina à análise de dados. No que diz respeito à análise de dados, o que se espera do modelo de dados é que: Seja uma representação simples do modelo de negócios estudado; Seja um modelo físico de fácil interpretação, de modo que usuários sem treinamento formal em TI, possam entendê-lo; Facilite a implementação física do modelo de modo a maximizar performance das consultas de dados. […] (CRIVELINI. 2006, p.6) Em geral, utiliza-se dos mesmos métodos da modelagem relacional para a modelagem multidimensional, como o uso de tabelas, atributos e relacionamentos. Porém, dentro dessa abordagem a normalização não é uma premissa, pois pode haver dados redundantes. Isso ocorre porque dados replicados permitem maior performance. Barbieri (2001, p.80) fala que “a rígida blindagem da normalização, por exemplo, se curva, vez por outra nesses projetos, à necessidade de estruturas mais ágeis, mesmo com um sintomático aumento no custo de armazenamento”. 31 Nesse modelo existem duas tabelas que o compõe: a Fato e a Dimensão. A tabela Fato armazena um ou mais fatos que são números de medida decorrentes de eventos do cenário de negócios. Essa tabela possui uma chave-primária composta, advinda do relacionamento com as tabelas dimensão que mantém. O tipo de dado nela existente, normalmente, é aditivo, que permite operações matemáticas, além de certo modo estático. Já as tabelas Dimensão são aquelas que filtram os valores da tabela fato. Seu relacionamento com a tabela fato é um para muitos, e possuem chave-primária que compõe a chave-primária da tabela Fato com a qual se relacionam. Ela representa a entidade do cenário como, por exemplo, cliente, produto, etc. Também é por onde se efetua consultas no Data Warehouse ou no Data mart. As duas tabelas serão abordadas novamente adiante. O relacionamento entre os dois tipos de tabela pode ser exemplificado na figura 3. VENDAS PRODUTO Cod_Produto 1/N Cod_Dia (FK) Cod_Filial (FK) Cod_Produto (FK) FILIAL 1/N Cod_Filial Qtde_Vendida Valor_Total 1/N DIA Cod_Dia Figura 3 - As tabelas Dimensão (Produto, Dia e Filial) relacionadas com a tabela Fato Vendas. Fonte – Elaborado pelos autores. Na figura 3 é possível verificar o relacionamento um pra muitos que as tabelas Dimensão Produto, Filial e Dia possuem com a tabela Fato Vendas. Nesse tipo de relacionamento, um para muitos, a tabela Fato recebe a chave-primária das tabelas Dimensão, que perfazem uma chave-primária composta para ela. 32 Para efetuar uma modelagem dimensional é necessário definir claramente a área de negócio que se quer abordar de acordo com a prioridade da organização (BARBIERI. 2001, p.82). Em seguida, deve-se definir seus processos. Por exemplo, dentro da área de negócio Vendas da empresa, um dos principais processos poderia ser o de controlar pedidos. Tudo isso deve ser abordado de modo a ser compreendido completamente em seus relacionamentos, objetos, etc. Logo após esta fase, é necessário determinar a granularidade para o controle do processo, ou seja, a combinação de dimensões para armazenar dados em determinados fatos. Um exemplo seria considerar as vendas diárias de determinada filial, o que exigiria a granularidade Produto-Filial-Dia. Um outro seria as vendas mensais da filial, ajustando a dimensão tempo de dia para mês, perfazendo a granularidade Produto-Filial-Mês. É importante observar mais duas coisas sobre granularidade, uma é a relação com a tarefa à executar, por exemplo, se o processamento deve ser feito diariamente, então usa-se a dimensão dia. Outro ponto é o custo dos dados históricos em contrapartida da informação requerida. O volume pode ser estimado através de uma média de combinação entre as dimensões. Por exemplo,suponha que em cada loja, na média, num determinado dia, são vendidos 10.000 produtos. Se tivermos 200 lojas e desejarmos armazenar os dados por 2 anos (365*2) teríamos algo em torno de (10.000*200*730)1,46 bilhão de registro . Se considerarmos que teremos três chaves (chave-produto, chave-loja, chave-dia, cada qual com 5 bytes) e três valores numéricos (cada qual com 4 bytes) teremos a bagatela de 1.46 bilhões de registros x 27 bytes (15+12), o que levaria a um montante de 39,4 gigabytes, sem contar gastos com índices e outra tabelas acessórias. Note que estamos considerando somente uma tabela Fato.perceba que qualquer acréscimo em uma das variáveis dimensionais, pode elevar o volume calculado à patamares estratosféricos. Aqui caberia, entre outros um questionamento sobre a dimensão temporal.Dois anos são suficientes para se perceber os padrões escondidos de comportamento de vendas de produtos em lojas, que as ferramentas de Data Mining se propõem revelar? (BARBIERI. 2001, p.83-84). 33 3.1.1 As Tabelas Dimensão Para as tabelas dimensão é importante a seqüência de três passos: Sua definição, sua normalização e o relacionamento de seus atributos. As dimensões, geralmente, relacionam-se com o objeto, o tempo e o espaço de determinado cenário. Quanto melhor definida as dimensões, maior a possibilidade de se utilizar delas em análises. Por exemplo, um objeto importante de ser definido é o Cliente. Já um espaço a ser definido poderia ser Cidade. Geralmente o Ano é uma das noções de tempo utilizadas nos projetos de Business Intelligence. Depois de identificar uma dimensão é necessário identificar a existência de hierarquia. Por exemplo, para a dimensão tempo poderia existir a hierarquia ano, mês e dia entre outros. Essa hierarquia irá compor os atributos da tabela dimensão de tempo: Td_Dia (cod_dia, ano, mês). Deve existir a conformidade das dimensões, ou seja, elas devem conter o mesmo conteúdo semântico, segundo Barbieri (2001, p.92). Isso deve ser feito com uma granularidade o mais detalhada possível, conforme a necessidade, e com o sentido de hierarquia correto, o que diminui possíveis impactos de relacionamentos incompatíveis. Para que ocorra a normalização das tabelas dimensão é necessário escolher entre dois esquemas. Um deles é o de Estrela, onde não ocorre normalização. O outro é o de Flocos de neve, onde ocorre normalização por camadas. No esquema Estrela as informações são mantidas todas na tabela, mesmo que estas já estejam contidas em outras tabelas, havendo redundância. Porém, essa redundância permite uma maior performance, por isso é normalmente o esquema mais utilizado. Conforme Barbieri (2001, p.86), “a utilização do esquema estrela (Star schema) é extremamente recomendável, pelos aspectos de ganho de performance, quando comparado com o esquema de flocos de neve (snowflake) [...]”. 34 O modelo de flocos de neve que, por seu lado, mantém a informação sem redundância guardando em apenas uma tabela, permite uma redução no uso do espaço. Essa redução, todavia, é ínfima perto do espaço utilizado pelas Tabelas Fato. Para os atributos da Tabela Dimensão, quando se quando se fala em relacionamentos, pode haver três formas. A primeira é o não relacionamento entre si, o que confere independência para as tabelas. A segunda é o relacionamento um para muitos, provindo da hierarquia. Por fim existe o relacionamento muitos para muitos, onde uma característica representada na tabela dimensão pode se relacionar uma ou mais vezes com uma outra, e vice versa. Entre as dimensões ainda pode ocorrer combinações, ocorrendo de serem colocadas em uma única tabela. Isso se dá quando elas ocorrem constantemente juntas e ocorre a combinação de seus valores. Deve-se ainda atentar para o que Barbieri (2001, p.99) chama de dinâmica das dimensões, que consiste na forma de gerenciamento e armazenamento de informações quando ocorrem mudanças ou atualizações em tabelas já existentes. Existem três estratégias para resolver esse problema. A primeira é simplesmente substituir os dados antigos pelos novos, o que faz perder os registros históricos dessas informações. A segunda forma poderia ser criar versões da dimensão, com o uso de delimitadores como data de início dessa versão, o que permite a permanência dos registros históricos dessas dimensões em seus diversos perfis ao longo do tempo. Por fim, existe a criação de dois campos de registros, o que mantém parte do histórico dos registros, o atual e o anterior somente. No caso de projetos de dimensões com alto volume e alta volatilidade, a estratégia recomendada é a divisão dos dados da dimensão em dois registros diferentes, separando-se os dados estáticos dos dados voláteis. Essa estratégia, comum nos projetos de Bancos de Dados, criará uma situação onde os atributos da dimensão estarão em dois registros diferentes, com chaves separadas para identificá-los em um relacionamento que permita a junção deles. [...] (BARBIERI. 2001, p.101) 35 Existem ainda algumas dimensões que são consideradas descartáveis. São aquelas que não mantém muita relação com a tabela Fato. São dimensões que guardam informações diferenciadas e geralmente pequenas como, por exemplo, sexo (masculino/feminino). São importantes para efetuar filtros nas buscas e permitem abordar situações específicas através de combinações entre elas. Tanto para as tabelas Dimensão e, consequentemente, para as tabelas Fato em sua chave composta, é recomendável o uso de chaves artificiais, ou seja, de identificadores inteiros gerados pelo Sistema Gerenciador de Banco de Dados. Isso gera vantagens como garantia de unicidade de chave, chaves menores do que as naturais em geral, implementação automática de chaves, entre outras. 3.1.2 As Tabelas Fato Além de identificar quando da existência de tabela Fato e como é formada sua chave primária, o que já foi abordado anteriormente, é importante identificar os valores que deverão ser armazenados, ou seja, os atributos que irão guardar as informações mais importantes para a tomada de decisão. Esses atributos recebem, assim, valores provenientes das dimensões e que são calculados como, por exemplo, valor total de vendas, entre outros. Esses valores são chamados também de métricas. Existem basicamente três tipos de métricas. Essa tipologia provém da capacidade de efetuação de soma dos valores, e ocorre da seguinte forma: - Métrica aditiva: ocorre quando é possível somar os valores em todas as dimensões; - Métrica Semi-aditiva: é quando faz sentido efetuar soma em uma só dimensão; - Métrica Não-aditiva: é quando não tem sentido efetuar soma nos valores em dimensão qualquer. Conforme Barbieri (2001, p.89), “observe que dependendo da modelagem do 36 negócio, poderão aparecer várias tabelas Fato necessárias aos registros dos produtos nas suas dimensões. [...]”. Existem tabelas Fato sem métricas, ou seja, sem atributos de nenhum tipo. Essas tabelas servem para relacionar as tabelas Dimensão envolvidas, onde o resultado é gerado justamente por esse relacionamento. Também podem existir subtipos de tabelas Fato de acordo com a necessidade do modelo de negócio, onde ocorrem classificações para abordar dimensões de um mesmo tipo, porém com métricas diferentes. É o conceito de entidades Tipo e Subtipo focado para a modelagem dimensional (BARBIERI. 2001, p.107). É possível ainda que venha existir tabelas agregadas. São aquelas que são predefinidas que disponibilizam informações gerenciais costumeiras. Porém é necessário cuidados no momento de definir e criar tabelas desse tipo. [...] Os valores agregados representam paradoxalmente uma solução e alguns problemas. Solução, porque estabelece a definição e a criação de tabelas prontas, trabalhadas e sumariadas em várias dimensões, e que facilitam os acessos aos dados e agilizam os processos decisórios. Problemas, pois agridem de certa forma os processos canônicos de não-redundância, estabelecidos nos preceitos de projetos de Banco de Dados desde a sua criação. Além disso, obviamente, gastam mais espaço, pois exigiram uma coleção de tabelas Fatos ou Dimensão, agora dedicadas ao armazenamento de dados num estado já pré-processado. (BARBIERI. 2001, p.109-110) A definição de metadados (ou metainformações) é muito importante para o ambiente o Data Warehouse / Data Mart e de ferramentas Processamento Analítico On Line (BARBIERI. 2001, p.114). Estes são os dados que definem que tipos de dados as métricas recebem e colocam limites em sua apresentação. Eles permitem o uso eficiente do ambiente de Data Warehouse, pois são gerados pelo levantamento de requisitos, bem como pela disposição da informação para ser visualizada, e mantém informação tanto para a área técnica, criando uma estrutura de dados técnicos, quanto para a área gerencial, possibilitando uma estrutura de informações negociais. 37 São pelos metadados que ocorre a conversão dos dados quando serão inseridos nos Data Warehouse / Data Mart, a definição de como serão modelados e como as informações deverão alimentar os repositórios, bem como a forma a serem apresentados em cubos de informações. Segundo Barbieri (2001, p.115), significa que uma certa aplicação Processamento Analítico On Line poderia utilizar vários Marts, e que cada Data Mart poderia estar presente em várias aplicações. Essas informações são úteis, porém exigem cuidados. Isto se deve ao fato de que os metadados geralmente estão dispostos em vários repositórios, o que compromete a construção, manutenção e aplicação do Data Warehouse. 3.2 Data Warehouse (DW) e Data Mart (DM) O Data Warehouse é um banco de dados que se utiliza da modelagem dimensional. Segundo Mylius (2003, p.31-32) o Data Warehouse deve ser orientado para atendimento dos principais assuntos, integrar dados de diferentes sistemas, e conter informações não voláteis e históricas. [...] Para uso efetivo desta tecnologia de DW nos Sistemas de Informação Executivos, ela deve ser trabalhada de forma integrada a outras tecnologias, incluindo as ferramentas e recursos de Decision Support System, Sistemas Gerenciadores de Banco de Dados, Executive Information System, aplicações On-Line Transaction Processing (OLTP) e Data Mining [...] (REZENDE, ABREU. 2003, p.212) Como se pode observar, ele armazena os dados que podem ser extraídos de diversos meios ou bancos de dados (O’BRIEN. 2004, p.142). É o repositório que centraliza as informações de um modelo de negócios de modo organizado, e permite o acesso a elas para aplicações de ferramentas analíticas, conforme indica a figura 4. 38 Figura 4 - Um Data Warehouse que recebe informações de diversas fontes Fonte – Elaborado pelos autores. O Data Warehouse pode ser composto de vários Data Marts, que nada mais é que a aplicação da modelagem dimensional para uma parte de um modelo de negócios, ou seja, como informa O’brien (2004, p.142) os Data Marts focam aspectos específicos, como um departamento, de uma empresa. A figura 5 pode esclarecer de como esse mecanismo funciona. 39 Figura 5 - um Data Warehouse composto de vários Data Marts Fonte – Elaborado pelos autores. Geralmente, os Data Warehouses / Data Marts possuem uma ferramenta Processamento Analítico On Line, que permite análises de dados em grande quantidade rapidamente, criando visões dos aspectos que mais interessam. Para isto, na criação do Data Warehouse / Data Mart é necessário definir os fatos, as dimensões, os atributos e a granularidade das informações (conceitos da modelagem multidimensional) realmente importantes para o negócio. [...] Gostaríamos de destacar que devem ser avaliados e escolhidos os atributos que sejam importantes para a análise. O Data Warehouse / Data Mart não deve ser confundido com um grande cadastro de informações, muitas vezes repletos de dados não utilizados pelos usuários. [...] (ITALIANO, ESTEVES. 2005, p.38) São pontos da criação do Data Warehouse / Data Mart : Tamanho: é importante estimar o tamanho que o banco de dados ficará. Para tanto, primeiro se calcula o espaço necessário à tabela fato (a maior parte do tamanho do banco), para as tabelas dimensão e para os índices. Também é importante cuidar da área de trabalho 40 que será utilizada no momento da execução de comandos SQL e dos agregados (BARBIERI. 2001, p.150-151). Segundo Crivelini (2006, p.8-9) as tabelas Fato representam 95% do tamanho do banco de dados porque, além de gigantescas, elas tendem a crescer com o tempo, pois o Business Intelligence faz uso de informações históricas, que não param de acontecer. Tabelas e atributos: é importante observar os metadados que serão utilizados na tabela para representar determinados dados, pois poderão impactar no tamanho que será necessário para as tabelas e, consequentemente, no espaço utilizado por elas, bem como é importante atentar para atributos que permitam valores nulos, que deverão ser evitados nas tabelas Fato. Também é interessante lembrar do uso de chaves artificiais, que além de outras vantagens permitem a neutralidade semântica, não interferindo nas regras de negócios e relacionamentos (BARBIERI. 2001, p.155). Inserção das informações nos bancos de dados e sua atualização: como é crescente o tamanho do Data Warehouse / Data Mart, é necessário às organizações Segundo Barbieri (2001, p.163) é importante o cuidado do mapeamento dos dados entre a fonte e o Data Warehouse / Data Mart, bem como na forma de transformação efetuada nos dados. É imprescindível essa transformação de modelos. Existem algumas atividades básicas que compõe o processo de transformação do modelo de dados da empresa em um modelo de Data Warehouse. São elas: 1. Remoção de dados puramente operacionais; 2. Adição de um elemento de tempo à estrutura da chave do data warehouse, se um desses elementos já não estiver presente; 3. Adição de dados derivados apropriados; 4. Criação de artefatos de relacionamentos; 5. Acomodação dos diferentes níveis de granularidade encontrados no data warehouse; 6. Fusão (merge) de dados semelhantes provenientes de diferentes tabelas; 7. Criação de arrays de dados; 8. Separação dos atributos de dados de acordo com suas características de estabilidade. (ITALIANO, ESTEVES. 2005, p.60) 41 Performance: segundo Barbieri (2001, p.165) fala do problema que pode vir ser o caso da performance: [...] Os altos volumes de dados, definidos pela necessidade de granularidades finas que permitam a captura dos indicadores de negócios, aliados às possibilidades variadas de combinações de dimensões, sugerem problemas potenciais de performance [...] Para criar um padrão de performance, algumas empresas que formavam o TPC (Transaction Processing Council), como IBM, Sun, etc., reuniram-se e definiram o TPC-D, que servia para medir a relação custo / benefício do Data Warehouse ou Data Mart, onde eles deveriam efetuar certo número de comandos SQL em diversas situações. Futuramente esse padrão foi substituído por outros padrões como o TPC-R e o TPC-H. 3.3 OLAP (On Line Analytical Process) O On Line Analytical Process ou Processamento Analítico On Line, é uma ferramenta de análise de relacionamentos complexos entre as informações inseridas nos repositórios multidimensionais, para descobrir padrões, tendências e situações incomuns. Permite também que os gerentes e analistas examinem de modo interativo e possam manusear grande quantidade de informações (O’BRIEN. 2004, p.284). Assim, conforme Rezende e Abreu (2003, p.221), “ o Olap suporta a análise da tendência, os cenários e as projeções de negócios, como instrumento de suporte às decisões gerenciais e estratégicas[...]”. A forma principal da disposição das informações levantadas por ele é a de um cubo de dados. [...]De forma resumida, o cubo é uma estrutura multidimensional que armazena os dados tornando-os mais fáceis de se analisar. Cada cubo contém uma tabela de fatos e várias dimensões. Por exemplo, um cubo contendo informações de vendas poderá ser composto pelas dimensões tempo, região, produto, cliente, cenário (orçado ou real) e medidas. Medidas típicas seriam, 42 por exemplo, valor de venda, unidades vendidas, custos, margem de lucro, etc.[...] (FELBER. 2005, p.35) Três pontos importantes ainda devem ser vistos no Processamento Analítico On Line: a arquitetura cliente / servidor, as funções e as formas de armazenamento. Esses pontos serão vistos a seguir. 3.3.1 A arquitetura cliente / servidor no OLAP Na arquitetura cliente / servidor de aplicações do Processamento Analítico On Line é comum o fato de ocorrer alternativas ou situações para disponibilizar as informações. As três alternativas são as que seguem, depois exemplificadas pela figura 6: Cliente Gordo: possui uma cópia particular do Repositório multidimensional. Usado, geralmente, na computação móvel, precisa ter atualizações periódicas do repositório base e sofre limitação de espaço de disco (BARBIERI. 2001, p.168); Cliente médio: é o modo comum de arquitetura, onde o cliente solicita informações ao servidor de Processamento Analítico On Line. Possui a vantagem de relacionamento direto com a base de dados, só dependendo dos meios de rede (BARBIERI. 2001, p.169); Cliente/Servidor Web: existe o browser na estação cliente, facilitando a manutenção do Processamento Analítico On Line, que está em um servidor de aplicações, seja para internet ou intranet. É a alternativa mais leve (BARBIERI. 2001, p.169). 43 Figura 6 - As arquiteturas, na seqüência, Cliente Gordo, Cliente Médio e Cliente/Servidor Web. Fonte – Elaborado pelos autores. Acessando o servidor, os clientes poderão efetuar operações no Processamento Analítico On Line. Essas operações são funções de demonstração de informação: sumarização, detalhamento, entre outros. Essas funções serão apresentadas abaixo. 3.3.2 As funções no OLAP O Processamento Analítico On Line efetua cinco funções basicamente. Elas são: interface, consulta, processo, formato e exibição (REZENDE, ABREU. 2003, p.221). Para que se efetue o Processamento Analítico On Line, é necessário também que ocorram algumas operações, dentre as são principais: Drill-Down: é quando ocorre a desagregação dos dados, ou seja, seu detalhamento (O’BRIEN. 2004, p.285). Para ilustrar o que seria um uso de Drill-Down, poder-se-ia considerar as vendas anuais detalhadas por meses ou dias; 44 Drill-up: é o contrário do drill-down. Relaciona-se com a agregação de dados, ou seja, junções dos dados, seja de modo simples ou complexo (O’BRIEN. 2004, p.285). Isso significa que ele sumariza as informações. Um exemplo poderia ser o total de vendas de uma empresa agrupadas por um determinado período, como um ano; Drill-across: ocorre quando se efetua uma consulta na tabela dimensão pulando níveis da hierarquia (FELBER. 2005, p.37). Por exemplo, em uma dimensão de espaço composta por País, Região, Estado e Cidade, se o usuário viesse a passar de País para Cidade direto, sem passar pelos outros níveis, ele estaria efetuando um drill-across; Drill-through: é quando o usuário requer uma informação de menor nível do que o contido na hierarquia armazenada na tabela fato, dentro da estrutura granular, ou seja, conforme Felber (2005, p.37), é uma informação de menor nível do que o contido na granularidade da tabela fato. Um exemplo poderia ser a requisição de alguma informação em determinado turno de uma empresa, considerando que a granularidade só vai até dia; Slicing and Dicing: implica o processo de fatiar em cubos as informações de modo a criar várias perspectivas, o que possibilita a visualização dessas informações de diferentes pontos de vista (O’BRIEN. 2004, p.285). Para exemplificar, é possível considerar as informações de vendas totais de um determinado produto da empresa pelo ponto de vista de regiões, e pelo ponto de vista de período, vendedores, etc.; Pivoting: Pivoteamento. É quando ocorre alguma mudança do arranjo das linhas e colunas em um relatório tabular, onde, em geral, as linhas ou as colunas são derivadas de dimensões diferentes, com inversões em seus eixos, obtendo visões diferentes (FELBER. 2005, p.38). Ainda faltam serem vistas as formas de armazenamento para o Processamento Analítico On Line. Estas estratégias estão apresentadas na seqüência. 45 3.3.3 Estratégias de armazenamento para o OLAP Segundo Barbieri (2001, p.174), existem método ou estratégias de armazenamento de dados, ou dos cubos extraídos do Data Warehouse / Data Mart. Essas estratégias são as que seguem: ROLAP (Relational On Line Analytical Processing): significa Processo analítico Relacional On Line. É quando se utiliza os Sistemas Gerenciadores de Bancos de Dados Relacionais, com as vantagens próprias neles contidos, como o processamento de enormes quantidades de dados. Porém, requer cuidado no que diz respeito à performance. Conforme Barbieri (2001, p.174), “As tabelas básicas e os agregados (visões ou cubos) são armazenadas nesse formato. [...]”; MOLAP (Multidimensional On Line Analytical Processing): que significa Processamento Analítico Multidimensional On Line, é onde são utilizados gerenciadores de banco de dados com detalhes distintos e tratamento dimensional de dados, o que, teoricamente, representaria melhor desempenho. Permitem ao usuário o trabalho, a montagem e a manipulação direta dos dados do cubo no servidor (FELBER. 2005, p.38). Porém é necessário cuidados com sua limitação na capacidade de armazenamento, atualização e mapeamento; HOLAP (Hybrid On Line Analytical Processing): significa Processamento Analítico Híbrido On Line, e nada mais é que a combinação do uso das duas abordagens anteriores. Esse uso misto permite o aproveitamento da maior performance do MOLAP, pelo foco dado ao tipo de aplicação, e da maior escalabilidade do ROLAP, ou seja, ampliação da capacidade armazenamento sem perda de funcionalidades. Isso ocorre pelos motivos apresentados por Barbieri (2001, p.175) que diz que a estrutura relacional é utilizado para os dados de grande 46 granularidade geralmente, enquanto que as dimensional nativa armazena os agregados, com menor granularidade; DOLAP (Desktop On Line Analytical Processing): ou Processamento Analítico On Line na Estação Cliente. Ocorre quando se transfere as estruturas do Data Warehouse / Data Mart, ou seja, o cubo de informações, para a estação cliente. Isso causa menos tráfego na rede e melhora a performance das análises, pois o processamento ocorre na máquina do cliente, agilizando o processo e não causando sobrecarregando o servidor. Porém, conforme Felber (2005, p.40), “a desvantagem é que o tamanho do cubo de dados não pode ser muito grande, caso contrário, a análise passa a ser demorada e/ou a máquina do cliente pode não suportar em função de sua configuração [...]”. 3.4 Data Mining Data Mining significa Mineração de Dados. Mesmo não sendo obrigatório sua existência no Business Intelligence, é uma proposta de tratamento de dados e informações. [...] Os conceitos de garimpagem de dados (Data Mining) estão relacionados com a nova tendência (para aplicações comerciais) de se buscar correlações escondidas em altos volumes de dados, nem sempre evidentes, principalmente no tratamento cotidiano dos sistemas de informações. (BARBIERI. 2001, p.178) Ainda segundo Barbieri (2001, p.178) o conceito de mineração de dados surgiu com o propósito de melhorar a utilização desses arsenais de informação, visto que geralmente seus projetos são de alto custo. Para isso, o Data Mining procura identificar padrões e relacionamentos entre dados espalhados pelo cenário abordado pelo Data Warehouse / Data Mart, levantando informações que não são muito evidentes. Porém, a despeito dos benefícios que essa ferramenta pode vir a trazer, Barbieri (2001, p.178) informa a possibilidade de a 47 abordagem vir a levantar relacionamentos inúteis, ou em uma quantidade tão grande que venha a impedir a análise delas, e, portanto, é importante o uso de algoritmos inteligentes, que selecionem padrões relevantes. O processo de Mining tem certas diferenças com relação ao que vimos até agora, nos capítulos anteriores. Enquanto as técnicas OLAP objetivam trabalhar os dados existentes, buscando consolidações em vários níveis, trabalhando fatos em dimensões variadas, a técnica de Mining busca algo mais que a interpretação dos dados existentes. Visa fundamentalmente realizar inferências, tentando com que “adivinhar” possíveis fatos e correlações não explicitadas nas montanhas de dados de um DW/DM. (BARBIERI. 2001, p.178) Além disso, o Data Mining procura definir situações de causa. Para exemplificar, poder-se-ia considerar que, enquanto o Processamento Analítico On Line (OLAP), em certa situação, procuraria respostas do tipo: “Qual é o total de vendas do produto Y, na região X, em determinado período?”, o Data Mining procuraria levantar as informações relativas aos padrões de comportamento, ou seja, o motivo que levariam os clientes a comprar em determinado lugar, ou em outro. Dessa forma, é possível identificar as diferenças entre o Data Mart e o Processamento Analítico On Line. Barbieri (2001, p.179) ainda define três espaços de conhecimentos: [...] O espaço de dados, relacionado com os Bancos de Dados; o espaço de informação analítica, relacionado aos Data Warehouses e Data Marts; e os espaços de influência e de variação, que estão relacionados com as aplicações de Data Mining, onde a influência de uma variável sobre outras e as variações provocadas por sua influência estão entre os objetivos mais importantes. Para que um projeto de Data Mining seja bem sucedido, é importante que seja considerados a vários fatores relativos aos objetivos, metas, estratégias, modelo de negócios, entre outros aspectos que venham existir na organização. Além disso, também é importante saber detalhar o problema, identificar pontualmente o que se espera do Data Mining, ter 48 conhecimento de que tem altos custos, é necessário ter uma equipe muito bem preparada, enfim, entender que um projeto desse tipo possui uma série de desafios que nem todas as organizações estão preparadas para enfrentar. 3.4.1 Etapas do Projeto de Data Mining Um projeto de Data Mining possui etapas. Segundo Barbieri (2001, p.181), essas etapas são: Preparação, Mineração, Análise e Aplicação. Preparação: essa fase depende do algoritmo escolhido, pois é por eles que esses dados serão formatados. Barbieri (2001, p.183) diz que “este processo pode envolver desde a limpeza dos dados, incluindo-se aí campos omissos ou dados muito fora do normal (os outliers) até a junção de variáveis ou linhas, combinação de campos e transformação de variáveis [...]”; Mineração: Barbieri (2001, p.183-184) diz que nessa fase é necessário estabelecer os modelos de Data Mining, seguido da definição de amostras. Logo após, deve-se treinar o modelo, selecionado dados. A formatação utilizada pelas ferramentas devem ser definidas e criar os previsores do negócio; Análise: conforme informa Barbieri (2001, p.184-187) essa fase conta com algumas técnicas: Associação, Padrões seqüenciais, Classificação e Agregação, além delas poderem ser usados de forma integrada. Associação é aquela que verifica a afinidade entre registros de determinados fatos, ou seja, a influência de um fato sobre outro como, por exemplo, “qual é o percentual de vendas do produto A junto com o produto B?”; Os Padrões seqüenciais procuram identificar como um fato implica em um outro fato de um outro momento. Um exemplo seria uma constatação de uma agência financeira que 49 quando uma ação C cresce 5%, uma outra ação D, depois de alguns dias, cai aproximadamente 2%, em seu valor; Na Classificação, por sua vez, ocorrem agrupamentos por classes, de acordo com formas estabelecidas previamente, e para isso se pode utilizar de várias abordagens, como redes neurais, árvores de decisão, entre outras. Para exemplificar, poder-se-ia considerar um sistema de crédito que classifica os clientes entre aprovados e não aprovados; Já na Agregação também existem agrupamentos, porém sem prévia classificação. Nenhuma classe é conhecida e os dados são agrupados por similaridades. Um exemplo seria alguma análise de defeitos; Aplicação: assim que o modelo for testado e aprovado, ocorre a utilização dos algoritmos que acarretarão na execução da aplicação em situações reais. 3.4.2 Uso da Estatística no Data Mining Como pode-se perceber, o emprego de técnicas estatísticas nas etapas do projeto do Data Mining tem grande influência. Existem várias técnicas estatísticas utilizadas, dentre as quais, as principais são as que seguem abaixo: Árvores de Descisão: Barbieri (2001, p.190) diz que “é uma técnica que, a partir de uma massa de dados, cria e organiza regras de classificação e decisão em formato de diagrama de árvores, que irão classificar suas observações ou predizer resultados futuros [...]”. Ela pode ser criada para a classificação precisa de casos existentes ou novos. Existe um único grupo de caso de estudo, inicialmente. Este grupo vai criando ramificações que contém casos de estudo categorizados, que, em seguida se abrem em nódulos de subgrupos exclusivos. Galhos ou nódulos demonstram, proporcionalmente, a resposta do estudo. A figura 7 pode ilustrar o formato lógico de uma árvore de decisão. 50 Figura 7 - um exemplo de formato lógico de uma Árvore de Decisão Fonte – Elaborado pelos autores. Existem variadas formas de empregar a Árvore de Decisão. Algumas dessas formas são: Segmentação: onde ocorre agrupamento por base na identificação de características comuns (BARBIERI. 2001, p.190). Um exemplo poderia ser a divisão de categorias de clientes de acordo com seu perfil de consumo; Estratificação: é quando se determina regras para cada caso em alguma categoria (BARBIERI. 2001, p.190). Para exemplificar, poder-se-ia considerar a classificação de ações da bolsa de acordo com o grupo de risco; Predição: é quando se cria regras para entender ou aplicar casos futuros (BARBIERI. 2001, p.190). Para ilustrar, é possível considerar o exemplo de sintomas que venham a receber determinado diagnostico, e que algum paciente vindo a apresentar esses sintomas, seja encaminhado para os exames daquela doença; Redução de dados: procura efetuar filtros para reduzir a quantidade de variáveis de um processo, identificando as que são mais influentes (BARBIERI. 2001, p.191). Análise de Conglomerados: procura identificar conjuntos de grupos dentro de um conjunto de dados, e depois agrupa-los de acordo com similaridades entre si 51 (BARBIERI.2001, p.196). Os métodos de formação de conglomerados podem ser do tipo Hierárquico e do tipo Não-Hierárquico. As técnicas do tipo Hierárquico são classificadas como Aglomerativas e Divisivas. Barbieri (2001, p.196) diz que “dada uma amostra de n elementos, as técnicas aglomerativas iniciam-se com n conglomerados de tamanho 1 cada, e a cada estágio estes vão sendo agrupados e vão formando novos conglomerados[...]”. Nessa técnica, uma vez unidos os elementos, eles não mais se separam. Porém,conforme informa Barbieri(2001, p.196), “as Divisivas, como o nome diz, são o contrário. Partem de um único conglomerado de tamanho n e, a cada estágio do processo, este conglomerado inicial vai se subdividindo em novos grupos”. Podemos exemplificar o uso da Análise de Conglomerados considerando uma empresa que classifica seus clientes como Especiais e Padrões. Isso considerando seus hábitos e comportamentos, entre outras variáveis. Redes Neurais: é uma tecnologia de uso crescente no ambiente o Data Mining, pois possui a vantagem de aprender com suas experiências, possuindo, assim, menores limitações (BARBIERI. 2001, p.199). Elas possuem algoritmos que pretendem imitar funcionalidades do cérebro, utilizando-se de nódulos que imitam neurônios. Conforme Barbieri (2001, p.199), apesar de não ser uma técnica estatística, esse recurso permite o emprego de estatística em modelos não-lineares. Barbieri (2001, p.199-200), explica como se constituem as redes neurais: 52 [...] Os nódulos são conectados como uma rede e funcionam paralelamente. A primeira fase de nódulos é composta pelos nódulos de entrada. Eles recebem o input das variáveis fornecidas pelo Banco de Dados, transformam-no de acordo com uma função (chamada função de ativação), produzindo uma informação de saída que será enviada à próxima fase de nódulos. Esta, por sua vez, receberá diversas informações dos nódulos de entrada com seu input. Essa fase é formada pelos nódulos ocultos, que, em redes neurais mais complexas, podem formar diversas camadas. Por fim, tem-se os nódulos de saída. Estes processam as informações recebidas e produzem uma resposta, mas não a enviam para outro nódulo, pois esta saída já é o resultado final da rede. Se a rede é de classificação, o nódulo de saída já é a classe final. Para o caso de modelos de previsão, o nódulo de saída já representa um valor preditivo. [...] É importante, antes do uso das redes neurais, efetuar seu treinamento estimulando os valores dos parâmetros das funções de ativação y = f (x,0), de forma que os valores preditos estejam próximos dos valores observados (BARBIERI. 2001, p.200-201). Porém, deve-se ter cuidado com o excesso de treinamentos nas redes neurais, pois isso poderia fazer com que elas viessem a representar erros aleatórios contidos no modelo. Nesse caso é só instituir limites de tolerância a erros no modelo. Para exemplificar um uso de redes neurais, pode-se considerar a análise de crédito dos clientes de uma operadora de crédito. Como existem muitas variáveis a serem consideradas nesse cenário, o uso de redes neurais é importantíssimo para identificar usos fraudulentos de cartão de crédito. Análise de regressão: é uma técnica de fácil execução e interpretação, o que a torna uma das mais usadas. É uma técnica que procura criar equações dos relacionamentos. [...] A Análise de Regressão processa as informações de umas base de dados de maneira a determinar um modelo (uma equação) que represente o relacionamento existente entre as variáveis em estudo. Os principais objetivos da análise de regressão são: sumarização dos dados, predição, controle e estimação. Uma só análise pode atender a mais de um objeto ao mesmo tempo. (BARBIERI. 2001, p.204) Existem dois tipos mais comuns de análise de regressão, a Regressão Linear Simples e a Regressão Linear Múltipla. A Regressão Linear Simples possui apenas duas variáveis, uma 53 de resposta (dependente) e a variável explicativa (independente). Já na Regressão Linear Múltipla ocorre a variável resposta, porém ocorre mais de uma explicativa (BARBIERI. 2001, p.205). Para exemplificar a utilização da Análise de Regressão, é possível considerar a premiação de vendedores, onde impactam vários aspectos como novos clientes conquistados, clientes mantidos, etc., onde a Análise de Regressão poderia sumarizar as informações de modo a se poder elencar os vendedores do melhor ao pior. Séries Temporais: segundo Barbieri (2001, p.208), “é uma técnica estatística utilizada principalmente no cálculo de previsão de um conjunto de observações, dados seus valores ao longo do tempo [...]”. Essa análise permite considerar sazonalidades nos períodos, necessitando de armazenamento informações relativas a estes períodos ao longo de um espaço temporal não curto. Ela pode ser parametrizada por outros parâmetros físicos, além do tempo, que é o mais comum. Uma utilidade para a série poderia ser a previsão de vendas para um período futuro de uma indústria de chocolates. É importante levar em conta os períodos sazonais de vendas, como época da Páscoa. 54 CAPÍTULO 4 – ESTUDO DE CASO Nesse capítulo será efetuado um estudo sobre uma ferramenta real de Business Intelligence para exemplificação prática do que foi estudado. Para tanto, será utilizado uma ferramenta da Ariacom Business Reports, o Report Manager, como já falado no capítulo 2, que para testes é uma ferramenta gratuita, fazendo uso do caso exemplo Northwind. A figura 8 mostra a interface da ferramenta. Figura 8 – A interface principal da ferramenta da Ariacom Business Reports Fonte – Elaborado pelos autores. Percebe-se que existem dois grupos na figura 8, o caso Northwind e o BR Audit. O Northwind é um caso de estudo, como uma empresa global, contendo várias formas de relatórios como o de produtos, entre outros, com a possibilidade de criar outros, através do uso pessoal (personal). Já o BR Audit permite efetuar uma auditoria de uso do sistema, ou seja, ele permite consultar quem utilizou pela última vez, quando determinado usuário fez 55 uso, quantidade e constância de utilização por usuário, sucessos de acesso ao software, etc., em diversas granularidades. O foco será dado na utilização da ferramenta para a tomada de decisão sobre negócios e, para tanto, será utilizado o caso Northwind. Sobre os diversos meios de relatórios, formas de apresentação, sumarização e detalhamento da informação para o tomador de decisão é que será abordado. 4.1 O que a ferramenta oferece na prática De uma ferramenta de Business Intelligence se espera diversas formas de relatos de informações. Como já citado anteriormente, das várias formas existentes, os mais utilizados são gráficos, textuais ou explicativos e planilhas. As figura 9, 10 e 11, concomitantemente, podem ilustrar essas formas. Figura 9 – Relatório por meio de gráficos Fonte – Elaborado pelos autores. 56 É possível perceber que a figura 8 se refere às vendas de alguns tipos de produtos no ano de 1994. Ela relata a quantidade vendida de cada categoria (coluna verde), utilizando-se dos valores gráficos posicionados no lado direito, e o montante em valor e em formato percentual de contribuição em relação ao todo (coluna vermelha), utilizando-se dos valores posicionados à esquerda e o valor percentual estando acima da coluna. Por exemplo, para a categoria Beverages (bebidas), a coluna de verde informa que para o ano de 1994 foram vendidos 1500 itens, e a coluna vermelha informa que o montante em valor é $ 45.000,00, o que corresponde a 34,38% do total dos itens pesquisados para o ano. Figura 10 – Relatórios de dados informativos Fonte – Elaborado pelos autores. A figura 10, especificamente no quadro tracejado, exemplifica o uso de texto informativo sobre um fornecedor. No exemplo, pode-se observar que se trata das informações de contato e endereço da empresa Refrescos Americanas Ltda. 57 Figura 11 – Exemplo de Planilha Fonte – Elaborado pelos autores. A figura 11 exemplifica o uso de planilhas. Nesse caso, refere-se à categoria de Beverages (bebidas), onde aparecem o identificador do produto, o nome, o preço unitário e o fornecedor. A ferramenta Report Manager também possui funcionalidades como o Processamento Analítico On Line. Um exemplo é o caso do drill-down e drill-up nela presentes, que no caso a ferramenta oferece como padrão para a granularidade tempo a posição por ano, trimestre e mês. As figuras 12, 13 e 14 exemplificam o exposto. 58 Acesso ao drill-down Figura 12 – Exemplo de uso do Drill-down, com a granularidade tempo Ano. Fonte – Elaborado pelos autores. A figura 12 mostra as vendas de produtos no ano de 1995. O ano é o primeiro nível que a ferramenta permite para a exploração por meio do drill-down da granularidade Tempo. Para verificar os outros níveis, como o da figura 13, é só clicar sobre o ícone em forma de triângulo com a ponta para baixo, conforme indicado pela seta. Acessos ao Drill-down e ao Drill-up Figura 13 – Uso do Drill-down, com a granularidade tempo partindo de Ano para trimestre. Fonte – Elaborado pelos autores. 59 A figura 13 exemplifica o caso do detalhamento da informação do ano de 1995 em trimestres, no caso, o primeiro, como é possível verificar ao lado dos ícones de acesso Drilldown e Drill-up. Esses ícones funcionam da seguinte maneira: quando clica-se sobre o ícone com a ponta direcionada para baixo, acessa-se a função Drill-down, detalhando ainda mais o período, partindo de trimestre e indo para o nível de granularidade mês daquele trimestre, conforme a figura 14; quando clica-se sobre o ícone com a ponta direcionada para cima, efetua-se a operação inversa, o Drill-up, voltando-se para o nível de granularidade ano. Acesso Drill-up Figura 14 – Uso do Drill-down, com a granularidade tempo trimestre para mês. Fonte – Elaborado pelos autores. Na figura 14 ocorre um detalhamento maior ainda relativo ao período de vendas dos produtos, partindo de trimestre para mês. Pode-se verificar também que aparece apenas o 60 ícone de Drill-up, o que significa que não é possível descer a menores níveis de granularidade tempo como semana ou dia. Não só os níveis de granularidade da Dimensão tempo são possíveis. Também as granularidades relativas às tabelas Dimensão objeto e local são possíveis, conforme exemplifica as figuras 15 e 16. Entrega para o Brasil, pela empresa de navegação United Package Figura 15 – Uso da tabela Dimensão de Espaço e a possibilidade de acessos às granularidades. Fonte – Elaborado pelos autores. A figura 15 exemplifica o uso da tabela Dimensão espaço. Nesse exemplo, a planilha mostra a quantidade de dias previstos de demora para uma a embarcação de algumas empresas de navegação chegar aos países destinos. No caso indicado, Brasil, a demora é de 8,6 dias aproximadamente. O nível mais alto é o de País, no caso indicado o Brasil, porém é permitido acessar outros níveis de granularidade, como Estado e cidade, como ilustrado na figura 16. 61 Figura 16 – Uso da tabela Dimensão de Espaço no nível de granularidades Cidade. Fonte – Elaborado pelos autores. No exemplo da figura 16 é possível verificar o nível de granularidade da tabela Dimensão Espaço chegar até cidade, como São Paulo, Campinas e Rio de Janeiro, e seus tempos de entregas pelas empresas de navegação. É possível acessar o nível de granularidade Estado também. Além de funcionalidades como o Drill-down e Drill-up para os vários graus de granularidades, a ferramenta permite consultas customizadas. A figura 17 mostra uma das possibilidades de consulta customizada, a Free SQL reports, para efetuar relatórios dinâmicos SQL (Strutured Query Language). 62 Figura 17 – Uma tela do Free SQL reports Fonte – Elaborado pelos autores. Essa tela, a Products search (samples of prompted restriction), possibilita efetuar vários tipos de consultas sobre produtos. Por exemplo, no primeiro quadrante, o de Product Name Contains, permite efetuar consulta de produtos colocando-se todo ou parte do nome do produto, efetuando o tipo de consulta like no SQL. Além das consultas customizadas existe também algumas facilidades para relatórios que a ferramenta possibilita, como os do menu Published.Ele permite, não só a listagem de produtos com todas as informações importantes (como as de fornecedores) , mas também a emissão do relatório de produtos em vários tipos de formatos: HTML, PDF, DOC, etc. A figura 18 mostra onde se encontra o menu e as opções de formato. 63 Menu de acesso Published Figura 18 – O acesso ao menu Published e suas opções de formatos para listagem de produtos. Fonte – Elaborado pelos autores. O menu Published, na indicação, permite várias formas de consulta de produtos, conforme indicam as opções selecionadas. Ele é um exemplo das possibilidades de levantamentos para relatórios que a ferramenta dispõe. A ferramenta Report Manager possui outras funcionalidades, porém essas são as principais. Como é possível perceber, a apresentação para utilização dela pelo gestor foi o objetivo desse capítulo. 64 CONCLUSÃO Pode-se observar que realmente o Business intelligence propõe e pode ajudar de modo considerável o que concerne à tomada de decisão. Como ele baseia as informações que disponibiliza principalmente nos dados históricos da organização, as informações se tornam diretamente voltadas ao modelo de negócios dela. A possibilidade que essa metodologia e solução oferece de verificar em diversas granularidades as informações de suas unidades de negócio, produtos, etc., torna-se uma arma poderosa para que a organização possa vir a galgar mais espaço dentro do cenário competitivo no qual se insere. É a ferramenta que mais se adequou ás necessidades relativas à decisão, principalmente a camada estratégica da organização, porque os relatórios que ela vem a disponibilizar são fáceis de verificar e entender e realmente voltados para essa necessidade específica. Isso somado ao fato de ser comum às ferramentas de Business Intelligence possuírem interfaces relativamente amigáveis, como foi possível verificar com o uso da ferramenta estudada, o Report Manager. Especificamente, diante do exposto sobre essa ferramenta é possível a considera uma boa ferramenta, mesmo que seja para determinados tipos de modelos de negócio. Ela permite as funcionalidades importantes do Business Intelligence, como o uso das funções OLAP, o Drill-Down e o Drill-Up, consultas dinâmicas e auditoria de uso da ferramenta por máquina e usuário, mesmo não possuindo as tecnologias do Data Mining, que como já informado não é obrigatório nos projetos de BI, é uma ferramenta simples de utilizar e de fácil aprendizagem, principalmente por parte dos gestores. Porém, quando é falado que determinadas necessidades de algumas organizações poderem vir a não serem satisfeitas, ao menos plenamente, pela ferramenta é devido ao fato de ela não ter pré-definido alguns graus de granularidade como, por exemplo, a granularidade 65 Dia, na tabela Dimensão Tempo, onde o mínimo permitido é mês. Caso a organização tenha a necessidade de tomar decisões diárias sobre seus produtos, entre outras, será necessário que ela efetue consultas SQL mais avançadas, efetuando operações matemáticas, o que descaracterizaria a simplicidade da ferramenta. Mesmo assim, esta é uma ferramenta interessante, principalmente e de forma especial, aqueles que querem ter o primeiro contato com esse tipo de solução, pois ela é viável para utilização. 66 REFERÊNCIAS BARBIERI, Carlos. BI - Business Intelligence – Modelagem e Tecnologia. Rio de Janeiro: Editora Axcel Books, 2001. BATISTA, Emerson de O.. Sistema de Informação: o uso consciente da tecnologia para o gerenciamento. 3ª ed., São Paulo: Editora Saraiva, 2004. BORGES, André. Business Intelligence no DNA. ComputerWorld. São Paulo, ano 12, 30ª ed., p.14, 2005. CRIVELINI, Wagner. Mitos e verdades sobre modelagem multidimensional. SQL Magazine. Rio de Janeiro, ano 3, 39ª ed., p.6-14, 2006. FELBER, Edimilson J. W.. Proposta de uma Ferramenta OLAP em um Data Mart Comercial: uma aplicação prática na indústria calçadista. 2005. 60 f. Grau: Trabalho de Conclusão de Curso (Graduação em Ciências da Computação) - Instituto de Ciências Exatas e Tecnológicas, Centro Universitário Feevale, Novo Hamburgo, 2005. ITALIANO, Isabel Cristina; ESTEVES, Luiz Antonio. Modelagem de Data Warehouses e Data Marts: parte 2. SQL Magazine. Rio de Janeiro, ano 2, 14ª ed., p.37-43, 2005. ITALIANO, Isabel Cristina; ESTEVES, Luiz Antonio. Modelagem de Data Warehouses e Data Marts: parte 3. SQL Magazine. Rio de Janeiro, ano 2, 16ª ed., p.59-66, 2005. MYLIUS, Marcos. Business Intelligence: mais fácil do que você imagina. São Paulo: Edições Inteligentes Editora, 2003. O’BRIEN, James A.. Sistemas de Informação: e as decisões gerenciais na era da internet. 2ª ed., São Paulo: Editora Saraiva, 2004. REZENDE, Denis Alcides; ABREU, Aline França de. Tecnologia da Informação – Aplicada a sistemas de informação empresariais. 3ª ed., São Paulo: Editora Atlas S.A., 2003. RIBEIRO, Jeferson; et al. O impacto na utilização de inteligência de negócios no ambiente empresarial. In: Congresso Brasileiro Gestão e Desenvolvimento de Produtos, IV, 2003, Gramado. Resumos... Gramado, 2003. p.1-7. VALLE, Rogério, et al. Que ferramenta devo usar? Rio de Janeiro: Qualitymark Editora Ltda, 2005. This document was created with Win2PDF available at http://www.win2pdf.com. The unregistered version of Win2PDF is for evaluation or non-commercial use only. This page will not be added after purchasing Win2PDF.