
DATA WAREHOUSE
Data Warehouse (DW) é um tipo de banco de dados adequado à análise de negócios e ao apoio à tomada de decisões gerenciais e estratégicas, visando a melhoria dos negócios da empresa a partir de análises da grande quantidade de informação que fica distribuída pelos seus diferentes sistemas de produção. O projeto e a implementação de um DW requer a utilização de conceitos, técnicas e ferramentas diferentes das utilizadas nos bancos de dados convencionais.
Data Warehouse pode ser definido como um Banco de Dados especializado, o qual integra e gerencia o fluxo de informações a partir dos Bancos de Dados corporativos e fontes de dados externas à empresa. Um Data Warehouse é construído para que tais dados possam ser armazenados e acessados de forma que não sejam limitados por tabelas e linhas estritamente relacionais.
A função do Data Warehouse é tornar as informações corporativas acessíveis para o seu entendimento, gerenciamento e uso. Como o Data Warehouse está separado dos Bancos de Dados operacionais, as consultas dos usuários não impactam nestes sistemas, que ficam resguardados de alterações indevidas ou perdas de dados. O Data Warehouse não é como um software, que pode ser comprado e instalado em todos os computadores da empresa em algumas horas. Na realidade, sua implantação exige a integração de vários produtos e processos.
Um Data Warehouse oferece os fundamentos e os recursos necessários para um Sistema de Apoio a Decisão eficiente, fornecendo dados integrados e históricos que servem desde a alta direção, que necessita de informações mais resumidas, até as gerências de baixo nível, onde os dados detalhados ajudam a observar aspectos mais táticos da empresa. Nele, os executivos podem obter de modo imediato respostas para perguntas que, normalmente, não possuem respostas em seus sistemas operacionais e, com isso, não tomar decisões com base não com intuições ou especulações, mas em fatos.
O conceito de Data Warehouse surgiu da necessidade de integrar dados corporativos espalhados em diferentes sistemas de informação, para torná-los acessíveis a todos os usuários que precisam desses dados para tomar algum tipo de decisão.
Normalmente, os sistemas transacionais suportam as operações básicas do cotidiano dos seus usuários. O SGA (Sistema de Gestão Acadêmica da PUC Minas) é um sistema transacional, pois, professores, funcionários e alunos utilizam tal sistema para acompanhar e controlar o cotidiano acadêmico dos cursos da Universidade. Entretanto, os dados relevantes abrangem geralmente apenas a situação atual do semestre letivo corrente. Em relação aos semestres anteriores, o SGA só contém dados do último momento do semestre.
No ambiente de Data Warehouse, os dados consistem de um retrato no tempo (snapshot) e podem abranger longos períodos, sendo atualizados periodicamente e não em tempo real. Toda estrutura de dados do Data Warehouse tem um elemento de tempo como referência, tais como: dia, mês, semestre, ano, quase sempre concatenado com a identificação do dado.
O Data Warehouse tem como objetivo suportar o processamento analítico on-line (OLAP), ou seja, ele é estruturado por assunto ou tema para responder algumas questões, como por exemplo: qual foi o total de evasão de uma turma de um determinado curso em um período de tempo e quais foram os professores que trabalharam com esta turma. Já os sistemas transacionais são orientados por transações (OLTP - processamento de transações on-line), como por exemplo, viabilizar o lançamento de notas, a emissão de boletas, a realização de matrícula do aluno, etc.
Existe uma forte ligação entre esses tipos de sistemas (OLAP e OLTP), pois a geração dos dados do Data Warehouse ocorre a partir dos dados dos sistemas transacionais. Para o sucesso da implementação do Data Warehouse é muito importante construir também um catálogo com a descrição dos dados que participam do novo ambiente. Os dados que compõem este catálogo são chamados de metadados, ou seja, dados acerca dos dados. Alguns autores afirmam que o metadado é o DNA da informação.
Separar o Data Warehouse do ambiente de sistemas transacionais é muito importante. Isso permite que os usuários que precisam tomar decisões utilizem, explorem e analisem os dados do Data Warehouse sem impactar o desempenho dos sistemas transacionais.
A estrutura do Data Warehouse abrange diferentes níveis de agrupamento, consolidação e detalhes, tais como: dados correntes e históricos, com baixo ou alto nível de agrupamento, consolidação.
Com isso, pode-se concluir que o Data Warehouse é uma solução tecnológica que envolve uma coleção de dados organizados por assunto, que estão integrados, não são voláteis (não sofrem exclusões), são históricos e cujo propósito primordial é fornecer suporte à tomada de decisão.