Conceito do Data WareHouse
Um data warehouse (ou armazém de dados, ou depósito de dados no Brasil) é um sistema de computação utilizado para armazenar informações relativas às atividades de uma organização em bancos de dados, de forma consolidada. O desenho da base de dados favorece os relatórios, a análise de grandes volumes de dados e a obtenção de informações estratégicas que podem facilitar a tomada de decisão.
O data warehouse possibilita a análise de grandes volumes de dados, coletados dos sistemas transacionais (OLTP). São as chamadas séries históricas que possibilitam uma melhor análise de eventos passados, oferecendo suporte às tomadas de decisões presentes e a previsão de eventos futuros. Por definição, os dados em um data warehouse não são voláteis, ou seja, eles não mudam, salvo quando é necessário fazer correções de dados previamente carregados. Os dados estão disponíveis somente para leitura e não podem ser alterados.
A ferramenta mais popular para exploração de um data warehouse é a Online Analytical Processing OLAP ou Processo Analítico em Tempo Real, mas muitas outras podem ser usadas.
Os data warehouse surgiram como conceito acadêmico na década de 80. Com o amadurecimento dos sistemas de informação empresariais, as necessidades de análise dos dados cresceram paralelamente. Os sistemas OLTP não conseguiam cumprir a tarefa de análise com a simples geração de relatórios. Nesse contexto, a implementação do data warehouse passou a se tornar realidade nas grandes corporações. O mercado de ferramentas de data warehouse, que faz parte do mercado de Business Intelligence, cresceu então, e ferramentas melhores e mais sofisticadas foram desenvolvidas para apoiar a estrutura do data warehouse e sua utilização.
Atualmente, por sua capacidade de sumarizar a analisar grandes volumes de dados,o data warehouse é o núcleo dos sistemas de informações gerenciais e apoio à decisão (AULA 1) das principais soluções de business intelligence do mercado.
Metadado
O conceito Metadado é considerado como sendo os "dados sobre dados", isto é, os dados sobre os sistemas que operam com estes dados. Um repositório de metadados é uma ferramenta essencial para o gerenciamento de um Data Warehouse no momento de converter dados em informações para o negócio. Entre outras coisas, um repositório de metadados bem construído deve conter informações sobre a origem dos dados, regras de transformação, nomes e alias, formatos de dados, etc. Ou seja, esse "dicionário" deve conter muito mais do que as descrições de colunas e tabelas: deve conter informações que adicionem valor aos dados.
Tipo de Informação considerada Metadado
Os metadados são utilizados normalmente como um dicionário de informações e, sendo assim, devem incluir:
ORIGEM DOS DADOS, FLUXO DE DADOS, FORMATO DOS DADOS , NOMES E ALIAS , DEFINIÇÕES DE NEGÓCIO, REGRAS DE TRANSFORMAÇÃO, ATUALIZAÇÃO DE DADOS, REQUISITOS DE TESTE , INDICADORES DE QUALIDADE DE DADOS , TRIGGERS AUTOMÁTICOS, RESPONSABILIDADE SOBRE INFORMAÇÕES, ACESSO E SEGURANÇA
Extração de Dados
Os dados introduzidos num Data Warehouse geralmente passam por uma área conhecida como área de stage. O stage de dados ocorre quando existem processos periódicos de leitura de dados de fontes como sistemas OLTP. Os dados podem passar então por um processo de qualidade, denormalização e gravação dos dados no Data Warehouse. Esse processo geralmente é realizado por ferramentas ETL.
Ferramentas
- OLTP
- Data mining
(fonte Wikipédia)
Link para consulta: http://pt.wikipedia.org/wiki/Data_Warehouse
Conclusão
--------------
O Data warehouse é um sistema que utiliza a armazenagem da informações relativas às atividades do negócio organização em bancos de dados, de forma consolidada e eficiente. A estrutura do banco de dados permite que os relatórios e as análises de grandes volumes de dados sejam obitidas informações estratégicas que podem ajudar nas tomadas de decisões.
segunda-feira, 18 de junho de 2007
Assinar:
Postar comentários (Atom)
Nenhum comentário:
Postar um comentário