 Conceitos : Data 
  Wharehouse e Data Mining
Conceitos : Data 
  Wharehouse e Data Mining 
Hoje em dia uma 
  organização precisa utilizar toda informação disponível 
  para criar e manter vantagem competitiva. Sai na frente a organização 
  que consegue tomar decisões corretas e rápidas. Com esta importante 
  tarefa nas mãos, profissionais tomadores de decisão tais como 
  executivos, gerentes e analistas, exigem dos sistemas de suporte à decisão 
  (Decision Support Systems - DSS) mais recursos para análise, front-ends que suportem consultas ad hoc, interfaces gráficas apropriadas, 
  etc.
  
  
  A ideia de data warehouse é integrar os dados internos e externos 
  de uma organização em uma estrutura única permitindo uma 
  melhor utilização dos dados pelos analistas, gerentes e executivos. 
  Uma vez obtida a integração, sistemas como OLAP (On-Line Analytical 
  Processing) e data mining fornecem mecanismos sofisticados para análise 
  dos dados.
Estudar e conhecer a tecnologia de data warehouse pode ajudar os empresários a descobrir novas formas de competir em uma economia globalizada, trazendo melhores produtos ou serviços para o mercado, mais rápida do que os concorrentes, sem aumentar o custo do produto ou do serviço.
 
Não existem 
  ainda metodologias formais para implementação de um data warehouse, 
  ela deve ser adaptada às características e às expectativas 
  de cada empresa, mas o principal objetivo em todas elas é o de descobrir 
  maneiras diferentes de atuar no mercado e quais as mudanças internas 
  que devem ocorrer para atender as novas realidades. 
  
  Nas últimas décadas, a tecnologia da informação 
  evoluiu consideravelmente, dos primeiros computadores centrais até os 
  atuais sistemas distribuídos. Essa visão moderna e descentralizada 
  busca obter vantagens, principalmente em termos de acessibilidade, disponibilidade 
  e custo.
Data Warehouse
Segundo W.H.Inmon, 
  considerado um pioneiro no tema, um data warehouse é uma coleção 
  de dados orientada por assuntos, integrada, variante no tempo, que tem por objetivo 
  dar suporte aos processos de tomada de decisão. 
  
  O data warehouse é um banco de dados contendo dados extraídos 
  do ambiente de produção da empresa, que foram selecionados e depurados, 
  tendo sido otimizados para processamento de consulta e não para processamento 
  de transações. Em geral, um data warehouse requer a consolidação 
  de outros recursos de dados além dos armazenados em base de dados relacionais, 
  incluindo informações provenientes de planilhas eletrônicas, 
  documentos textuais, etc. 
  
  De acordo com Richard Hackathorn (outro pioneiro no tema), o objetivo de um 
  data warehouse é fornecer uma "imagem única da realidade 
  do negócio". De uma forma geral, sistemas de data warehouse compreendem 
  um conjunto de programas que extraem dados do ambiente de dados operacionais 
  da empresa, um banco de dados que os mantém, e sistemas que fornecem 
  estes dados aos seus usuários.  
Sistemas de Data 
  Warehouse revitalizam os sistemas da empresa, pois: 
  
  • Permitem que sistemas mais antigos continuem em 
  operação; 
  • Consolidam dados inconsistentes dos sistemas mais antigos em conjuntos 
  coerentes; 
  • Extraem benefícios de novas informações oriundas 
  das operações correntes; 
  • Provém ambiente para o planejamento e arquitetura de novos sistemas 
  de cunho operacional. 
Como se vê, existem diferentes visões do que seria um data warehouse: uma arquitetura, um conjunto de dados semanticamente consistente com o objetivo de atender diferentes necessidades de acesso a dados e extração de relatórios, ou ainda, um processo em constante evolução, que utiliza dados de diversas fontes heterogêneas para dar suporte a consultas ad-hoc, relatórios analíticos e à tomada de decisão.
Extraindo informações do Data Warehouse
Existem várias maneiras de recuperar informações de um data warehouse, as formas de extração mais comuns no mercado hoje são:
 
• Ferramentas 
  de consulta e emissão de relatórios;
  • EIS (Executive Information Systems);
  • Ferramentas OLAP;
  • Ferramentas Data mining.
  
  
  A nova tendência dessas soluções é a integração 
  com o ambiente Web, permitindo maior agilidade em consultas estáticas 
  e dinâmicas.
  
  Neste artigo veremos de forma básica e separadamente os conceitos das 
  tecnologias OLAP e Data mining. A diferença básica entre ferramentas 
  OLAP e data mining está na maneira como a exploração dos 
  dados é abordada. Com ferramentas OLAP a exploração é 
  feita na base da verificação, isto é, o analista conhece 
  a questão, elabora uma hipótese e utiliza a ferramenta para confirmá-la. 
  
  
  Com data mining, a questão é total ou parcialmente desconhecida 
  e a ferramenta é utilizada para a busca de conhecimento.
Ferramentas 
  OLAP
  
  OLAP (On-Line Analytical Processing) representa um conjunto de tecnologias projetadas 
  para suportar análise e consultas ad hoc. Sistemas OLAP ajudam analistas 
  e executivos a sintetizarem informações sobre a empresa, através 
  de comparações, visões personalizadas, análise histórica 
  e projeção de dados em vários cenários de "e 
  se...". Sistemas OLAP são implementados para ambientes multiusuário, 
  arquitetura cliente-servidor e oferece respostas rápidas e consistentes 
  às consultas iterativas executadas pelos analistas, independente do tamanho 
  e complexidade do banco de dados.
  
  A característica principal dos sistemas OLAP é permitir uma visão 
  conceitual multidimensional dos dados de uma empresa. A visão multidimensional 
  é muito mais útil para os analistas do que a tradicional visão 
  tabular utilizada nos sistemas de processamento de transação. 
  Ela é mais natural, fácil e intuitiva, permitindo a visão 
  em diferentes perspectivas dos negócios da empresa e desta maneira tornando 
  o analista um explorador da informação.
Uma arquitetura OLAP possui três componentes principais: um modelo de negócios para análises interativas, implementado numa linguagem gráfica que permita diversas visões e níveis de detalhes dos dados; um motor OLAP para processar consultas multidimensionais contra o dado-alvo; e um mecanismo para armazenar os dados a serem analisados. A base de dados usada define se o pacote é um ROLAP, que interfaceia com um banco de dados relacional de mercado, ou um MOLAP, que se liga a um servidor OLAP, através de um banco de dados multidimensional e dedicado.
Ferramentas 
  Data Mining
  
  Nos primórdios do data warehouse, data mining era visto como um subconjunto 
  das atividades associadas com o warehouse. Mas atualmente os caminhos do warehouse 
  e do mining estão divergindo. Enquanto o warehouse pode ser uma boa fonte 
  de dados para minerar, o data mining foi reconhecido como uma tarefa genuína, 
  e não mais como uma colônia do warehouse.
Apesar de o termo data mining ter se tornado bastante popular nos últimos anos, existe ainda certa confusão quanto à sua definição. Data mining (ou mineração de dados) é o processo de extrair informação válida, previamente desconhecida e de máxima abrangência a partir de grandes bases de dados, usando-as para efetuar decisões cruciais.
 
Data mining vai 
  muito além da simples consulta a um banco de dados, no sentido de que 
  permite aos usuários explorar e inferir informação útil 
  a partir dos dados, descobrindo relacionamentos escondidos no banco de dados. 
  Pode ser considerada uma forma de descobrimento de conhecimento em bancos de 
  dados (KDD - Knowledge Discovery in Databases), área de pesquisa 
  de bastante evidência no momento, envolvendo Inteligência Artificial 
  e Banco de Dados.
  
  Um ambiente de apoio à tomada de decisões, integrando técnicas 
  de data mining sobre um ambiente de data warehousing, possibilita um grande 
  número de aplicações, que já vêm sendo implementadas 
  em diversos segmentos de negócios, como manufatura, automação 
  de pedido de remessas, varejo, gerenciamento de inventários, financeiro, 
  análise de risco, transporte, gerenciamento de frotas, telecomunicação, 
  análise de chamadas, saúde, analise de resultados, markenting, 
  estabelecimento do perfil dos consumidores, seguros, detecção 
  de fraude, dentre outros.
Nota: Este 
  texto é parte de um trabalho realizado para o curso de especialização 
  em Internet e segurança da UFRGS.(demais participantes: Flávio 
  Lúcio Leite Grossmann e Magdiel Linares Gasparini) 
  
  
  
Referências Bibliográficas
  
  - Oliveira, Dr. José Palazzo de, Modelos de Estruturação 
  de Aplicações Distribuídas. UFRGS - Instituto de Informática, 
  2004.
  
  - BISPO, Carlos Alberto F. & CAZARINI, Edson Walmir. Análises sofisticadas 
  com o On-Line Analytical Processing. Developer’s Magazine, São 
  Paulo, n.32, p.28-31, abr de 1999.
- CAMPOS, Maria 
  Luiza & FILHO, Arnaldo V. Rocha. Data warehouse. Obtida via Internet. Ultimo 
  acesso: 23/09/2004. 
  http://genesis.nce.ufrj.br/dataware/tutorial/indice.html. 
- DAL’ALBA, 
  Adriano. Um estudo sobre Data Warehouse. Obtida via internet. Ultimo acesso: 
  23/09/2004. http://www.geocities.com/siliconvalley/port/5072/.
| Veja os 
    Destaques e novidades do SUPER DVD Visual Basic 2013 
(sempre atualizado) : clique e confira ! Quer migrar para o VB .NET ? 
 Quer aprender C# ?? 
 | 
  
      Gostou ?
  Compartilhe no Facebook
Compartilhe no Facebook
  
 Compartilhe no Twitter
 
Compartilhe no Twitter
  
  
Referências: