J. Correia Lopes

FEUP/DEI & INESC TEC

User Tools

Site Tools


students:201607cteixeira

Table of Contents

Catarina Teixeira

Master in Electrical and Computers Engineering
Implementation of a data virtualization layer applied to insurance data
Catarina Raquel da Silva Teixeira


Abstract

Organizations find in their information their most valuable resource. As information management grows in volume and complexity every year, companies struggle to gain competitive advantage in their markets and industries. The Financial Services Industry is not an exception: the continuous pressure from customers and markets makes this industry urging for innovation and improvements on its data governance models. Data Virtualization appears as an answer to this problems, by creating a logical, simplified, consolidated and federated view of data, being able to obtain data from diverse sources without requiring additional copies and simplifying the access to information for any front-end solution to use it.

The main goals of the project described in this document were to investigate the concept of Data Virtualization and the solutions available on the market, and to build a prototype which was able to demonstrate the Data Virtualization concept by integrating multiple data sources (from different types and locations), providing data consumers with an integrated and unified view of data, hiding the data sources. An analysis of the different types of Data Virtualization implementation is also done and a set of key aspects that need to be taken in consideration during this implementation is also presented.

The prototype’s implementation was made by creating a Data Virtualization layer using Red Hat JBoss Data Virtualization platform to integrate three different data sources and using QlikView as a data consumer. After its implementation it was possible to demonstrate some practical cases and demonstrate the on-demand capabilities of the Data Virtualization layer, which always guarantees an up-to-date version of data. Taking into account the obtained results, one can say that the goals were fulfilled.

Resumo

O recurso mais valioso de uma organização é a sua informação. A complexidade e o volume dos sistemas de gestão informacional tem vindo a aumentar com o passar do tempo e as organizações lutam para manter a vantagem competitiva dentro dos seus mercados e indústrias. A Indústria de Serviços Financeiros não é exceção: a pressão contínua que sofre por parte do mercado e dos clientes faz com que, cada vez mais, seja necessária inovação e melhorias ao nível dos modelos de governação de dados. A Virtualização de Dados (Data Virtualization) surge como uma resposta para esses problemas ao criar vistas de dados simplificadas, lógicas, consolidadas e federadas, sendo capaz de obter dados de fontes diversas sem necessitar de cópias adicionais e simplificando o acesso à informação por parte de qualquer solução de consumo de dados.

Os principais objetivos o projeto descrito neste documento passam pela investigação do conceito de Data Virtualization e as soluções existentes no mercado, e pelo desenvolvimento de um protótipo capaz de demonstrar o conceito de Data Virtualization ao integrar diferentes fontes de dados (com diferentes formatos e localizações), providenciando aos consumidores de informação uma vista unificada e integrada dos dados, escondendo a sua origem. É ainda feita uma análise dos diferentes tipos de implementação de Data Virtualization e apresentado um conjunto de aspetos chave que devem ser tidos em conta aquando da implementação de uma solução de Data Virtualization.

A implementação do protótipo foi feita criando uma camada de Data Virtualization através do uso da plataforma JBoss Data Virtualization da Red Hat para integrar três fontes de dados heterogéneas e usando o QlikView como consumidor de informação. Após a implementação foi possível demonstrar alguns casos práticos e demonstrar a capacidade da camada de virtualização de entregar os dados a pedido, garantindo uma versão sempre atualizada dos dados. Tendo em conta os resultados obtidos, é possível dizer-se que os objetivos foram cumpridos.

Jury

  • Chair: Mário Jorge Rodrigues De Sousa
  • External Examiner: Maria Benedita Malheiro
  • Supervisor: João Correia Lopes
  • Date: 6/10/2016
students/201607cteixeira.txt · Last modified: 01/03/2017 20:49 (external edit)