J. Correia Lopes

FEUP/DEI & INESC TEC

User Tools

Site Tools


students:201107l-rocha

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

students:201107l-rocha [12/10/2012 19:00] (current)
Line 1: Line 1:
 +====== L. Rocha ======
 +
 +**[[http://​sigarra.up.pt/​feup/​pt/​cur_geral.cur_view?​pv_curso_id=742|Master in Informatics and Computing Engineering]]\\
 +Inferência Situacional em Sistemas Baseados em Informação de Contexto\\
 +Luís Miguel Marques Pereira Rocha**
 +\\
 +---
 +\\
 +
 +===== Abstract =====
 +
 +Since the early 90’s, many entities started to collect data about their users in order to
 +extract new information that might be usefull to improve their business and client relationship.
 +The goal is to provide products and services that take into account the context
 +and preferences of its users at a given moment. Tecnology is evolving in such a way that
 +in a near future anyone may be permanently connected to the information networks. The
 +recent mobile device and wireless networks expansion provided many new possibilites to
 +gather and distribute this kind of data, making it possible to collect a massive number of
 +context data in much less time.
 +
 +PT inovação wants to explore this concept, creating a business model based in Context-asa-
 +Service (CXaaS). In order to do this there is a framework currently under development
 +that allows to specify a collection of libraries to assist the comunication between diferent
 +applications in a context-based system. However, most of the retrived data is not significant
 +enough for the purpose of creating context-oriented services.
 +
 +The main goal of this work included the development of another kind of provider, in which
 +the system could centralize most of the data processing in order to deduce new high-level
 +information from the low-level information that is being collected. In order to accomplish
 +this goal, a studywas done in the area of existent context management systems and
 +different approaches for context representation and inference were analysed. Also, the
 +most common geografic clustering algorithms and location classification methods were
 +studied.
 +
 +The developed component was mostly implemented using available Java technologies and
 +is composed by 4 modules: a central component, a machine learning framework, a rule
 +engine based in Jess and an ORM (Object-Relational Mapping) interface with a MySQL
 +relational database. The system makes it possible to integrate any kind of context information
 +that may be specified in an easy and quick way and also uses a set of defined rules
 +to produce high-level information from the low-level collected data.
 +
 +This system was tested for gathering GNSS (Global Navigation Satellite Systems) information
 +from an Android application and process that data afterwards in order to find
 +which are the most significant locations in the user daily routine. These locations are later
 +classified according to a specified set of categories, as well as in terms of the importance
 +that these places may have to each person.
 +
 +The evaluation done to the system shows that it is possible to implement an incremental
 +clustering approach over the gathered data in order to efficiently identify the most
 +relevant locations in the daily routine of the users. This apprach also grants a system response
 +under a very acceptable time. The classification methods based on Google Places
 +API queries, however, did not show reliable results for the proposed goals.
 +
 +===== Resumo =====
 +
 +Desde o início da década de 90 que diversas entidades começaram a recolher de informação
 +sobre os utilizadores para posteriormente extrair informação relevante que lhes
 +permita melhorar o seu negócio e a sua relação com os seus utilizadores. Começou a ser,
 +assim, possível fornecer produtos e serviços que têm em conta o contexto e preferências
 +dos seus utilizadores a cada momento. As tecnologias estão a evoluir cada vez mais no
 +sentido de, num futuro próximo, qualquer pessoa estar quase permanentemente ligada às
 +redes de informação. A recente expansão dos dispositivos móveis e redes sem fios veio
 +potenciar esta realidade, sendo hoje muito mais fácil recolher uma enorme quantidade de
 +dados sobre o contexto de cada pessoa.
 +
 +A PT Inovação pretende explorar estes conceitos e desenvolver um modelo de negócios
 +baseado em context-as-a-service (CXaaS). Para este efeito, já se encontra a desenvolver
 +uma plataforma que permite definir bibliotecas que facilitam a comunicação entre diversas
 +aplicações de um sistema, nomeadamente o envio da diversa informação que é recolhida
 +sobre os seus utilizadores. No entanto, a informação que chega da maioria destas aplicações
 +não é suficientemente significativa para prestar serviços dirigidos ao contexto em
 +que cada pessoa se encontra.
 +
 +O objectivo do trabalho aqui descrito passou por desenvolver um novo tipo de componente
 +no qual se pudesse centrar o processamento da informação de mais baixo nível que
 +é actualmente recolhida, de forma a inferir nova informação de mais alto nível. Foram estudados
 +alguns sistemas de gestão de contexto existentes e os tipos de abordagem usados
 +na representação e inferência sobre a informação do sistema. Foram também estudadas
 +as principais abordagens de agregação de posições geográficas e métodos de classificação
 +de locais.
 +
 +O componente desenvolvido foi implementado recorrendo a diversas tecnologias baseadas
 +em Java e é constituídos por 4 módulos: um componente central, um módulo de
 +aprendizagem computacional,​ um motor de regras baseado em Jess e uma interface ORM
 +(Object-Relational Mapping) com uma base de dados relacional MySQL. O sistema possibilita
 +ainda uma fácil integração de qualquer tipo de informação de contexto, tanto sobre
 +os tipos actualmente definidos como qualquer outro que possa vir a ser definido no futuro.
 +Possibilita também a inferência de informação de mais alto nível através de um conjunto
 +de regras que podem ser definidas à medida das soluções pretendidas.
 +
 +Durante o período em que decorreu este trabalho, o sistema desenvolvido foi testado de
 +forma a recolher posições GNSS (Global Navigation Satellite Systems) obtidas a partir de
 +uma aplicação desenvolvida para dispositivos com plataforma Android e posteriormente
 +processar esses dados de forma a determinar quais o locais mais frequentes no dia-a-dia
 +de cada utilizador. Estes locais são classificados segundo um conjunto de categorias prédefinidas
 +assim como em termos da importância relativa para o utilizador.
 +
 +As avaliações efectuadas sobre o sistema mostram que uma abordagem de agregação incremental
 +sobre os dados permite ao sistema ir identificando eficientemente os diversos
 +locais à medida que novos dados vão sendo recolhidos. Esta abordagem garante também
 +um bom tempo de resposta por parte do novo componente desenvolvido. Os métodos de
 +classificação baseados na API do Google Places, no entanto, demonstram não ser minimamente
 +fiáveis para os objectivos propostos.
 +
 +===== Jury =====
 +
 +  * Chair: Luís Filipe Pinto de Almeida Teixeira
 +  * External Examiner: Maria Benedita Campos Neves Malheiro
 +  * Supervisor: João Correia Lopes
 +  * Date: 13/7/2011
  
students/201107l-rocha.txt · Last modified: 12/10/2012 19:00 (external edit)