====== Ficha de Unidade Curricular ====== **Mestrado Integrado em Engenharia Informática e Computação\\ Descrição, Armazenamento e Pesquisa de Informação\\ Ocorrência de: 2014/2015** \\ --- \\ //** [[http://sigarra.up.pt/feup/pt/ucurr_geral.ficha_uc_view?pv_ocorrencia_id=350446|Página oficial]] **// ===== Informação Geral ===== **Curso**: Descrição, Armazenamento e Pesquisa de Informação\\ **Código**: EIC0108/PRODEI003\\ **Curso**: MIEIC, 5º\\ **Ano letivo**: 2014/2015\\ **Semestre**: 1S\\ **ECTS**: 6/7,5\\ **Horas/Semanas**: 1x3TP\\ **Professores**: [[https://sigarra.up.pt/feup/funcionarios_geral.FormView?p_codigo=209566|Cristina Ribeiro]] | [[https://sigarra.up.pt/feup/funcionarios_geral.FormView?p_codigo=230756|João Correia Lopes]] ===== Língua de trabalho ===== //Suitable for English-speaking students// ===== Objetivos ===== 1. ENQUADRAMENTO A unidade curricular "Descrição, Armazenamento e Pesquisa de Informação" tem como contexto a existência de grandes repositórios de informação de natureza muito diversa e os requisitos para a sua organização, descrição, armazenamento e pesquisa. 2. OBJETIVOS ESPECÍFICOS - Sensibilizar os estudantes para os problemas do armazenamento e organização de grandes coleções de dados. - Familiarizar os estudantes com os conceitos principais na pesquisa de documentos textuais e da sua aplicação em ferramentas. - Explorar os métodos e ferramentas para a descrição de recursos na web e para o uso da descrição em aplicações que fazem uso do significado dos dados. ===== Resultados de aprendizagem e competências ===== No final desta unidade curricular o estudante deverá ser capaz de: * Identificar fontes de dados em repositórios de dados, APIs de serviços on-line e registos (logs) de utilizadores; * Decidir sobre a qualidade das fontes de dados e caracterizar um conjunto de dados selecionado; * Escolher a granularidade do documento e um modelo de armazenamento para o conjunto de dados; * Usar as ferramentas de manipulação de dados para selecionar subconjuntos de dados apropriados e para ajustar os dados às suas aplicações pretendidas; * Descrever os modelos usados na recuperação de informação, e em particular na recuperação na web; * Reconhecer as diversas tarefas que são consideradas na recuperação de informação; * Aplicar as medidas de avaliação da recuperação de informação à comparação de ferramentas de pesquisa na web; * Relacionar os documentos na web com a meta-informação que os descreve e relaciona; * Tratar as ontologias como fornecedoras de ferramentas de descrição; * Explorar as aplicações que manipulam descrições de informação na web semântica e criar conjuntos de metadados para um domínio; * Comparar serviços baseados na web semântica e outras abordagens mais simples para a descrição de recursos. ===== Modo de trabalho ===== Presencial ===== Pré-requisitos ===== Conhecimento e prática com linguagens de programação para o desenvolvimento de aplicações. ===== Programa ===== * Introdução às coleções de dados; ferramentas para recolha, preparação e acesso a dados; modelos de dados e armazenamento de coleções. * Pesquisa de informação de base textual; modelos de recuperação; avaliação; recuperação de informação na web. * Descrição de informação: linguagens da Web semântica; RDF, RDF-Schema, OWL; ontologias para dados de um domínio. ===== Bibliografia principal ===== * Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze; //Introduction to Information Retrieval//, Cambridge University Press, 2008. ISBN: 0521865719 [[http://aleph.fe.up.pt/F/-?func=find-b&find_code=SYS&request=000128218|Biblioteca]] * Anders Møller, Michael I. Schwartzbach; //An Introduction to XML and Web Technologies//, Addison Wesley Professional, 2006. ISBN: 0321269667 [[http://aleph.fe.up.pt/F/-?func=find-b&find_code=SYS&request=000074209|Biblioteca]] ===== Métodos de ensino e atividades de aprendizagem ===== Os tempos letivos são usadas para exposição de matéria teórica, com referência à bibliografia relevante, desenvolvimento de exemplos relacionados, discussão de leituras propostas e resolução pelos estudantes de exercícios propostos. ===== Software ===== * Apache Lucene + Solr * Protégé * oXygen XML editor ===== Palavras-chave ===== Ciências Físicas > Ciência de computadores > Informática ===== Tipo de avaliação ===== Avaliação distribuída sem exame final ===== Componentes de Avaliação e Ocupação registadas ===== ^ Descrição ^ Tipo ^ Tempo (horas) ^ Data de Conclusão ^ | Participação presencial (estimativa) | Aulas | 39 | | | Entrega Trabalho 1 | Projetos | 15 | 9/10/2014 | | Entrega Trabalho 2 | Projetos | 30 | 13/11/2014 | | Entrega Trabalho 3 | Projetos | 30 | 05/01/2015 | | Teste 1 | Teste/Exame | 1 | 20/11/2014 | | Teste 2 | Teste/Exame | 1 | n/a | | Estudo | Teste/Exame | 46/84 | n/a | | | Total: | 162/200 | | ===== Obtenção de frequência ===== A unidade curricular tem uma componente de avaliação prática que é o resultado da realização dos trabalhos, a entregar antes das respetivas datas limite fixadas no plano da unidade curricular. Os estudantes têm de obter 50% em cada um dos elementos da avaliação prática. A aprovação na unidade curricular está condicionada à obtenção de classificação superior a 40% em cada um dos mini-testes. Os trabalhadores estudantes e outros estudantes com regime equivalente e dispensados de aulas devem, com periodicidade a combinar com os docentes, apresentar a evolução dos seus trabalhos. Estes estudantes estão obrigados a realizar os mini-testes, as entregas e as apresentações de trabalhos previstas na UC. ===== Fórmula de cálculo da classificação final ===== A classificação final é calculada usando a fórmula: NOTA = 60% Trabalho + 40% Mini-testes. A componente Trabalho é o resultado da avaliação prática e pode ser obtida: * realizando três trabalhos de acordo com os guiões propostos; * propondo um projeto para o semestre e realizando entregas e apresentações de resultados nos mesmos prazos que os dos trabalhos. A opção pelo projeto e o seu plano de trabalho têm de ser acordados com os docentes. ===== Provas e trabalhos especiais ===== Não há provas nem trabalhos especiais. ===== Avaliação especial (TE, DA, ...) ===== A avaliação distribuída, realizada durante o semestre de funcionamento da unidade curricular, é exigida a todos os estudantes, independentemente do regime de inscrição. ===== Melhoria de classificação ===== A classificação pode ser melhorada na edição seguinte da unidade curricular. \\ -- MCR, JCL