Table of Contents
Ficha de Unidade Curricular
Mestrado Integrado em Engenharia Informática e Computação
Linguagens de Anotação e Processamento de Documentos
Ocorrência: 2017/2018
—
Informação geral
Curso: Linguagens de Anotação e Processamento de Documentos
Código: EIC0107
Curso: MIEIC, 4º
Ano letivo: 2017/2018
Semestre: 2S
ECTS: 6
Horas/Semanas: 3 TP
Professores: João Correia Lopes
Língua de trabalho
Inglês
Objetivos
ENQUADRAMENTO
A unidade curricular "Linguagens de Anotação e Processamento de Documentos" tem como contexto o uso generalizado de linguagens de anotação para a representação de informação semi-estruturada e a existência de ferramentas normalizadas para o seu tratamento.
OBJETIVOS
Esta unidade curricular foca-se na obtenção de linguagens de anotação para um dado domínio e na realização de aplicações baseadas em linguagens de anotação e tem por objetivos:
- Sensibilizar os estudantes para as múltiplas aplicações não triviais das linguagens de anotação;
- Familiarizar os estudantes com as tecnologias de processamento e armazenamento de informação semi-estruturada;
- Aplicar as tecnologias de anotação na definição de uma linguagem e na resolução de um problema com recurso ao desenvolvimento de uma aplicação.
Resultados de aprendizagem e competências
No final desta unidade curricular o estudante deverá ser capaz de:
- Identificar os usos das linguagens de anotação em documentos, em repositórios de dados e no suporte a aplicações;
- Criar modelos para documentos XML;
- Distinguir as linguagens normalizadas para domínios de aplicação e os usos ad-hoc da anotação;
- Desenhar uma linguagem de anotação para servir de base a um tipo de documentos ou aos dados de uma aplicação;
- Interpretar os resultados do processamento de documentos com as tecnologias baseadas em XML;
- Avaliar comparativamente soluções baseadas em XML e outras para suporte à troca de informação entre aplicações;
- Desenhar folhas de estilo XSL para transformar documentos;
- Usar uma base de dados com armazenamento nativo de XML e tirar partido das suas funções de interrogação;
- Comparar a organização de dados em modelo de anotação com o modelo relacional e traduzir dados entre modelos;
- Produzir um modelo de anotação para dados de um domínio de aplicação, armazenar um conjunto de dados e interrogá-los;
- Comparar as linguagens de anotação e outras representações de documentos e de dados do ponto de vista da preservação ao longo das mudanças tecnológicas;
- Desenvolver um protótipo de aplicação envolvendo o processamento de documentos.
Modo de trabalho
Presencial
Pré-requisitos (conhecimentos prévios) e co-requisitos (conhecimentos simultâneos)
Os estudantes devem ter competências básicas em linguagens e tecnologias de anotação.
Programa
- Desenho de linguagens de anotação. Análise de linguagens existentes em vários domínios.
- Interrogação de documentos XML. A linguagem XPath. A linguagem XQuery.
- Transformações de documentos XML com XSLT. Apresentação de documentos XML com XSL-FO.
- Processamento de XML em aplicações. As interfaces standard DOM e SAX.
- Armazenamento de XML em bases de dados XML nativas. Armazenamento de XML em bases de dados objeto-relacional.
- Introdução à web semântica. Descrição de recursos em RDF e OWL. Interrogações em SPARQL. Linked Open Data.
Bibliografia obrigatória
- Anders Møller, Michael I. Schwartzbach; An Introduction to XML and Web Technologies, Addison Wesley Professional, 2006. ISBN: 0321269667 Biblioteca
Bibliografia complementar
- Neil Bradley, The XML Companion, Addison-Wesley, 3rd Edition, 2002, ISBN: 0-201-77059-8. Biblioteca
- José Carlos Ramalho, Pedro Henriques; XML e XSL — da Teoria à Prática, FCA Editora, 2002, ISBN: 972-722-347-8. Biblioteca
- Elliotte Rusty Harold, W. Scott Means, XML in a Nutshell, O'Reilly, Third Edition, 2004, ISBN: 0-596-00292-0. Biblioteca
- Grigoris Antoniou and Frank van Harmelen, A Semantic Web Primer, 2nd edition, The MIT Press, 2008, ISBN: 9780262018289
Métodos de ensino e atividades de aprendizagem
Os tempos letivos são usadas para exposição de matéria teórica, com referência à bibliografia relevante, e desenvolvimento de exemplos relacionados. Nas sessões práticas os tópicos de investigação propostos são discutidos com os estudantes e o trabalho prático é reportado.
Software
- eXist, MongoDB
- oXygen
Palavras-chave
Ciências Físicas > Ciência de computadores > Informática
Tipo de avaliação
Avaliação distribuída sem exame final.
Componentes de avaliação e ocupação
O trabalho prático decompõe-se em três componentes com entrega de um pequeno artigo científico e uma apresentação e discussão em formato workshop.
Os conceitos teóricos são avaliados através da resposta individual a 6 questionários.
Componentes de avaliação
Descrição | Tipo | Tempo (horas) | Data de Conclusão |
---|---|---|---|
Aulas da unidade curricular (estimativa) | Aulas | 42 | — |
Quiz #1: Armazenamento (Q1) | Questionário | 0 | 05/03/2018 |
Proposta de projeto (D1) | Trabalho | 27 | 12/03/2018 |
Quiz #2: XPath (Q2) | Questionário | 0 | 19/03/2018 |
Quiz #3: XQuery (Q3) | Questionário | 0 | 09/04/2018 |
Quiz #4: XSLT (Q4) | Questionário | 0 | 16/04/2018 |
Arquitetura e protótipo (D2) | Trabalho | 33 | 23/04/2018 |
Quiz #5: RDF (Q5) | Questionário | 0 | 14/05/2018 |
Quiz #6: OWL (Q6) | Questionário | 0 | 21/05/2018 |
Aplicação baseada em XML (D3) | Trabalho | 60 | 28/05/2018 |
Total | 162 | — |
Componentes de ocupação
Elaboração de projeto: 123
Frequência das aulas: 39
Obtenção de frequência
n/a
Fórmula de cálculo da classificação final
A nota final será calculada usando a fórmula: NOTA = 60% Trabalho + 40% Questionários, sendo: Trabalho = 20% D1 + 30% D2 + 50% D3, Questionários= (Q1 + Q2 + Q3 + Q4 + Q5) / 5
O trabalho prático será avaliado através da documentação apresentada até às respetivas datas-limite, da participação nas apresentações e da aplicação desenvolvida.
A classificação de cada componente do Trabalho pode ser diferente para cada membro do grupo, dependendo da sua participação na sessão da apresentações.
Os questionários de resposta individual têm a duração de 20 minutos e realizam-se durante a aula.
A aprovação na unidade curricular está condicionada à obtenção de 40% em cada uma das entregas e apresentações da avaliação prática (D1 a D3) e de 40% na média dos questionários relacionados com a matéria teórica. Não está prevista qualquer prova de recurso para estas componentes.
Esta unidade curricular, dada a sua natureza, não é passível de avaliação em momento único, pelo que não poderá ser substituída por exame de recurso.
Provas e trabalhos especiais
Não há provas nem trabalhos especiais.
Trabalho de estágio/projeto
O trabalho prático decompõe-se em três componentes com entrega de um pequeno artigo científico e uma apresentação e discussão.
Avaliação especial (TE, DA, ...)
Os trabalhos práticos, realizados durante o semestre de funcionamento da unidade curricular, são exigidos a todos os estudantes, independentemente do regime de inscrição e da eventual dispensa de frequência. Os estudantes que não frequentam regularmente, fazem as entregas dos trabalhos e apresentações nas épocas previstas.
Melhoria de classificação
A nota final pode ser melhorada apenas através da frequência de uma nova edição da unidade curricular.
— JCL