Instituto Superior Técnico Licenciatura em Eng. Informática e de Computadores Campus Taguspark Enunciado do Projecto de Representação de Conhecimento Ontologia de Ciclo de Vida das Estrelas Ano 2003-2004 Objectivo O objectivo deste trabalho é a construção de uma ontologia no domínio da Astrofísica, em particular sobre corpos celestes em geral. Pretende-se que seja dado um ênfase especial para o ciclo de vida das estrelas o qual determina as características das estrelas que observamos. Domínio Aproximadamente 10 a 20 milhar de milhões de anos atrás deu-se uma enorme explosão, o “Big Bang”, e este acontecimento deu origem ao nosso Universo. A razão para este acontecimento é desconhecida. Toda a matéria e energia que existe hoje no Universo estavam concentradas numa densidade extremamente elevada. Não se pode dizer que toda a matéria e energia estavam esmagadas num local, mas sim que todo o Universo ocupava um volume muito pequeno. A partir dessa explosão gigantesca, o Universo iniciou um processo de expansão, o qual nunca parou até hoje. No início, o Universo era extremamente quente e brilhante motivo pelo qual é vulgarmente referido como bola de fogo. O Universo inicial estava totalmente ocupado de radiação e de matéria. A radiação da bola de fogo varria todo o espectro – desde raios gama, raios X, raios ultra-violeta, todo o espectro visível, raios infravermelhos até às ondas de rádio. Os restos desta radiação inicial podem ainda ser detectados hoje em dia pelos radiotelescópios, sendo motivo de estudo por parte da comunidade científica. À medida que se foi dando a expansão do Universo a matéria arrefeceu visto que a pressão diminui devido ao aumento de volume. O Universo passou a ser frio e escuro, tal como hoje o conhecemos. O universo jovem para além de cheio de radiação era constituído por hidrogénio e hélio, formados a partir das partículas elementares existentes na bola de fogo inicial. Com o passar do tempo, formaram-se pequenas descontinuidades que cresceram. Formaram-se nuvens de gás e colónias de “coisas” imensas, brilhando continuamente e rodando lentamente sobre si mesmas. As maiores estruturas que hoje reconhecemos no Universo tinham-se formado – as galáxias. Aproximadamente um milhar de milhões de anos depois do “Big Bang” a distribuição de matéria no Universo era um pouco irregular, possivelmente porque o “Big Bang” não foi perfeitamente uniforme. A matéria estava mais densamente compactada em alguns locais do que noutros. A gravidade atraiu para esses locais quantidades significativas do gás vizinho e de hidrogénio e hélio, os quais estavam destinadas a ser agregados (clusters) de galáxias. Note-se que uma pequena descontinuidade é suficiente para, mais tarde, produzir uma concentração substancial de matéria. À medida que se ia dando um/a colapso/contracção devido à atracção gravítica, as galáxias primordiais começaram a girar cada vez mais depressa, devido à conservação do momento angular. Algumas achataram ao longo do eixo de rotação, sempre que a gravidade não fosse equilibrada pela força centrífuga, tornando-se nas primeiras galáxias em espiral. Outras protogaláxias com menor gravidade ou menos rotação inicial achataram muito pouco, tornando-se nas primeiras galáxias elípticas. Dentro destas primeiras galáxias algumas nuvens de poeira estavam também a sofrer um colapso gravitacional. As temperaturas interiores dentro destas nuvens tornaram-se muito elevadas pelo que se iniciaram relações termonucleares - as primeiras estrelas “acenderam-se”. As estrelas jovens, quentes e massivas evoluíram rapidamente, consumindo hidrogénio, o seu combustível, e terminaram as suas vidas em explosões muito brilhantes, as supernovas, as quais produzem como cinza termonuclear hélio, carbono, oxigénio e elementos mais pesados até ao ferro, a qual foi integrada na poeira interestelar. Esta poeira, por sua vez, entrou mais tarde na formação das gerações seguintes de estrelas. Os outros elementos mais pesados conhecidos não existiam inicialmente. As estrelas têm um ciclo de vida, o qual depende essencialmente da sua massa inicial. Uma estrela começa como protoestrela, fase em que se dá a contracção. Quando, por acção da gravidade, as poeiras e gases são reunidas numa bola gigantesca muito densa em que a temperatura é suficiente para fundir os átomos de hidrogénio em hélio – 4 átomos de hidrogénio são combinados para formar um núcleo de hélio e libertar raios gama - a estrela acende-se. Nessa altura, devido a um conjunto de vários processos físicos, a força gravítica é compensada pela pressão gerada pelas reacções nucleares, ou seja a estrela está em equilíbrio hidrostático. A estrela entra então na chamada sequência principal – a fase mais longa do seu ciclo de vida. Por exemplo, o nosso sol, é uma estrela de sequência principal, ou anã amarela1. Quando o hidrogénio do núcleo da estrela for totalmente consumido, esta entra na fase de subgigante e seguidamente poderá dar origem a uma gigante vermelha ou supergigante vermelha, consoante a estrela seja supermassiva ou não. A forma como uma estrela termina a sua vida depende da sua massa podendo dar origem a uma anã branca, buraco negro ou estrela de neutrões. Dada a enorme quantidade de conhecimento sobre o domínio já reunido pelos cientistas da área, o conhecimento a representar neste projecto tem de ser limitado. Neste projecto pretende-se representar o conhecimento consensual respeitante ao ciclo de vida das estrelas. Alguns dos conceitos importantes a representar serão: anãs -em particular as amarelas, as brancas e as pretas-, as estrelas de neutrões -em que se incluem os pulsar-, as gigantes, supergigantes, os buracos negros, galáxias, nuvens de partículas, o acontecimento das supernovas. Será importante tentarem identificar um conjunto de propriedades segundo os quais as estrelas se classificam tais como a sua luminosidade, temperatura/cor (normalmente intervalo de temperaturas típicas ou temperaturas aproximadas para uma classe), densidade, massa, etc. Também é importante representar qual o fenómeno responsável pela transformação da estrela durante o seu ciclo de vida. No entanto, está fora do âmbito deste trabalho fazer a caracterização completa desses fenómenos. Por exemplo, pretende-se que seja representada que a razão pela qual uma estrela na sequência principal (ou anã amarela) se transforma em subgigante (o hidrogénio, que está a ser fundido no núcleo central esgotou-se), mas não se pretende caracterizar as reacções nucleares em si que estão a ter lugar no núcleo. Estes conceitos podem corresponder a classes, instâncias, atributos/relações, etc. O nosso sol deverá ser usado para mostrar como se poderia inserir conhecimento sobre uma estrela particular na base de conhecimento. No entanto, está fora do âmbito deste trabalho representar estrelas particulares e as suas características. 1 Esta nomenclatura é diferente, mas tem o mesmo significado. Neste momento é uma nomenclatura menos usada. Processo de Construção da Ontologia Esta ontologia deverá ser construída a partir do zero. Cada grupo deverá efectuar a sua aquisição de conhecimento sobre o domínio, encontrar um modelo conceptual apropriado para representar esse conhecimento e formalizar o conhecimento na ferramenta indicada. Ao longo de todo o processo deverão ser tomadas medidas de forma a assegurar a qualidade da ontologia. Especificação A ontologia a construir deve conter conhecimento suficiente de forma a introduzir alguém que não seja da área aos conceitos fundamentais do domínio para que os passe a compreender. Está fora do âmbito desta ontologia reunir conhecimento sobre as experiências ou a história da astrofísica. Na secção sobre o domínio encontram-se referidos alguns dos conceitos fundamentais que terão de estar representados na ontologia. Aquisição de Conhecimento As fontes primordiais de referência a usar, dado serem fontes que resumem os conceitos mais importantes do domínio a representar, são: http://imagine.gsfc.nasa.gov/docs/science/ e http://imagine.gsfc.nasa.gov/docs/science/advanced_science.html Outros links úteis: http://www.site.uottawa.ca:4321/astronomy/index.html No relatório deverão ser descritas todas as fontes usadas. Para além dos “links” fornecidos, outras fontes que poderão ser usadas são: (1) peritos e (2) bibliografia vária disponível. No caso de serem consultados peritos deverá ser feito o seu reconhecimento e descrito sumariamente o tipo de qualificações que têm na secção que descreve a aquisição efectuada. Deverá ser referida a bibliografia usada: os livros, revistas, etc. Caso sejam usadas outras fontes electrónicas, o seu endereço deverá ser apresentado na secção que descreve a aquisição de conhecimento. Pretende-se que todos os elementos de grupo leiam as fontes de conhecimento sobre o domínio escolhidas e estejam juntos nas entrevistas que sejam efectuadas de forma a ficarem com uma visão semelhante sobre o domínio. Conceptualização Uma vez feita a aquisição de conhecimento do domínio deverão ser identificados os seus conceitos essenciais. Por exemplo, conceitos que deverão estar representados na ontologia são: anãs, supergigantes, buracos negros, galáxias, nuvens de partículas, o acontecimento das supernovas, massa, luminosidade, etc. (Ver secção sobre o domínio). Estes conceitos serão agrupados em módulos. Dentro de cada módulo os conceitos encontram-se organizados hierarquicamente. No relatório, para além da descrição do modelo conceptual encontrado para o domínio devem ser descritos todos os conceitos representados nomeadamente as definições adoptadas e as fontes de conhecimento onde essas definições foram encontradas. Caso a definição de um dado conceito corresponda a uma combinação de definições de várias fontes, estas devem ser mencionadas. Para chegar ao modelo conceptual aconselha-se a que os alunos sigam as seguintes fases: Primeiro os alunos devem começar por reunir informação sobre os conceitos fundamentais que pensam serem necessários representar. Todos os conceitos têm definições as quais, numa fase inicial, correspondem a definições em linguagem natural. Por exemplo, “uma estrela é um corpo celeste que gera energia através de reacções de fusão nuclear no seu núcleo etc.”. Com base na definição de um conceito identificam-se conceitos que também terão de estar representados. Por exemplo, para representarmos estrela temos de representar corpo celeste, energia, reacções de fusão, núcleo, etc. Nesta fase, os alunos deverão ir impondo limites ao seu projecto. Por exemplo, poder-se-á representar reacções de fusão, mas não se quer caracterizar completamente as reacções nucleares que se dão nas estrelas. Também não se pretende que representem uma ontologia de elementos químicos (existe uma disponível em: http://www-kslsvc.stanford.edu:5915/) ou de partículas constituintes da matéria. Um dos produtos desta fase será um glossário com os conceitos do domínio que irão tentar representar formalmente na fase da formalização. Um glossário consiste numa sequência de pares “palavra” (que designa um determinado conceito) e sua “definição”. Por exemplo: estrela - corpo celeste que gera energia através de reacções de fusão nuclear no seu núcleo etc. Este glossário encontrado deverá aparecer no relatório do projecto. Seguidamente, os conceitos identificados deverão ser organizados hierarquicamente e em módulos. A forma como ele vai ser encontrado depende de grupo para grupo, mas alguns dos tipos de modelos conceptuais intermédios que foram referidos nas aulas teóricas podem ser úteis: dos mais informais -como os mind maps, modelo de ilhas, - até chegarem aos mais formais - como as representações tabulares intermédias típica dos sistemas de enquadramentos, ou usando a representação base das DL’s (description logics) - etc. Note-se que aqui já vai haver um conjunto de decisões de representação, tais como, quais os conceitos a representar como classes, atributos, instâncias, etc. Por exemplo, é natural que o nosso sol venha a ser representado como uma instância das estrelas na sequência principal e que as estrelas sejam representadas como uma subclasse dos corpos celestes. O modelo conceptual final que o grupo encontrou deverá aparecer no relatório do projecto. Caso seja necessário, poderá ser partido em várias figuras/partes. O modelo a entregar corresponde ao modelo final que pretenderam formalizar na ferramenta. Eventualmente poderão existir diferenças entre ele e o modelo final que foi efectivamente representado na ferramenta, na fase seguinte de formalização. Formalização A ferramenta a usar para formalizar o modelo conceptual é a PRÓTÉGÉ, a qual está disponível em http://protege.stanford.edu. Do ponto de vista do modelo formal utilizado por esta ferramenta, ele pode ser classificado como um sistema de enquadramentos (com algumas características de formalismos da família das description logics). Os alunos deverão aceder ao referido site e instalar a ferramenta no seu ambiente de trabalho. Está disponível na referida página (ver documentation) um tutorial sobre a utilização da ferramenta para apoiar a construção de ontologias, um manual completo da ferramenta e um guia sobre a construção de ontologias. Uma fonte valiosa de referência é a FAQ que está disponível através da referida página. Os alunos poderão consultar a mailing list, mas não devem enviar as suas perguntas directamente para a mesma. Assim, elas devem ser colocadas no endereço de apoio da cadeira ou na mailing list de apoio ao projecto que irá ser criada. No relatório deverá ser descrito como se passou do modelo conceptual para o modelo formal e deverão ser descritas as adaptações que tiveram de ser feitas às definições dos conceitos encontradas na fase de conceptualização. Por exemplo, a ferramenta poderá não permitir representar condições estruturais caso o modelo conceptual tenha sido encontrado usando as DL’s. Caso não seja possível contornar esse problema de nenhuma forma, o problema deverá ser referido no relatório. Avaliação Não só é importante assegurar que o conhecimento representado é o correcto do ponto de vista do domínio e de forma a ir de encontro à especificação, como é importante assegurar que o conhecimento é representado com o nível de detalhe adequado e da forma mais correcta do ponto de vista da qualidade da representação. Assim, os alunos deverão assegurar-se que os referidos aspectos foram tidos em conta. A forma como foi assegurada a qualidade final da ontologia deverá ser descrita no relatório. Por exemplo, como foi assegurado que todos os conceitos identificados na especificação de requisitos&aquisição foram representados, como foi assegurada que as definições representadas estão correctas, etc. Por exemplo, podem ter conferido uma check-list para o primeiro caso e podem ter pedido a um perito do domínio para vos assegurar que a definições eram as mais correctas no segundo caso. Execução do Projecto O projecto deve ser realizado em grupos de 2 alunos, não sendo aceites trabalhos realizados por grupos com um número de elementos superior. Grupos de um aluno são vivamente desencorajados. Inscrição no projecto Os grupos, uma vez constituídos, deverão preencher uma ficha de inscrição de grupo, que estará disponível na página da cadeira. Esta ficha deverá ser entregue ao corpo docente da cadeira, de preferência na aula prática que um dos elementos do grupo esteja a frequentar. Após recepção das inscrições, serão atribuídos números aos grupos. Os grupos podem ser constituídos por alunos de diferentes turmas. Dúvidas Irá ser criada uma mailing list para dar apoio adicional ao projecto. Pelo menos um dos elementos do grupo deverá estar inscrito na mailing list a qual poderá ser acedida através da página da cadeira. Antes de enviar alguma dúvida os alunos devem assegurar-se que a mesma ainda não foi colocada. Entrega do Projecto O prazo de entrega do projecto é dia 7 de Julho. Após esta data não serão aceites mais trabalhos. Devem ser entregues um relatório e o código do modelo conceptual tal como ele foi formalizado e introduzido na ferramenta. O relatório deverá ser entregue na portaria do Tagus durante seu horário normal de funcionamento. O código deverá ser entregue electronicamente até às 24 horas do referido dia. Serão disponibilizadas instruções para a entrega do código através da página da cadeira. Irá ser disponibilizado um modelo de relatório. No entanto, neste enunciado encontram-se já descritos alguns dos aspectos que deverão aparecer obrigatoriamente no relatório. Tal como foi referido na Secção “Processo de Construção da Ontologia” é importante descrever o modelo conceptual que foi encontrado, as definições dos conceitos representados que foram adoptadas, a forma como o modelo conceptual e esses conceitos foram formalizados na ferramenta. Deverá igualmente ser feita uma análise simples de usabilidade da ferramenta para a qual será fornecido um questionário. Um dos aspectos interessantes a descrever no relatório são as dificuldades encontradas, como é que foram ultrapassadas, crítica da formalização encontrada (ou seja, o que deveria ter sido de uma forma diferente no vosso projecto se tivessem de fazer um novo projecto). Trabalhos iguais, ou muito semelhantes, serão classificados com 0 (zero) valores. O corpo docente da cadeira será o único juiz do que se considera ou não copiar numa dada prova.