Abstract
Sammendrag:
Oppgaven handler om maskinell lesning av skjønnlitterære tekster og tar for seg en rekke spørsmål knyttet til temaet. Hva vil det si å forstå en tekst og hva skal til for å oppnå maskinell forståelse av tekst? Hvilke problemer møter man om man forsøker og hva kan dette si oss?
Utgangspunkt tar jeg i mitt eget forsøk på å lage et program som leser skjønnlitterære tekster. Programmet er basert på Michael Dyers teorier om tematiske abstraksjonsenheter ( thematic abstraction units ) og Patrick Henry Winstons behandling av teorien. Teorien om de tematiske abstraksjonsenhetene er et forsøk på å fange opp et aspekt ved våre kognitive prosesser, som behandler handlingsstruktur i narrative tekster. De tematiske abstraksjonsenhetene vil forhåpentligvis ved implementering kunne finne tema og motiv i teksten som prosesseres.
De første kapitlene i oppgaven er et forsøk på å sette Dyers teori i perspektiv og knytte det opp til arbeid innen kunstig intelligens og kognitiv vitenskap. Deretter følger en beskrivelse av teorien. Videre i oppgaven går jeg gjennom hovedpunktene i programmet mitt, dvs. de områdene jeg har hatt størst problemer med, og prøver å gi svar på hvorfor problemene oppstår, hva som eventuelt kan gjøres med det og hva dette kan si om maskinelle lesninger. Mitt fokus ligger på de praktiske problemene, stort sett knyttet til lingvistiske problemområder. I arbeidet med programmet dukket det opp f.eks problemer med semantisk flertydighet, setningsoppbygging, billedlig språk, kausale relasjoner mellom setningene osv. Det viser litt av hvor stor forskjell det er mellom teori og praksis, hvor mye enklere det er gi et bilde av menneskets kognitive evner på dette området enn det er å faktisk lage dem. Uten at dette på noen måte motbeviser at en vellykket implementering av de tematiske abstraksjonsenhetene er mulig vil jeg vise hvor lett problemer oppstår. Så lenge teoriene kun prøver å fange representasjoner av menneskets prosesser mot forståelse mangler de et apparat for å omdanne språk til slike representasjoner. I denne oppgavens tilfelle handlet det om å omdanne skjønnlitterær tekst til det Winston kaller semantiske nett . Jeg avslutter oppgaven med å si litt om det skjønnlitterære perspektivet ved slikt arbeid og om maskinelle lesninger har noen hensikt sett derfra.