Abstract
Hovedfagsoppgaven min, Norwegian Word Order in Head-Driven Phrase Structure
Grammar, består formelt sett av fire hoveddeler: 1) en formell deskriptiv
redegjørelse for de ordstillingsfenomener i norsk som omfattes av oppgaven, 2)
en analyse av disse fenomenene innenfor grammatikkformalismen HPSG, 3) en
implementasjon av denne analysen ved hjelp av grammatikkutviklingsverktøyet LKB
og 4) et omfattende testsett av setninger som inkluderer de interessante
fenomenene.
Utgangspunktet for oppgaven er ordstillingsfenomener i norsk som skiller seg
fra ordstillingen i andre germanske språk, med særlig vekt på engelsk. For
norske deklarative hovedsetninger betyr dette at jeg har lagt vekt på
V2-regelen, topikalisering og den mulige inverterte subjektsposisjonen i
setningen. Dette står i kontrast til den normale strukturen i leddsetninger,
der topikalisering ikke er tillatt, subjektet kun har en mulig posisjon i
setningen (før det finitte verbet) og V2-reglen ikke gjelder (dvs. at mer enn
et ledd kan plasseres før det finitte verbet). I tillegg har jeg sett på
setningsadverbialenes mulige plassering, med vekt på de forskjellene som
foreligger både mellom de to ulike setningstypene og mellom ulike typer av
adverb innenfor samme type setning.
Jeg har brukt grammatikkformalismen Head-Driven Phrase Structure Grammar (HPSG)
til å bygge opp en analyse for fenomenene nevnt ovenfor. HPSG er en
føringsbasert, leksikalsk og ikke-transformasjonell formalisme, der de
lingvistiske objektene blir representert ved hjelp av
attributt-verdi-matriser. Formalismen benytter seg av typehierarki med
multippel arv for a uttrykke generaliseringer over disse objektene.
For å implementere analysen min har jeg tatt i bruk
grammatikkutviklingsverktøyet Lexical Knowledge Builder (LKB). Dette verktøyet
letter arbeidet med å bygge opp alle de nødvendige delene av grammatikken
(særlig nødvendig for det omfattende typehierarkiet), og det gir også
muligheter for å teste grammatikken på ulike måter når den er ferdig, for
eksempel ved parsing og generering.
Grammatikken har jeg bygget opp på grammatikkfundamentet Matrix, et
basistypehierarki som er trukket ut fra den engelske HPSG-grammatikken LinGO
ERG, og som har som mål å utvikle seg til en språkuavhengig startpakke for
grammatikkutviklere som ønsker å skrive HPSG-grammatikker for sine egne
språk. Matrix er foreløpig på forsøksstadiet, så det er interessant å se i
hvilken grad typene kan overføres direkte til en norsk grammatikk og i hvilke
tilfeller de må modifiseres før de kan tas i bruk.
Analysen jeg har laget, og den fungerende implementasjonen av den, er
inspierert av setningsskjema-analyser som er laget for skandinaviske språk, med
utgangspunkt i Diderichsens setningsskjema for dansk. Jeg deler således
konstruksjonene inn i to basismønstre, ett for hovedsetninger og ett for
leddsetninger. Ofte kan det avgjøres hvilken struktur setningene har, og dermed
hvilket mønster de tilhører, allerede fra første regelapplikasjon.
I de to basismønstrene går jeg blant annet ut fra forskjellig kanonisk
subjektsposisjon i hoved- og leddsetninger (etter finitt verb i hovedsetninger
og før finitt verb i leddsetninger), med den følge at subjektet må ekstraheres
fra sin opprinnelige plass og frontes på samme måte som objekter og adverbialer
dersom det skal plasseres i setningens første posisjon i en deklarativ
hovedsetning.
Setningsadverbialene klassifiserer jeg ut fra den plasseringen de kan ha i en
setning. Denne klassifikasjonen implementerer jeg så i et typehierarki, der
typer som er underspesifisert og dermed kan plasseres i flere forskjellige
posisjoner i setningen har subtyper som er nærmere spesifisert og kun kan
plasseres i enkelte av disse posisjonene. Hvert adverbial blir så definert til
å være av den passende typen. Reglene som kombinerer adverbialene med den
frasen de modifiserer har ytterligere føringer lagt på seg for å sikre at
adverbialene blir plassert på korrekt plass i den riktige typen struktur.
Tilsammen utgjør dette en analyse og en implementasjon som dekker de fenomen og
data som jeg beskrev i andre avsnitt. For en mer utfyllende forklaring og
tekniske detaljer kan oppgaven oppspores ved hjelp av BIBSYS.