Norwegian word order in head-driven phrase structure grammar : phenomena, analysis and implementation

Ellingsen, Liv

Master thesis

View/Open

thesis.pdf (935.9Kb)

Year

2003

Abstract

Hovedfagsoppgaven min, Norwegian Word Order in Head-Driven Phrase Structure

Grammar, består formelt sett av fire hoveddeler: 1) en formell deskriptiv

redegjørelse for de ordstillingsfenomener i norsk som omfattes av oppgaven, 2)

en analyse av disse fenomenene innenfor grammatikkformalismen HPSG, 3) en

implementasjon av denne analysen ved hjelp av grammatikkutviklingsverktøyet LKB

og 4) et omfattende testsett av setninger som inkluderer de interessante

fenomenene.

Utgangspunktet for oppgaven er ordstillingsfenomener i norsk som skiller seg

fra ordstillingen i andre germanske språk, med særlig vekt på engelsk. For

norske deklarative hovedsetninger betyr dette at jeg har lagt vekt på

V2-regelen, topikalisering og den mulige inverterte subjektsposisjonen i

setningen. Dette står i kontrast til den normale strukturen i leddsetninger,

der topikalisering ikke er tillatt, subjektet kun har en mulig posisjon i

setningen (før det finitte verbet) og V2-reglen ikke gjelder (dvs. at mer enn

et ledd kan plasseres før det finitte verbet). I tillegg har jeg sett på

setningsadverbialenes mulige plassering, med vekt på de forskjellene som

foreligger både mellom de to ulike setningstypene og mellom ulike typer av

adverb innenfor samme type setning.

Jeg har brukt grammatikkformalismen Head-Driven Phrase Structure Grammar (HPSG)

til å bygge opp en analyse for fenomenene nevnt ovenfor. HPSG er en

føringsbasert, leksikalsk og ikke-transformasjonell formalisme, der de

lingvistiske objektene blir representert ved hjelp av

attributt-verdi-matriser. Formalismen benytter seg av typehierarki med

multippel arv for a uttrykke generaliseringer over disse objektene.

For å implementere analysen min har jeg tatt i bruk

grammatikkutviklingsverktøyet Lexical Knowledge Builder (LKB). Dette verktøyet

letter arbeidet med å bygge opp alle de nødvendige delene av grammatikken

(særlig nødvendig for det omfattende typehierarkiet), og det gir også

muligheter for å teste grammatikken på ulike måter når den er ferdig, for

eksempel ved parsing og generering.

Grammatikken har jeg bygget opp på grammatikkfundamentet Matrix, et

basistypehierarki som er trukket ut fra den engelske HPSG-grammatikken LinGO

ERG, og som har som mål å utvikle seg til en språkuavhengig startpakke for

grammatikkutviklere som ønsker å skrive HPSG-grammatikker for sine egne

språk. Matrix er foreløpig på forsøksstadiet, så det er interessant å se i

hvilken grad typene kan overføres direkte til en norsk grammatikk og i hvilke

tilfeller de må modifiseres før de kan tas i bruk.

Analysen jeg har laget, og den fungerende implementasjonen av den, er

inspierert av setningsskjema-analyser som er laget for skandinaviske språk, med

utgangspunkt i Diderichsens setningsskjema for dansk. Jeg deler således

konstruksjonene inn i to basismønstre, ett for hovedsetninger og ett for

leddsetninger. Ofte kan det avgjøres hvilken struktur setningene har, og dermed

hvilket mønster de tilhører, allerede fra første regelapplikasjon.

I de to basismønstrene går jeg blant annet ut fra forskjellig kanonisk

subjektsposisjon i hoved- og leddsetninger (etter finitt verb i hovedsetninger

og før finitt verb i leddsetninger), med den følge at subjektet må ekstraheres

fra sin opprinnelige plass og frontes på samme måte som objekter og adverbialer

dersom det skal plasseres i setningens første posisjon i en deklarativ

hovedsetning.

Setningsadverbialene klassifiserer jeg ut fra den plasseringen de kan ha i en

setning. Denne klassifikasjonen implementerer jeg så i et typehierarki, der

typer som er underspesifisert og dermed kan plasseres i flere forskjellige

posisjoner i setningen har subtyper som er nærmere spesifisert og kun kan

plasseres i enkelte av disse posisjonene. Hvert adverbial blir så definert til

å være av den passende typen. Reglene som kombinerer adverbialene med den

frasen de modifiserer har ytterligere føringer lagt på seg for å sikre at

adverbialene blir plassert på korrekt plass i den riktige typen struktur.

Tilsammen utgjør dette en analyse og en implementasjon som dekker de fenomen og

data som jeg beskrev i andre avsnitt. For en mer utfyllende forklaring og

tekniske detaljer kan oppgaven oppspores ved hjelp av BIBSYS.