Antologi Fritt Ord-konkurransen

Fritt Ord-konkurransen for videregående skole

Fagartikler

Generativ KI i norskfaget

Bilde generert av DALL-E. Instruks: Poisened by toothpaste, detailed, surrealist oil painting

Generativ KI er over oss. Avanserte språkmodeller som ChatGPT, Bing, Perplexity og Bard gjør velvillig alt du ber om av språklige oppgaver. Mange har påpekt om den digitale utviklingen at man ikke får «tannkremen tilbake i tuben». Men som jeg nylig hørte: Man kan faktisk dø av for mye tannkrem. På den andre siden, brukt riktig, som i en liten ert på tannkosten, kan tannkrem gi både økt folkehelse og livsmestring. I løpet av denne teksten skal jeg derfor sette ord på hvordan jeg tror vi kan bruke generativ KI på læringsfremmende måter, og litt om hva som må til før vi virkelig kan få sving på sakene.

Per dags dato (30. august 2023) er læreres mulighet til å ta i bruk såkalte avanserte språkmodeller (som GPT) i klasserommet fortsatt begrenset. De konkrete bruksområdene jeg har testet ut selv, har operert innenfor godkjente rammer. Derfor skriver jeg først om hva jeg har direkte erfaring med i klasserommet, og deretter om hvordan jeg håper vi kan bruke teknologien når rammene åpner for bredere bruk.

DALL-E

DALL-E er en av flere KI-drevne bildegeneratorer. På nettstedet openai.com/dall-e-2 kan man legge inn instruksjoner om innhold, farge, form, stilretning og teknikk. DALL-E krever innlogging og personopplysninger, så når jeg har brukt appen i klasserommet, har elevene skrevet instruksene (promptene), men vi har brukt min DALL-E-bruker til å generere bildene. Her presenteres noen eksempler på bruk av DALL-E i norsk på vg2.

Brukt til nærlesing av klassisk litteratur

Bilde generert av DALL-E. Instruks: Norse man, bulky nose, lang blonde hair, detailed oil painting

I en vg2-klasse jobbet vi i vår med Mary Shelleys Frankenstein. Vi leste avsnittene der skapningen vekkes til liv og hvor det står detaljerte skildringer av hvordan han ser ut. Mens vi leste, noterte elevene alt som stod om skapningens utseende. Deretter lagde de i grupper, instruksjoner til DALL-E der målet var å få den til å generere det mest «troverdige» Frankensteins monster. Jeg matet min DALL-E-bruker med elevenes instrukser mens alle fulgte med «live» på storskjerm. Spennende å vente på hva som dukket opp! Denne høsten har jeg gjort omtrent det samme med min nye vg2-klasse, men ved lesing av Gunnlaug Ormstunges saga. Vi leste sagaen høyt sammen, og da elevene etter ca. 30 minutter begynte å bli glassaktige i blikket, stoppet vi opp ved den detaljerte skildringen av hovedpersonen Gunnlaug. I grupper lagde elevene instrukser til DALL-E der de prøvde å «prompte» frem en Gunnlaug, slik han står beskrevet i teksten. Igjen stort engasjement og ivrig nærlesing, samtidig som elevene fikk med seg ett og annet om mannsidealet i sagatiden.

Ellers bruker jeg DALL-E til å visualisere tekster og presentasjoner til bruk i undervisningen, til å illustrere elevskrevne dikt med mer. Med kunst og håndverk i fagbakgrunnen har jeg klokkertro på bruk av bilder, ikke minst som støtte for hukommelsen. Med DALL-E kan man generere bilder som gjør tekster mer tilgjengelige og lettere å huske. Med bilde og verbalspråk kan vi eksperimentere med form, utforske effekter og hvilken påvirkning bilder har på tolkning og meningsskaping.

ChatGPT til muntlige aktiviteter

Generativ KI kan rydde rom for målrettet trening i spesifikke ferdigheter. ChatGPT kan for eksempel være et verdifullt hjelpemiddel å bruke når poenget ikke (!) er å lære ved å produsere tekst selv. I vår gjennomførte vg2-elevene mine en oppgave der hovedmålet var å øve på muntlighet og muntlige ferdigheter. Det er viktig å nevne at målet ikke var produksjon av innhold, men trening i en krevende muntlig øvelse. Oppgaven var å lage en pehca kucha, som er et foredragsformat der man presenterer et emne muntlig, sammen med lysbilder som er forhåndsinnstilt på tid. Hvert lysbilde står i 20 sekunder før det skifter av seg selv til neste bilde. Poenget er at dette formatet gir trening i planlegging, timing og fremføring av en muntlig presentasjon. For å lykkes er man nødt til å øve. Elevene kunne velge mellom fire ulike problemstillinger/overskrifter, og innholdet skulle aktualisere litteratur vi hadde jobbet med i løpet av året. Elevene lastet ned ferdig tidsinnstilte powerpointer. Åpningssiden var laget på forhånd, og elevene skulle fylle på med resten. De kunne velge mellom fire forsider/overskrifter:

Åpningsbilde til en av powerpointene
  • Hva betyr «ære» i dag? (norrøn litteratur)
  • Finnes egentlig fri vilje? Kan vi selv påvirke vår skjebne? (renessanse, Hamlet)
  • Kan vi få for mye informasjon? (opplysningstid og klassisisme)
  • Når mennesket leker gud (romantikk, Frankenstein)

Dette er en kompleks og krevende oppgave med mange komponenter. Jeg ville øve elevene i muntlige ferdigheter og lot dem som ville, benytte ChatGPT til hjelp med innholdet. Elever som allerede hadde private kontoer, kunne bruke disse, mens andre leverte instruksene (promptene) til meg. Jeg modellerte en instruks som alle kunne tilpasse og bruke:

Jeg har fått i oppgave å holde en pecha kucha med 10–15 lysbilder. Tittelen på presentasjonen er: «Kan vi få for mye informasjon?» Et hovedpoeng er at vi skal vise at vi kan anvende kunnskaper og ferdigheter vi har tilegnet oss i norskfaget i vg2. Vi har blant annet lest Holberg-dramaet Erasmus Montanus og lært om opplysningstid og klassisisme. Følgende kompetansemål er særlig relevant: 1. lese og tolke tekster fra 1500 til 1850 i kulturhistorisk kontekst og drøfte hvordan de er relevante i dag. Har du et kort innspill til hvordan jeg kan vinkle oppgaven, og i tillegg gi meg forslag til bildemotiver i presentasjonen? Jeg vil også at presentasjonen skal være underholdende å se/høre på og at den fremstår som kreativ og original.

Åpningen for bruk av ChatGPT viste seg å ha både fordeler og ulemper. Fordelen var at elevene relativt raskt fikk generert innhold til presentasjonen som de kunne begynne å øve på. Den store ulempen var at mange fikk et svakt eierforhold til innholdet. De brukte det ChatGPT foreslo, temmelig ukritisk. Det bør legges til at oppgaven ble gjennomført på slutten av skoleåret, der avgangsfag og eksamener gjorde krav på størstedelen av elevenes oppmerksomhet. Motivasjonen for hardt arbeid med en krevende norskfaglig oppgave var skjør. Uansett kommer jeg neste gang til å legge opp til grundigere bearbeiding og tilegnelse av innholdet. Form og innhold henger som kjent sammen, og det svake eierskapet til innholdet gikk selvsagt ut over hva elevene presterte muntlig.

En annen måte jeg har brukt ChatGPT på, er å få den til å generere skuespill. Få av elevene mine hadde referanser til den tidligere nevnte romanen Frankenstein. Derfor brukte vi litt tid på å jobbe oss inn i tematikken før vi gikk løs på teksten. Vi startet med at jeg gav fire elever et manus som de leste og fremførte i klassen. Ingen av elevene hadde lest det på forhånd. Instruksen jeg hadde gitt til GPT, var følgende:

Lag et skuespill på omtrent 800 ord med fire skuespillere. Det skal handle om en overivrig norsklærer. Læreren lager en oppfinnelse som gjør at alles favorittfag blir norsk. Hun klarer ved hjelp av kunstig intelligens å lage en maskin som elevene sendes gjennom. Ved hjelp av moderne bioteknologi manipuleres elevenes hjerner slik at de etter behandlingen elsker norskfaget og bare vil ha norsk, norsk, norsk hele tiden. Alle elever som er behandlet av maskinen, går plutselig over til å snakke nynorsk [bokmål var elevenes hovedmål]. Men som i fortellingen om Frankensteins monster mister læreren kontrollen over det hun har skapt, og det viser seg at hun har skapt et sant monster. Skuespillet ender med tragedie.

Fremføringen ble en artig opplevelse. Oppgaven elevene fikk, var deretter som følger:
Lag tilsvarende instruksjoner til et skuespill om teknologi som er utviklet med gode intensjoner. Handlingen ender likevel med tragedie. Gjør det dagsaktuelt. Start instruksjonen med «Lag en moderne frankensteinhistorie».

Oppgaven ble løst i grupper og førte til svært gode samtaler om Frankensteins aktualitet. Underveis fikk klassen utdelt en fagartikkel som aktualiserer romanen. Der trekkes paralleller til mulige menneskeskapte «monstre». Artikkelen nevner eksempler fra moderne bioteknologi, fra forskning på kryonisk nedfrysning (der målet er at fremtidens teknologi skal gjenopplive døde personer), sosiale medier, kjernefysiske og biologiske våpen, teknologi som har medført klimaendringer, med flere. Jeg nevner det siden dette var et tidspunkt der elevene var svært mottakelige for å lese fagtekst. Innholdet kunne de la seg inspirere av i sine egne dramatiske plott. Gruppene lagde detaljerte instrukser som jeg matet min egen GPT-bruker med. Manusene ble deretter skrevet ut, øvd på og fremført. Mye latter, mye eierskap til tematikk i Frankenstein og god motivasjon for å lese lengre utdrag og å lytte til NRKs hørespill Frankenstein eller den nye Prometevs.

Perplexity til informasjonsinnhenting og øving i kildekritikk

Perplexity.ai er en generativ KI som skiller seg fra tjenester som ChatGPT og Bing ved at man kan bruke chatboten uten innlogging, og den skiller seg fra ChatGPT ved at den viser tydelig til hvilke kilder den har brukt, og hvor i teksten den har brukt dem.

Siden det er valghøst, brukte vi i vg2 starten av skoleåret på politikk, retorikk og argumentasjon. Vi startet med noen innledende oppgaver der målet var bevisstgjøring, refleksjon og øvelse i kildekritikk. Jeg viste hvordan Perplexity fungerer, med eksempler på svakheter. Blant annet ba jeg chatboten om å beskrive Gunnlaug i Gunnlaug Ormstunges saga. Poenget var ikke svaret, men å modellere en vurdering av kildene verktøyet viste til. Kildene varierte med alt fra Daria (med elevskrevne tekster) til vitenskapelige avhandlinger. Så ville jeg vise svakheter i innhold generert av generativ KI. Jeg stilte Perplexity spørsmålet «Hva er det viktigste innholdet i norskfaget på vg2?». Svaret var som følger: «Ifølge Udir skal elevene ha hele opplæringen i engelsk på vg1, mens opplæringen i norsk er lagt til vg2». Det er jo ikke feil, men chatboten unnlater å nevne at dette bare gjelder for yrkesfag. Dermed blir svaret villedende og et godt eksempel på hvorfor man skal være kritisk til svar fra avanserte språkmodeller.

Deretter fikk elevene parvis i oppgave å bruke Perplexity til å søke etter informasjon om et emne de selv hadde god greie på, for at det skulle bli mulig for dem å vurdere svar og kilder. I OneNote klassenotatbok svarte de på følgende spørsmål:

  1. Hva spurte dere om?
  2. Hvordan vurderer dere svarene dere fikk?
  3. Hva slags kilder viste Perplexity til? Hvordan vurderer du kildene? Vær konkret i svaret.
  4. Hvorfor kan man ikke stole på det avanserte språkmodeller (KI-baserte chatbots) skriver?

Svarene ble brukt til repetisjon av kildekritikk. Hvorfor er ikke et leserinnlegg en god kilde til faktainformasjon, selv om det står i Aftenposten? Hvorfor er ikke verken YouTube eller Wikipedia nødvendigvis dårlige kilder? Hvorfor bør ikke kommersielle nettsider med produktsalg brukes som faktakilde? Hvorfor er Fandom.com en svak faktakilde? Osv. Igjen en erkjennelse av at kildevurdering er noe av det mest krevende vi driver med i skolen.

Etter en økt om argumentasjon fikk grupper på fire i oppgave å lage en pecha kucha som skulle brukes til å overbevise om fortreffeligheten til et bestemt politisk parti. Gruppene fikk lenke til stortingspartienes partiprogram og kunne vinkle appellen mot et bestemt tema (helse, utdanningspolitikk, klima osv.). Til hjelp fikk de bruke Perplexity.ai. Der kan man legge inn nettadressen til et politisk parti og stille spørsmål til innholdet. Eksempel:

Bruk denne kilden til å skrive om Rødts skolepolitikk: https://roedt.no/.

Perplexity brukte utelukkende Rødts hjemmeside som kilde til å skrive om partiets skolepolitikk. Og for hver påstand viste den til hvor i partiprogrammet den hadde hentet informasjonen fra. Man kan også legge inn partiprogrammene til eksempelvis FrP og SV og be Perplexity om å sammenlikne partienes skole-, klima- eller kulturpolitikk. Til dette synes jeg verktøyet fungerte godt.
Jeg har over prøvd å vise eksempler på hvordan man innenfor dagens rammer kan bruke generativ KI i norskfaget, uten å bli forgiftet. Det er viktig å legge til at siden verktøyene er så nye, er det jeg har beskrevet, førstegangserfaringer som vil ligge til grunn for videre praksis. Til slutt deler jeg noen tanker om videre utvikling.

Forslag til læringsfremmende bruk av generativ KI i skriveopplæringen (i fremtiden)

Som norsklærer er jeg særlig interessert i skriveopplæring. Siden antall karakterer ble redusert fra tre til to på vg1 og vg2, har jeg som mange andre i større grad praktisert prosessorientert skrivepedagogikk. Men det er likevel krevende å skulle følge 30 elevers skriveprosesser samtidig. Elevene gir respons på hverandres tekster, men det er fremdeles læreren som sitter på den viktigste vurderingskompetansen. Hverandre- og egenvurdering er fint, men fører ikke elevens skriveutvikling fremover på samme måte som norsklærerblikket. Forskning på respons sier dessuten at eleven bør få responsen mens hun er i prosessen. Det er ikke lett å få til! Og jeg må innrømme at det blir mest skriving i prosess på vg1 og vg2. Med vurderingsjaget på vg3 må til tider den gode skrivepedagogikken vike. Kan vi bruke generativ KI som bestanddel i en mer bærekraftig vurderingspraksis?

Det er allerede publisert en del forskning som undersøker hvordan avanserte språkmodeller kan bidra til læring i utdanningssammenheng. Særlig fremheves språkmodellenes evne til å kunne gi umiddelbar respons på elevenes/studentenes arbeider (Adiguzel et al., 2023, Hartono et al., 2023). Som nevnt over har mange norsklærere vegret seg for prosessorientert skriving, siden det er så arbeidskrevende. Kan smarte chatboter bidra til å lette lærerens arbeid med underveisvurderinger? Kan KI gi elevene mer umiddelbar respons og dermed bidra til mer læringsfremmende timing av responsen? Håpet er at språkmodellene skal kunne øve elevene i god tekstorganisering, i å trene opp mottakerbevissthet, i kildeføring, språkvariasjon og bruk av kommunikasjonsfremmende tekstbindere, med mer. Men det går et viktig skille mellom å bruke teknologien til å trene elever i selvstendig skriving og revidering av tekst, og det å bruke teknologien til å fikse på tekstene uten at eleven er direkte involvert i revideringsarbeidet. Derfor trenger vi programmer som er mer pedagogisk innrettet enn ChatGPT, Bing, Bard osv. Det er ikke realistisk at alle elever bruker verdens kraftigste universalverktøy til bare å utføre isolerte oppgaver, når det samme verktøyet kan skrive hele teksten for dem.

Det finnes heldigvis flere tilløp til utvikling av verktøy som kan gi tilbakemeldinger og hjelp, men uten å gjøre jobben som eleven bør gjøre selv. På det ikke-kommersielle nettstedet ai.randabergskolen.no finnes et verktøy der elever kan legge inn målene for en oppgave i tillegg til oppgaveformuleringen og sin egen besvarelse. Så får de en tilbakemelding på hva de har fått til og på hva de bør forbedre, med utgangspunkt i kriteriene/målene og oppgaveformuleringen. Jeg har testet tjenesten og synes den fungerer sånn passe bra. Man får noen gode, litt generelle råd og en del unyttig «fyllstoff», men det er også mye chatboten ikke fanger opp. Til en tekst proppfull av nynorskfeil gav den for eksempel tilbakemelding om at nynorsken var svært god. Samtidig glimter den tidvis til og trekker frem relevante eksempler fra besvarelsen for å forklare konkret hva skribenten selv bør endre på. Jeg tror elever kan ha nytte av slike verktøy ved å bruke dem i egen skriveprosess. Helst bør læreren selv kunne legge inn instrukser om hva chatboten skal gi tilbakemelding på. Uansett er min vurdering at lærerens tilbakemeldinger går chatbotene en høy gang. Feedback fra språkmodeller kan være et nyttig tillegg, men kan foreløpig ikke erstatte lærerens personlig tilpassede respons. Ellers er det avgjørende viktig at lærere får teste ut og vurdere slike verktøy grundig, før de implementeres i skoler, kommuner og fylker. Et hjertesukk rettet mot kommersielle aktører og tilbydere av digitale verktøy er at de begynner å være mer rundhåndede med prøvelisenser til lærere. Slik det er en selvfølge at vi får vurdere forlagenes læreverk, bør det være selvsagt at vi får teste ut digitale læringsverktøy i ro og mak, uten å måtte delta på visninger og salgsmøter. Hjertesukk slutt.

Bilde generert av DALL-E. Instruks: Surrealist, detailed painting, artificial intelligens in persona

MEN! Før vi kan komme skikkelig i gang med læringsfremmende bruk av generativ KI, er det noen rammefaktorer som må på plass. I dag er forskjeller mellom fylker og kommuner skrikende når det gjelder muligheter lærere har for å «lykkes» med KI i klasserommet. I noen fylker har lærerne gode, fleksible løsninger for tilgangsstyring (nettstyring) der de ikke bare kan skru nettet på og av, men i tillegg styre hvilke nettsider elever skal ha tilgang til. Andre steder har man dårlig fungerende eller ingen tilgangsstyring i det hele tatt. I noen fylker/kommuner er man i full gang med å utvikle egne KI-baserte chatboter elevene skal kunne bruke, uten bekymring for manglende personvern. I Vestfold og Telemark er en slik løsning allerede klar. Andre steder er ikke jobben påbegynt. Noen skoler har tilgang på verktøy og hjelpemidler andre bare kan drømme om. Dersom generativ kunstig intelligens faktisk vil transformere skolen, slik mange hevder, må vi i det minste få mulighet til å delta i forvandlingsprosessen på like vilkår. Vi trenger med andre ord politisk satsning på en likeverdig, digital infrastruktur og fagdidaktisk tilpassede verktøy som virker læringsfremmende, heller enn læringshemmende, for alle. ChatGPT er uredigert et dårlig verktøy i klasserom som ikke har mulighet til å styre elevenes digitale tilganger.

Det jeg nå ser ved gjennomlesning av teksten, er at det er vanskelig å beskrive pedagogisk bruk av KI isolert. For verktøyene hentes alltid inn som del av et faglig opplegg der målet ikke er bruk av generativ KI i seg selv. Det reflekterer nok en tro på at kunstig intelligente verktøy helst bør brukes slik vi bruker alle typer pedagogiske ressurser, digitale som analoge: Vi trekker dem inn etter behov og når det tjener formålet.

Kilder

Adiguzel, T., Kaya, M. H., & Cansu, F. K. (2023). Revolutionizing education with AI: Exploring the transformative potential of ChatGPT. Contemporary Educational Technology, 15(3), ep429. https://doi.org/10.30935/cedtech/13152

Hartono, W., Nurfitri, N., Ridwan, R., Kase, E., Lake, F., & Y. Zebua, R. (2023). Artificial Intelligence (AI) solutions in English language teaching: Teachers-Students Perceptions and Experiences. Journal on Education, 6(1), 1452–1461. https://doi.org/10.31004/joe.v6i1.3101