Om kunstig intelligens og dens påvirkningen på arkitektfaget

Av Kyrre Sundal

Publisert 10. mai 2023

Illustrasjon i Midjourney

Hvordan fremstår selveste Le Corbusier med en dæsj kunstig intelligens? Les videre og finn ut!

Foto: Kyrre Sundal (illustrasjon i Midjourney)

Vi er midt inne i en teknologisk revolusjon hvor utviklingen innen kunstig intelligens (KI) skjer raskt. Hvordan kan dette påvirke vårt fag som arkitekter? Og blir vi arbeidsledig med det første? spør Kyrre Sundal.

Av Kyrre Sundal

For å starte med det jeg er sikker på: Jeg er sikker på at denne artikkelen er utdatert i det den publiseres på Arkitektur.no. Utviklingen innen KI går fort, noen vil mene for fort. Tusen KI-eksperter vil derfor sette KI-utviklingen på pause. Politikere i EU og i USA jobber intenst med hvordan den nye teknologien skal reguleres. Men hver uke fortsetter det å komme stadig nye KI-verktøy som løser små og store utfordringer folk og selskaper skulle ha. Hvordan vil den enorme utviklingen innen KI påvirke arkitekturfaget?

Bare siden jeg begynte å tenke på å skrive denne artikkelen i starten av mars skrev Bill Gates etter å ha fått demonstrert ChatGPT:

«In my lifetime, I’ve seen two demonstrations of technology that struck me as revolutionary» ...  «I knew I had just seen the most important advance in technology since the graphical user interface».

OpenAI har kommet med versjon 4 av deres ChatGPT og Midjourney har lansert sin femte versjon. Og det er bare to av alle disse nye KI-verktøyene. Det heteste i skrivende stund er AutoGPT – et verktøy som setter flere KIer i arbeid med å løse samme oppgave, gjennom automatisering og selvstendiggjøring.

I starten av april publiserte Goldman Sachs en rapport hvor de anslo at KI ville føre til at 300 millioner jobber i Vesten ville bli effektivisert bort. I samme rapport gjør de også et poeng av at 60 prosent av dagens jobber ikke fantes i 1940. Mange er også interessert i hvordan KI vil endre arkitekters hverdag. Da Spinning Jenny ble utviklet i 1760-årene, som en av de tidlige nyvinningene som ledet til den industrielle revolusjon, var folk usikre på hva de skulle gjøre fremover.

Mennesket har vist seg å være overraskende kreative, og har klart å finne nye måter å jobbe på når nye teknologiske kvantesprang har funnet sted. Den hotteste nye jobben nå, ifølge noen, er prompt engineering. Det vil si de som er flinke til å skrive «kommandoer» til KIen. Og vi mennesker er også gode til å overvurdere hvor stor endring som vil kunne skje i det korte bildet, og undervurdere endringene som skjer i det lange bildet.

KI, og herunder machine learning, er egentlig ikke noe nytt i arkitektbransjen. Mange er sikkert kjent med Spacemaker. I en promovideo fra 2020 sa Håvard Haukland:

«Spacemaker is the world’s first commercial platform that uses artificial intelligence to help architects, urban planners and developers make better decisions, faster».

Faster er nøkkelordet her.

Alt kan kvantifiseres

Gjennom en lang periode i samfunnet hvor en ønsker å kunne telle alt (New public management, sa du?), har parametriske designverktøy (som for eksempel Grasshopper til Rhino) vist seg å være veldig effektive. I dag er det - for mange i bransjen - viktig å kunne vise til data for å overbevise om at et prosjekt er bra. Men blir det nødvendigvis et godt prosjekt bare fordi dataene sier det? Og hvem er det som bestemmer parameterne man måler?

Å tegne et større bygg i dag er en komplisert prosess. Iblant er det vanskelig å tenke seg at det lot seg gjøre å oppføre et bygg før i tiden. Det er en bestiller som har sine mål for prosjektet, et kobbel med rådgivere som har sine mål, arkitekten har mål, samfunnet har mål, miljøet har mål, alle har et mål de ønsker å oppnå. Listen er lang. I et slikt komplekst system kan det være tryggere å søke seg mot hva dataene sier, for data kan vel ikke lyve?

Spacemaker var et av de første selskapene i Norge som skulle revolusjonere arkitekt- og byggebransjen. Og det har de til dels gjort.

«Vi er det første selskapet i verden som har utviklet en slik teknologi. Målet er at det digitale verktøyet skal revolusjonere måten man utvikler byer og tettsteder på», sa Håvard Haukeland til bygg.no i 2017.

Første gang jeg fikk se Spacemaker sine svar, var for 4-5 år siden da en større boligutvikler brukte Spacemaker i evalueringen av et parallelloppdrag. Vi var ett av fire kontorer som var invitert til å tegne et større boligprosjekt på en litt kronglete tomt. Etter endt parallelloppdrag ble vi invitert til en presentasjon hvor vi skulle få presentert «fasit». Det viste seg at ingen av arkitektene hadde tenkt riktig. For det «riktige» var å bygge veldig høyt mot et stort landskapsrom (noe som sikret at selve prosjektet fikk best kveldssol).

Så kan man spørre seg hvorfor ingen av oss arkitekter klarte å komme opp med dette selv. Våre analyser vektla utsikt og en større romlig sammenheng enn det modellen til Spacemaker gjorde på den tiden.

Senere har Spacemaker kommet i ny versjon (og blitt solgt til Autodesk), som har gått litt bort fra dette systemet-kan-generere-det-helt-riktige-svaret, til å bli et veldig godt og mye brukt analyseverktøy hvor vi hele tiden validerer konseptene våre ut fra de gitte parametere.

Andre aktører har også meldt seg, som for eksempel Parallelo (utspring fra Tag arkitekter), som skal effektivisere boligplanene med noen prosenter, og Arealize AI som genererer plantegninger uten involvering av eksterne, og reklamerer med «Du trenger ikke være arkitekt for å lage plantegninger». Stjepan Mikulic, som jobber hos BIG, har laget en oversikt over KI-verktøy for AEC-bransjen.

I skrivende stund nærmer seg listen seg 250 ulike KI-verktøy.

(H)AI-en kommer!

KI er ikke noe nytt. Du er omgitt av det hver dag allerede; når du leser og skriver epost; skriver tekstmeldinger; bruker nettjenester som for eksempel Google, Facebook og Instagram. Det nye nå er at utviklingen går veldig fort fremover, og at KI-verktøyene er blitt tilgjengeliggjort for massene. Nå kan du ha en samtale med ChatGPT og føle at den ofte gir deg fornuftige svar (ChatGPT er en stor språkmodell, vær obs på at modellen også kan generere svada, men svada som kan høres veldig riktig ut – den hallusinerer - så vær kildekritisk!).

I tillegg finnes diffusjonsmodeller, hvor Dall E 2, Stable Diffusion og Midjourney er de mest kjente i skrivende stund. Diffusjonsmodellene kan lage bilder fra tekstbeskrivelser.

I mars begynte det å svirre rykter på kontoret om at det var en arkitekt i Oslo som lagde utrolig flotte bilder med Midjourney. Dette viste seg å være Espen Egeland, eller @diskret.ark som han kaller seg på Instagram. Jeg ble imponert over hva han hadde fått til med Midjourney, så jeg inviterte han på kaffe i Bymad i Pilestredet for å høre hva han tenkte om KI og Midjourney, og hvordan dette kan påvirke bransjen vår.

Iillustrasjon i Midjourney
Foto: Espen Egeland/@diskret.ark (illustrasjon i Midjourney)
Iillustrasjon i Midjourney
Foto: Espen Egeland/@diskret.ark (illustrasjon i Midjourney)

Vanskelig å styre

Espen fortalte han hadde begynt å bruke Midjourney for å utforske hva tekst-til-bilde-teknologien kan, og finne måter å innlemme det i designprosesser. Teknologien muliggjør en ny måte å utforske former, materialer og beskrivelser av arkitektur. For å kunne få gode bilder ut av tjenesten er det en fordel å forstå arkitektur og være god til å beskrive hva du vil ha skapt.

Og det er her noe av utfordringen i skrivende stund står med diffusjonsmodellene; de er vanskelige å styre slik vi som arkitekter er vant til at vi kan forme prosjekter i tradisjonelle 3D-verktøy. Vi blir til dels prisgitt hvordan modellen tolker det du prøver å beskrive.

Illustrasjon i Midjourney
Foto: Espen Egeland/@diskret.ark (illustrasjon i Midjourney)
Illustrasjon i Midjourney
Foto: Espen Egeland/@diskret.ark (illustrasjon i Midjourney)

Fra ulike vinkler

Espen har gjennom mye prøving og feiling klart å knekke koden, og lager nå noen utrolig flotte serier med bilder, som ved første øyekast ser ut som det samme huset bare sett fra ulike vinkler. Men ser man nøye etter er det alltid en viss variasjon på bygget sett fra ulike vinkler.

Espen avsluttet praten med en refleksjon: «Tap av kontroll i denne sammenheng bør ses på som en fordel. Man mister presisjonen til 3D modellering, men får mulighet å utforske i et langt bredere spekter og åpner muligheter for å finne ting man ikke visste man ville ha. Jeg tenker at 3D modellering og text-to-image er to veldig forskjellige verktøy som ikke bør konkurrere med hverandre og heller jobbe sammen i en sammensatt prosess».

Illustrasjon i Midjourney
Foto: Espen Egeland/@diskret.ark (illustrasjon i Midjourney)
Illustrasjon i Midjourney
Foto: Espen Egeland/@diskret.ark (illustrasjon i Midjourney)

Åpner opp muligheter

Utfordringen med å skape et konsistent uttrykk ved bruk av KI er altså bare en begrensning nå – her tror jeg utviklingen vil gå raskt, slik at man om ikke alt for lenge kan få et konsistent formspråk fra ulike vinkler i Midjourney. Dall E 2 og Stable Diffusion er per dags dato bedre på å lage bilder som baserer seg på geometri man forer inn i KIen.

Tilbake til AutoGPT - den kan, for eksempel, brukes til å automatisere prosessen med å generere designforslag for en bygning. Ved å definere et søkeområde for designparametere, kan AutoGPT generere en rekke designalternativer. Den vil da evaluere hver av designalternativene og se om de ser bra ut ved hjelp av kriterier som estetikk, funksjonalitet, miljømessig bærekraft og mer. Til slutt vil AutoGPT gi oss forslagene som fungerer best basert på kriteriene vi har satt. Arkitekter kan potensielt bruke dette for å få mange gode ideer til hvordan en bygning kan se ut, og hvordan den kan fungere.

Det er spennende hvordan nye verktøy åpner opp muligheter for nye arbeidsmetoder. Der man tidligere saumfarte Pinterest for inspirasjonsbilder, kan man nå lage sine helt egne. Og man kan forme referansene til å bli akkurat slik man selv vil, innenfor KIens rammer. Spørsmålet blir da hva er det som er ekte? Hva svarer du når en oppdragsgiver spør om hvor hen kan se bygget du har referert til? Men er det egentlig så viktig at alt alltid må være ekte?

KI versus menneske

Den canadiske arkitekten, og nå arkitekt-youtuberen, Dami Lee lagde en fiktiv konkurranse på hennes YouTube-kanal: AI vs Architect. Og det var Discord-følgerne hennes som skulle avgjøre hvem som vant. Konkurransen gikk ut på å designe et 280m2 hus i et skrånende terreng og ble delt opp i tre faser: plantegning, visualiseringer og beskrivelse av konseptet i tekstform. Spoiler alert: KIen gjorde storeslem, og vant alle tre fasene.

Tegningene KIen (i dette tilfellet Midjourney) lagde så flotte ut ved første øyekast, men når man studerer de ser man at det er mange ting som ikke går opp. Visualiseringene som KIen lagde er stemningsfulle bilder. Men de har ikke nødvendigvis noe med tegningen å gjøre. Og teksten, skrevet med ChatGPT, er faktisk overraskende god. Med tanke på at vi er i en tidlig fase av disse nye KI-verktøyene, og utviklingen skjer så raskt, er det spennende å se hva de kan levere om et år eller tre.

Men, tilbake til Midjourney. Jeg var også nødt til å gjøre noen tester:

Illustrasjon i Midjourney

Prompt i Midjourney: /imagine Architectural photography of a cultural building in the desert designed by Snøhetta. --v 5.

Foto: Kyrre Sundal (illustrasjon i Midjourney)

Tolv ord

Med tolv ord lagde Midjourney disse fire bildene. Dette tok meg cirka fem sekunder å skrive inn kommandoen, ett minutt å vente på resultatet, og voilà: fire skisser på hvordan et kulturbygg plassert i en ørken, designet av Snøhetta kunne sett ut. Hvert fall slik Midjourney tolker det.

Og jeg må si, flere av disse kan minne om formspråket til Snøhetta. Så, hvordan vet Midjourney hvordan et Snøhetta-bygg ser ut? Modellen er trent opp på bilder fra internett. Akkurat hvilke bilder de har trent modellen på vil de ikke opplyse (av frykt for å bli saksøkt på grunn av opphavsrett?).

Jeg antok at den kjente mest til de store, internasjonale arkitektkontorene og deres arkitektoniske stil, så derfor falt valget på Snøhetta for første test.

Le Corb vant kirke-konkurransen!

Gaute Brochmann skrev i Morgenbladet den 15. mars: «...For jeg er ganske sikker på at vi om ikke lenge vil få arkitektkonkurranser der vinneren er generert av en KI med liten menneskelig påvirkning. Da står vi ved et vannskille i faget, for å si det forsiktig.»

Vel, vi er ikke helt der at man kan lage et komplett konkurranseforslag kun ved hjelp av KI ennå.

Stillbilder er en ting, men det finnes også KIer som kan kopiere stemmer og KIer som kan lage videoer av stillbilder. Så, for å gjøre en veldig rask test av hvor KI-verktøyene står i dag fikk jeg hjelp av min gode venn Le Corb til å lage vinnerforslaget til kirkekonkurransen i Trondheim.

Vi startet i Midjourney hvor vi fikk laget et portrettfoto av Le Corb. Deretter dro vi over til ChatGPT4 for å skrive en finfin takketale. Det viste seg at Le Corb ikke var så begeistret for premissene for konkurransen, så han tenkte utenfor boksen – nemlig gjenbruk av dagens kirke – fremfor å bygge en ny «grønn katedral». I tillegg kom han med et lite stikk til arrangørene av konkurransen, siden prosjektet mangler finansiering. Men, tro det eller ei, på tross av dette vant hans visjon frem.

Etter litt copy-paste i en KI som lager lyd fra tekst, avsluttet vi med å sette alt sammen til en liten film. Det tok Le Corb, KIene og meg en halvtime å lage alt dette.

Det viste seg at juryen var enig med han, bare se filmen under (du kan lese hele takketalen etter artikkelen).

Fra 11 uker til 11 sekunder

Det har i det seneste blitt skrevet en del artikler om at mangelbrevene fra PBE kommer sent, og ofte oppleves som uriktige. Hvordan kan man bruke ny teknologi for å effektivisere denne prosessen?

Jeg tror det ikke er mange årene til vi kan få en PBE-KI som kan lese gjennom hele søknaden og sende ut eventuelle mangelbrev i løpet av 11 sekunder, fremfor å vente til dagen før 12-ukersfristen går ut. Dette kunne frigjort mange kloke hoder hos kommunen til å jobbe med andre, og mer samfunnsnyttige ting, enn å kontrollere søknader for mindre feil.

Det sagt, så tror jeg det fortsatt vil være behov for menneskelig kontroll av det KIen sier og gjør, hvert fall en stund fremover.

En mulig fremtid

Det er naturlig å bli skremt av hva den nye teknologien kan føre med seg. Det er en menneskelig reaksjon. For er det så utenkelig at man om noen år ser at en boligutvikler etter å ha kjøpt seg en fin tomt legger tomteinformasjonen inn i Spacemaker. Så lar man den jobbe noen sekunder før den kommer med det korrekte volumsvaret for akkurat denne tomten. Deretter tar man volumene inn i Parallelo og får laget den perfekte sammensetningen av to-, tre- og fireroms, med og uten lailaløsning, ut fra det megler-KIen hadde av ønsker.

Så kommer ingeniørene inn i prosessen, men denne gangen i form av en KI (som Consigli) og lager det mest effektive bære- og ventilasjonssystemet verden har sett. Alt står over hverandre, ingen ting er gjort vanskeligere enn det trenger. Og til slutt må man jo ha en fasade på det hele, så hvorfor ikke la konsernsjefen få «tegne» denne gangen? Hen vipper opp den bærbare PC-en og skriver inn «/imagine The most beautiful housing project ever!» i Midjourney, og ut kommer det vakreste vi noensinne har sett. Alt designet av KI fra start til slutt, kun med noen få museklikk av et menneske.

Men tror jeg på det? Nei, jeg gjør egentlig ikke det, ikke i det korte bildet. Jeg tror ikke arkitekter blir arbeidsledige med det første, men at mange kanskje får andre og nye oppgaver, hvor også KI er med som co-pilot eller samarbeidspartner inn i ulike prosesser og prosjekter.

Samtidig er byggebransjen en konservativ bransje. Vi kommer til å bruke de nye systemene som kommer, men vi må passe på at vi mestrer de og er i førersetet. For ennå klarer ikke en KI å holde den mellommenneskelige kontakten som vi vet er viktig for å få til gode prosjekter, og den har enn så lenge ikke en velutviklet kreativitet, selv om noen vil være uenig i akkurat det siste. For forskere hos Microsoft mener at ChatGPT4 allerede nå viser tegn til å kunne resonere og løse mer komplekse problemer.

Å jobbe med KI som verktøy stiller mange av de samme kravene til oss mennesker som parametrisk design har stilt. Det er i siste ende vi som må gjøre valg om hvilke parametere som skal være førende, eller hvilke genererte former eller plantegninger som til enhver tid gir det riktige arkitektoniske verket. Så, jeg tror ikke vi blir erstattet av KIene med det første, men kommer til å bruke det som gode verktøy.

Men så en dag kommer AGI (artificial general intelligence), og da kan vi pensjonere oss alle sammen.

 

Kyrre Sundal

Kyrre Sundal er menneske, arkitekt og partner i Mad Arkitekter.

Foto: privat

Le Corbs takketale (skrevet av ChatGPT4):

Ladies and gentlemen, esteemed members of the jury, fellow architects, and esteemed citizens of Trondheim,

I am deeply honored and humbled to accept the first prize in this prestigious architectural competition for the church in Charlottenlund. I would like to express my utmost gratitude to the jury for recognizing and embracing the vision that I have presented in my proposal.

From the outset, I read the competition brief as a greenwashing project, with the "green cathedral" concept being more of a distraction than a genuine solution. Upon closer examination, it became clear that the project's finances were not yet in place, and it was uncertain whether it would even move forward.

As architects, we devote countless hours to our work, pouring our hearts and souls into creating meaningful designs. It is disheartening to see so many of my fellow architects investing their time and expertise into a project with such an uncertain future. However, I believe that we can still learn from this experience and use it as a catalyst for positive change.

In light of these circumstances, I chose to propose the most environmentally, socially, and economically sustainable solution by reusing the existing church, which was built in 1973. By remodeling and repurposing the structure, we not only preserve the church's heritage but also significantly reduce the project's cost and environmental impact.

Furthermore, I decided to leave the plot, originally designated for the new church, to be used for activities benefiting the youth in the neighborhood. This decision prioritizes the needs of the community and makes the best possible use of available resources.

In order to further minimize the environmental footprint and promote local talent, I am committed to collaborating with young, local architects on this project. It would be irresponsible for me to travel back and forth between Trondheim and Paris, increasing the carbon emissions associated with the project. By working closely with local professionals, we can ensure that the church in Charlottenlund becomes a true reflection of the community's spirit, culture, and values. 

By choosing this path, I have created the least expensive project while still addressing the core objectives of the competition. Although the competition itself may have been based on uncertain foundations, I hope that my proposal can serve as a testament to the importance of environmentally, socially, and economically responsible design.

Thank you, once again, for this incredible honor, and for placing your trust in me as the architect of this important project. I eagerly look forward to collaborating with the people of Trondheim, the wider architectural community, and the talented local architects to bring this vision to life, serving not only the congregation but also the youth and the community at large.

Merci beaucoup