Näin hyödynnät ajattelun perusliikkeitä tekoälyn kehottamiseen

Tiivistelmä

Paranna kehotteitasi näillä neljällä ohjausliikkeellä:

  • Konteksti: Rajaa tekoälyn näkökulma ja yleisö.
  • Tasot: Sido ylätason tavoite ruohonjuuritasoon.
  • Kytkentä: Rakenna loogisia ketjuja ja yllättäviä yhdistelmiä.
  • Olennaisuus: Pakota kone ytimekkyyteen toistuvalla tiivistämisellä.

Vuoropuhelu tekoälyn kanssa terävöittää samalla omaa ajatteluasi.

Tässä artikkelissa

Ajattelun perusliikkeet huomion ohjaajina

Ajattelun perusliikkeet on käytännön teoria oman mielen huomion ohjaamiseen. Jokainen perusliike toimii huomion ankkurina: ideana on, että kun huomio on oikein suunnattu, ajattelu seuraa perässä. 

Miten tämä liittyy tekoälyyn? No, kehottamalla tekoälyä suuntaat sen huomiota valtavassa merkitysten avaruudessa. 

Nykyiset kielimallit perustuvat arkkitehtuuriin, jonka ytimessä aivan kirjaimellisesti on huomiomekanismi (self-attention). Se tarkoittaa, että malli laskee matemaattisesti, mihin merkityksiin sen pitää kiinnittää huomiota. Ja huomaa: tämän laskennan se perustaa täysin niihin sanoihin, jotka sinä itse olet valinnut kehotteeseen – eli siihen tekstiin, jolla pyydät tai kerrot asioita tekoälylle.

Hyvä kehote pakottaa koneen huomiomekanismin painottamaan juuri niitä merkityksiä, jotka ovat asiasi kannalta olennaisia. Jos “huomion ankkurit” puuttuvat eli kehotteesi on hyvin yleisluontoinen, koneen huomio leviää ympäri valtavaa merkitysten avaruutta. Lopputulos on tällöin tilastollinen keskiarvo siitä kaikesta – sitä geneeristä pyörittelyä, jota toisinaan kutsutaan halventavasti tekoälyliejuksi (AI slop).

Tekoälyn kehottamiseen tarvittavat taidot ovat osin yllättävänkin samankaltaisia kuin oman mielen ohjaamiseen käytettävät taidot. Toki se ”mieli”, jota ohjataan, on ihmisellä ja koneella perustavanlaatuisesti erilainen. Silti eroavuuksia voi olla helpompi hahmottaa yhtäläisyyksien kautta.

Perusliikkeet kehotteen kirjoittamisessa

1. KONTEKSTI (Näkökulma ja kehys)

Koko inhimillisen kielen ja viestinnän ydin on ymmärrys siitä, kuka puhuu, kenelle ja missä tilanteessa. Tekoälyltä puuttuu tähän liiittyvä hiljainen ymmärrys. Toisin kuin ihminen, se ei lue rivien välistä eikä tiedä asioita, joita et sille erikseen kerro.

Koneelle konteksti on luotava keinotekoisesti. Yleisimmät tavat tehdä tämä ovat 

  • roolin antaminen (esim. ”toimi kokeneena copywriterina”)
  • yleisön rajaus (esim. ”kirjoita tämä sellaiselle-ja-sellaiselle asiakkaalle”). 

Tällaiset rajaukset ankkuroivat tekoälyn merkitysavaruuteen tavalla, joka on kriittisen tärkeä lopputuloksen kannalta. 

Kuvitellaan, että olet tuomassa markkinoille uutta kuluttajille suunnattua palvelua. Jos kehotat tekoälyä vain ”kirjoittamaan myyntitekstin uudesta palvelusta”, koneen huomio leviää kaikkialle. Tuloksena on geneerinen, ylisanoja vilisevä mainospuhe, joka ei puhuttele ketään.

Sinun on pakotettava kone tiettyyn katselukulmaan. Aseta kehotteeseen näkökulmaa vaativia ankkureita:

Toimi skeptisenä ja ylikuormittuneena ruuhkavuosia elävänä vanhempana, joka vihaa tyhjiä lupauksia ja jolla ei ole yhtään ylimääräistä aikaa uusien asioiden opetteluun. Arvioi tätä palvelukuvausta hänen näkökulmastaan. Mitkä kolme asiaa saavat hänet lopettamaan lukemisen heti, ja mikä on ainoa argumentti, joka voisi aidosti herättää hänen kiinnostuksensa?

Hakusanoja, joilla löydät tästä lisää tietoa: role prompting, audience prompting

2. TASOT (Abstrakti ↔ Konkreettinen)

Ihmisen kannattaa ohjata sekä omaa ajatteluaan että tekoälyn työskentelyä liikkumaan ylätason tavoitteen ja ruohonjuuritason toteutuksen välillä. 

Esimerkiksi tekstin tyyliä määriteltäessä kone hyötyy konkreettisista esimerkeistä. Sellaiset määritteet kuin ”helposti lähestyttävä” ovat abstrakteja, ylätasoisia ja monitulkintaisia. Tekoäly tarvitsee konkreettisia esimerkkejä tietääkseen, mitä “helposti lähestyttävä” tarkoittaa juuri sinun tapauksessasi. (Jos haluat etsiä lisätietoa tästä, googlaa “few-shot prompting”.)

Toisaalta tasojen välistä liikettä tarvitaan yhtä lailla toiseen suuntaan, eli alhaalta ylös. Tätä liikettä tarvitaan erityisesti kahdessa eri tilanteessa:

A. Datan nostaminen oivallukseksi

Kuvitellaan, että haluat löytää sadoista asiakaspalautteista aidon oivalluksen (insightin). Jos kehotat tekoälyä vain tiivistämään palautteet, käy helposti niin että se tarjoaa latteuksia: ”Asiakkaat toivovat nopeampaa palvelua ja parempaa käyttöliittymää”.

Kytke konkreettiset asiakaspalautteet (alataso) kohti ylempää abstraktiotasoa – pois siitä, mitä asiakkaat sanovat, kohti sitä, mitä he tarkoittavat. Aseta kehotteeseen tasonvaihtoa vaativia ankkureita:

Älä listaa ominaisuuksia, joita asiakkaat pyytävät (alataso). Analysoi palautteita (alataso) ja erittele, mitä todellista ongelmaa he yrittävät ratkaista (ylätaso) käyttäessään palveluamme. Etsi datasta kohtia, joissa asiakas on ongelmansa ratkaisemiseksi joutunut keksimään oman purkkaratkaisunsa (alataso).

B. Fokuksen palauttaminen työskentelyn aikana

Alhaalta ylös -liikettä tarvitaan myös silloin, kun työskentelet tekoälyn kanssa samassa keskustelussa pidempään. Koneilla on taipumus luisua vähitellen takaisin helppoihin, ilmeisiin ratkaisuihin ja hukkua yksityiskohtiin. Ne kadottavat alkuperäisen ylätason vision, johon työllä pyritään.

Tällöin on sinun tehtäväsi vetää tekoäly ruohonjuuritasolta takaisin ylös tavoitetasolle: ”Hetkinen, nyt menimme liian syvälle yksityiskohtien viilaamiseen. Palataan isoon kuvaan: miten hyvin tämä ehdottamasi luonnos vastaa sitä tavoitetta, jonka alussa määrittelimme?”

3. KYTKENTÄ (Logiikka, ketjuttaminen ja yhdistäminen)

Jos ihmiselle on tyypillistä oikoa mutkissa ja tehdä suoraviivaisia päätelmiä, niin on tekoälylläkin. Kielimalli ei järjestelmällisesti pohdiskele asiaa loogisin askelin taustalla, vaan usein loikkaa suoraan tuottamaan vastausta.

Jos koneen halutaan käyttävän koko päättelykykynsä potentiaalia, sen tehtävä on pilkottava osiin ja vaiheistettava.

Esimerkiksi näin:

1. Lue kohdesegmentin ja palvelun kuvaukset. 2. Kirjoita ensin näkyviin lyhyt analyysi: mitä palvelun ominaisuuksia juuri tälle kohderyhmälle kannattaa korostaa ja miksi? 3. Vasta kun olet kirjoittanut tämän analyysin auki, laadi sen pohjalta luonnos uutiskirjenostosta.

Kun vaadit konetta avaamaan välivaiheet (chain-of-thought prompting), nämä askeleet muuttuvat näkyväksi tekstiksi. Ne toimivat uusina ankkureina. Näin pakotat tekoälyn huomiomekanismin laskemaan seuraavan askeleen aina tiukasti edellisen askeleen perusteella, eikä se pääse karkaamaan suoraan johtopäätökseen, mikä olisi sille luontaista.

Entä kun kone päättelee itse? Monet kielimallit osaavat yhä useammin tehdä tällaista loogista ketjutusta taustalla automaattisesti. Käyttäjän näkökulmasta on kuitenkin sattumanvaraista, milloin näin tapahtuu (ellei käytetä erityistä deep reasoning -mallia) ja miten se toteutetaan. Varsinkin silloin, jos rakennat toistuvaan käyttöön tarkoitettua tekoälyagenttia tai assistenttia, ketjutus ja täsmälliset vaiheet on paras määritellä itse.

Toisaalta voit pyytää tekoälyä myös testaamaan oman tekstisi logiikkaa. Voit kysyä: ”Arvioi kriittisesti, miten vahvaa argumentointini tässä on. Mihin tekninen asiantuntija voisi tässä puuttua?” Tällä liikkeellä pakotat tekoälyn jäljittämään argumentaatiosi polun ja etsimään siitä loogiset ristiriidat tai sokeat pisteet.

Ketjuttamisen ja logiikan ohella kytkentä voi olla myös yllättävien asioiden yhdistämistä. Kielimalli on rakentanut valtavan kartan sanojen ja asioiden merkityksistä, ja siksi se pystyy yhdistämään hyvinkin kaukana toisistaan olevia ideoita.

Tätä voi hyödyntää luovana moottorina. Kokeile kehottaa tekoälyä tekemään epätodennäköinen kytkentä:

Rinnasta uusi ketterä tuotekehitysmallimme jazz-kvartetin improvisaatioon. Selitä tämän metaforan avulla tiimille, miksi mikromanageeraus ja tiukka nuoteista soittaminen joudutaan nyt hylkäämään, ja mitä se vaatii yksilön reagointikyvyltä?

Tämä liike pakottaa tekoälyn ristiinvalottamaan kahta erillistä aluetta merkitysavaruudessa, mikä voi tuottaa omaankin ajatteluun aivan uudenlaisia, tuoreita avauksia.

4. OLENNAISUUS (Signaali vs. kohina)

Tekoäly ei luonnostaan tiedä, mikä on tärkeää sinulle. Olennaisuuden ujuttaminen tekoälyn ajatteluun onkin yksi AI-ajan asiantuntijan tärkeimpiä tehtäviä. 

Ensimmäinen olennaisuuden liike tapahtuu jo kohdassa 1 eli kontekstin määrittelyssä. Se on jo itsessään suuri olennaisuusvalinta, joka rajaa, mitä katsotaan.

Toisaalta tekoälyn huomion ohjaaminen olennaiseen tapahtuu usein myös negatiivisen kautta: asetat ankkureita, jotka kertovat koneelle, mihin suuntaan se ei saa katsoa. (Jos haluat etsiä lisätietoa tekniikoista, googlaa negative prompting tai constraint prompting.)

Kone tarvitsee apua myös hieman yllättävässäkin asiassa. Tiivistämistä pidetään usein tekoälyn erityisenä vahvuutena. Mutta tekoäly ei luonnostaan ole erityisen hyvä tiivistämään tekstejä niin, että jäljelle jäisi nimenomaan olennainen asia. Jos sanot tekoälylle vain ”tiivistä tämä raportti”, kone tekee laiskan ratkaisun: sanamäärä vähenee, mutta pois jää yhtä lailla tiukkaa asiaa kuin täyteilmauksiakin.

Kone täytyy erikseen pakottaa keskittymään olennaiseen esimerkiksi iteratiivisen tiivistämisen (chain-of-density) avulla:

Tiivistä tämä teksti täsmälleen 80 sanaan. Tee sen jälkeen kolme uutta versiota. Pidä sanamäärä joka kierroksella tiukasti samana, mutta korvaa joka kerta kuvailevia täytesanoja alkuperäisen tekstin olennaisilla asioilla. Valitse nuo olennaiset faktat ja asiat aina niin, että tiivistelmä soveltuu [käyttöön X, kohderyhmälle Y].

Näin saat koneen puristamaan tekstin informaatiotiheyden äärimmilleen. 

Huomaa: Tekoäly osaa kyllä puristaa tekstistä esiin sen ytimen, mutta lopputuloksen olennaisuus on aina väistämättä sidoksissa alkuperäisen aineiston laatuun. Kone ei myöskään kertomatta tiedä, mihin todelliseen tarpeeseen tekstiä ollaan viemässä. Siksi vastuu siitä, onko esiin nostettu tieto aidosti merkityksellistä juuri kyseisessä tilanteessa, pysyy viime kädessä aina ihmisellä.

Iteroinnin voima: ankkuroinnin ei tarvitse onnistua kerralla

Etukäteen on vaikea tietää tarkalleen, mihin koneen huomio ensimmäisellä yrityksellä tarttuu. Siksi ensimmäiseltä, huolellisestikaan ankkuroidulta kehotteelta ei välttämättä kannata odottaa täydellistä lopputulosta. Tavoitteena on pikemminkin tuoda tekoäly oikealle pelikentälle.

Kun olet asettanut vahvan kontekstin (liike 1) ja kone on oikeiden asioiden äärellä, alkaa varsinainen työ. Nyt sinulla on käytössäsi nopeasti reagoiva työpari, jota vasten voit alkaa haastaa, testata ja tarkentaa omaa ajatteluasi iteratiivisessa vuoropuhelussa.

Käytä perusliikkeitä keskustelun ohjaamiseen: Jos koneen tuottama teksti jää yläpilveen, pyydä seuraavassa viestissä yhtä konkreettista esimerkkiä (liike 2). Jos logiikka sinusta ontuu, vaadi konetta purkamaan juuri antamansa vastaus osiin ja arvioimaan sitä itse (liike 3).

Toisin sanoen: Kun tekoälyn tuottama vastaus on huono tai epätarkka, älä vain pyydä sitä ”yrittämään uudelleen”. Pysähdy ja diagnosoi, miltä osin jätit koneen huomion ankkuroimatta – tai mikä omassa tavoitteessasi on vielä sumeaa:

  1. Oliko konteksti liian laaja, jolloin koneen huomio hukkui epäolennaiseen dataan?
  2. Oliko taso väärä – puuttuivatko konkretian kiintopisteet, jolloin huomio jäi yläpilveen?
  3. Oliko kytkentä poikki – pääsikö koneen huomio loikkaamaan suoraan johtopäätökseen ja ohittamaan loogisen päättelyn vaiheen? Ovatko johtopäätökset kestäviä?
  4. Hukkuuko olennainen – tarvitseeko konetta auttaa ankkuroimaan huomio olennaiseen?

Tavoitteellinen keskustelu tekoälyn kanssa on jatkuvaa huomion paimentamista askel askeleelta kohti lopullista maalia.

Ankkuroinnin syvempi arvo: oman ajattelun kirkastuminen

Entä jos kaikki yllä mainitut asiat ovat kunnossa – olet asettanut ankkurit täydellisesti – mutta tulos on silti käyttökelvoton? Tässä kohtaa on tärkeä ymmärtää teknologian rajat.

Kielimallit eivät ole kaikkitietäviä, eikä niiden päättely ole täydellistä. Jos yrität tehdä jotain, mikä ylittää tekoälyn kyvyt (liittyen esimerkiksi erityisalan asiantuntemukseen, matematiikkaan tai tilalliseen hahmottamiseen), se alkaa hallusinoida arvaamalla. Aina vika ei siis ole huonossa ohjauksessa, vaan siinä, että malli ei kerta kaikkiaan taivu kaikkeen.

Mutta huolellisessa ankkuroinnissa piilee vielä lopputuotostakin syvempi arvo. Kun pakotat itsesi määrittelemään tarkan katselukulman ja erottamaan ison kuvan yksityiskohdista sekä olennaisen epäolennaisesta, oma ajattelusi kirkastuu usein jo ennen kuin edes painat enteriä.

Tekoälyn epäonnistunutkin vastaus voi olla arvokas – se osoittaa, missä ajattelu tai tehtävänanto on vielä sumea. Jokainen tällainen iterointikierros on pohjimmiltaan kognitiivista treeniä. Se pakottaa haastamaan omat oletukset ja kehittää kykyä ajatella kirkkaammin ja jäsennellymmin.

Lue lisää

Tämä artikkeli pohjautuu kehittämääni Ajattelun perusliikkeet -malliin. Voit lukea tarkemman kuvauksen mallin filosofiasta ja viitteistä kognitiiviseen psykologiaan ja kielitieteisiin: eevaoorni.fi/ajattelun-perusliikkeet/

Samankaltaiset artikkelit

Vastaa