Tammikuun puolivälissä julkaistiin suuren mediahuomion saattelemana kiinalainen DeepSeek r1 –kielimalli, joka on johtavien yhdysvaltalaisten suurten kielimallien veroinen, mutta ilmeisesti kymmeniä kertoja energiatehokkaampi.
Lisäksi DeepSeekin mallin “painotukset”, eli sen käyttämä järkeilylogiikka, on julkaistu avoimella lisenssillä. Tämä tarkoittaa, että sen päälle voi jokainen helposti rakentaa omia mallejaan.
Helsingin sanomissa huomautettiin, että DeepSeekin malli ei suostu kertomaan Taivaallisen rauhan aukion väkivaltaisesta protestien tukahduttamisesta. Samoin mallin Taiwan-propagandalle on naureskeltu sosiaalisessa mediassa.
Kielimallien määrän kasvaessa niiden kulttuurierot ja erilaiset poliittiset kannat tulevat entistä selvemmin esiin.
Anthropic on yleishyödyllinen amerikkalaisyritys, joka rakentaa Claude-kielimalleja. Anthropic sanoo panostavansa erityisen paljon kielimallien eettiseen hienosäätöön. Filosofi Amanda Askellin työtä on Anthropicin kielimallien käyttäytymisen muokkaaminen. Hän kertoo, että tavoitteena on luoda mallista mahdollisimman avarakatseinen, jotta se pystyy ottamaan huomioon ihmisten erilaiset arvot ja uskomukset ja keskustelemaan näistä kunnioittavasti.
Eettisten järjestelmien vaihtelua eri kulttuureissa tutkineet antropologit ovat kuitenkin huomauttaneet, että ajatus avoimen keskustelun hienoudesta on kulttuurisidonnainen ja voi itsessään olla eettisesti ongelmallinen.
Esimerkki keskustelun kulttuurisidonnaisuudesta on Tyynenmeren kulttuureissa yleinen “läpinäkymättömyysoppi”. Tällä tarkoitetaan sitä, että toisten ajatuksia on mahdotonta tietää, ja niiden julkista spekulointia pidetään erittäin sopimattomana.
Antropologi James Laidlaw on kirjoittanut, että Tyynenmeren alueella toisten ajatusten rajaaminen keskustelun ulkopuolelle tarkoittaa sitä, että ihmiset arvostavat toisten itsenäisyyttä ja itsemääräämisoikeutta. Tällaisesta eettisestä ajatusmallista käsin tulkittuna lörpöttelevä kielimalli, joka luulee osaavansa puhua aiheesta kuin aiheesta kunnioittavasti, tuntuu lähinnä amerikkalaiselta kolonialismilta.
DeepSeek on puolestaan opetettu vaikenemaan Kiinan valtiolle epämieluisista poliittisista aiheista. Sekin on ongelmallista, mutta amerikkalaisten suuryritysten ja DeepSeekin mallien välillä on eräs suuri ideologinen eroavaisuus: DeepSeekin voi kuka tahansa kouluttaa vaikenemaan tai lörpöttelemään aiheesta kuin aiheesta, koska malli on julkaistu avoimella lisenssillä.
Vaikka yhdysvaltalainen OpenAI tarjoaa edullisempaa malliaan ilmaiseksi käyttäjille, niiden arkkitehtuuri ja painotukset ovat salaisia. Nähtäväksi jää, riittääkö tämä strategia amerikkalaiseen maailmanvalloitukseen.
Tuorein käänne kielimallien kulttuurisodassa nähtiin, kun OpenAI väitti DeepSeekin hienosäätäneen mallinsa käymällä keskusteluja OpenAI:n mallin kanssa. OpenAI on saanut tästä paljon pilkkaa osakseen, sillä OpenAI on itse käyttänyt luvatta valtavia määriä dataa kouluttaessaan kielimallejaan.
Näyttää siltä, että amerikkalaisyrityksetkin arvostavat ajattelun läpinäkymättömyyttä, ainakin silloin kun se palvelee heidän omia etujaan.
Toimitus
Artikkelikuva: Unsplash /Solen Feyissa
Luettavaa
- Keane, Webb 2015. Ethical Life: Its Natural and Social Histories. Princeton: Princeton University Press.
- Laidlaw, James 2013. The Subject of Virtue: An Anthropology of Ethics and Freedom. New York: Cambridge University Press.
- Laws, Megan 2023. Demanding from Others: How Ancestors and Shamans Govern Opacity in the Kalahari. Ethnos 88 (4): 702–723. https://doi.org/10.1080/00141844.2021.2007156.
- Mahmood, Saba 2011. Politics of Piety: The Islamic Revival and the Feminist Subject. Princeton: Princeton University Press.