Kategoriarkiv: Artificiell intelligens

Har artificiella varelser funnits i hundratals år?

Det hävdas i denna podcast med professor Runciman. Hans argument är enkelt: stater och företag är artificiella varelser som fattar beslut och gör det utan att vi har kontroll över dem. Det är en tes som tycks som gjord för att greppa tanken, med sensationella övertoner. Men det är intressant att översätta en del av de problem som möter oss i AI in i den analogin — kanske särskilt tanken på ”explainable AI”.

Hur god insyn har vi i hur staten eller företagen faktiskt fattar sina beslut? Hur skulle det fungera ut om vi började kräva att en organisation bara fick vara så komplex att det gick att i detalj förklara hur den fattat ett givet beslut, och på detta vis kunna utesluta att fördomar inverkat på beslutet? Har vi sådan insyn idag? Har vi ”explainable organizations”?

Runcimans medvetet sensationssökande analogi är användbar för att fundera kring alla olika typer av kognition som sker runtom oss — och borde leda till att vi kanske återintroducerar den gamla termen ”funktionell ekvivalens” — att vi inte skall kräva särreglering av nya fenomen så mycket som att vi relativt dem har samma förmåga att ingripa som vi har haft hitintills. Kanske.

Den andra läsningen jag tenderar till är att området nu nått en sådan hypenivå att de olika idéerna och analogierna blir djupt spekulativa i syfte att rida på den våg av uppmärksamhet som ämnet får. Det i sin tur är emellertid också en användbar insikt — och tycks rekommendera att sluta läsa om AI ett litet tag tills det lägger sig.

Döden och maskinen

Jag har skrivit om de biologiska gränsvillkor som intelligensen existerar under – och varför de inte är att se som begränsningar så mycket som förutsättningar. Den kanske mest extrema förutsättningen för intelligens är ändligheten, eller döden.

Nu rapporteras om experiment som syftar till att utveckla sätt för AI att förhålla sig till ändlighet och döden – för att se till att dessa system får en grundläggande drift mot jämvikt.

Det är intressant ur flera perspektiv, inte minst för att det är en erinran om cybernetiska tankemodeller från tänkare som Wiener och Lem.

AGI och biologisk intelligens kan mycket väl komma att konvergera över tid – under universella gränsvillkor.

Modeller av framtidens arbetsmarknad

En hel del av de framtidsdiskussioner som vi deltar i handlar om framtidens arbetsmarknad. De är absolut centrala för hur vi utvecklas som samhälle, och just därför är det intressant att försöka locka fram de mentala modeller som ligger bakom de olika synsätten som vi råkar på. I det följande tänkte jag gå igenom dessa i sina idealtypiska former – och därför blir de också litet förenklade – men jag tänkte att det kan ha ett visst egenvärde att försöka visa hur olika de mentala modellerna i diskussionen faktiskt är.

Den första modellen, den kanske vanligaste, ser ut såhär: det finns människor som har jobb. Nu kommer maskiner som kommer att ta dessa jobb. I framtiden kommer det alltså inte att finnas jobb kvar åt människor. I en bild:

Screenshot 2019-10-16 at 12.20.18

Frågan blir då – automatiskt – vad ska människorna göra nu när robotarna tagit jobben? Där finns det två olika modeller också – en i vilken det kommer nya jobb som människorna kan göra:

Screenshot 2019-10-16 at 12.23.17

I denna modell är allt frid och fröjd. Nu arbetar människorna igen, och det stora problemet är hur man kan se till att de lär sig de nya jobben. Ofta tror vi att dessa nya jobb kommer att vara mer komplicerade, och frågeställningen ser ut ungefär såhär, förenklat: förut behövde vi en massa bagare, men nu kan maskiner baka bröd. nu behöver vi läkare istället och alla bagare kan inte bli läkare, så hur ska vi lösa det? Den som håller fast vid den här modellen måste lösa ett omfattande omställningsproblem där hela kompetenskorgar – jobb – måste bytas mot nya, förmodat mer avancerade och komplicerade jobb.

Den andra möjligheten är förstås att det inte kommer några nya jobb. Det här var vad som oroade bland annat Keynes:

Screenshot 2019-10-16 at 12.27.54.png

Vad gör vi nu? Dessa människor som inte har ett jobb – och Keynes trodde att de skulle förvandlas till en sorts avdankade aristokrater som spelade bridge och hade affärer – måst vi ju ta hand om. Nu blir problemet ett rent försörjningsproblem: hur försörjer vi en växande skara arbetslösa människor?

Sedan finns de de som har en mer högupplöst syn på problemet. De menar att jobb är fel analysenhet: vi måste istället konstatera att jobb består av olika arbetsuppgifter – och vissa av arbetsuppgifterna kan automatiseras, andra kan det inte. I framtiden delar vi alltså arbetsuppgifter med robotarna:

Screenshot 2019-10-16 at 12.34.31

Möjligen kan detta också låta oss hitta på nya arbetsuppgifter som vi inte gjorde tidigare alls. Här finns ett omställningsproblem, men framförallt ett innovationsproblem – hur använder vi den nu tillgängliggjorda mänskliga förmågan på bästa möjliga sätt? 

Det finns en variation på detta tema, som förekommer exempelvis i en del av schackmästaren Garry Kasparovs skrifter, och det är att vi kommer att smälta samman med robotarna, eftersom en människa och en maskin alltid slår en maskin. Vi kommer att bli kentaurer, eller cyborgs, och helt enkelt bli mycket bättre på det vi gör:

Screenshot 2019-10-16 at 12.39.58.png

Skillnaderna mellan IV och V kan tyckas små, och har egentligen mest att göra med hur man organiserar arbetsplatsen, men de är ändå intressanta att fundera kring. Om vi smälter samman alltmer med tekniken blir distinktionen mellan människa och maskin allt mindre intressant — frågan om robotarna kommer att ta ditt jobb, blir enkel att besvara: nej, men du kommer att bli en robot, också. Det intressanta med denna modell är den antagna uppdelningen mellan maskinautomation och mänsklig verksamhet blir mycket mindre intressant att fundera kring. I stället blir det möjligt att fråga vad vi kan göra nu, och vilka typer av kompetenser som behövs för att smälta samman med en robot. I schack, menar Kasparov, är det inte de bästa enskilda spelarna som blir de bästa cyborgspelarna, utan andra kvaliteter – som en expertis på maskinens svagheter – blir viktiga kärnkompetenser. I IV blir människor bättre på sånt bara människor kan, och uppdelningen mellan människa och maskin är strikt. I V måste människor utveckla en viss kompetens som handlar om just maskinen och sammansmältningen blir målet.

Sedan finns de de som menar att föreställningen om ”jobb” är dömd att förlora i betydelse. För dem handlar framtiden om att organisera arbetsuppgifter och koordinera dem så att de blir till arbete som ger sådan avkastning att man kan leva på dem, och detta kommer man att göra med olika typer av intelligenta verktyg:

Screenshot 2019-10-16 at 12.47.52.png

I modell VI kan vi komplicera bilden ytterligare. I stället för den 1:1 relation som idag finns mellan arbetstagare och arbetsgivare, kan man tänka sig att en cyborg specialiserar sig på att göra en viss typ av arbetsuppgifter åt en stora mängd olika arbertsgivare. Då uppstår ett koordinationsproblem förstås, just det problem som ett jobb löser: hur kan man få stabilitet och förutsägbarhet i ekonomin om man lever i den s.k. gigekonomin? Här kan vi tänka oss en mängd olika svar, men ett exempel skulle vara att man litar till en tjänst som kombinerar arbetsuppgifter, arbetsgivare och schemaläggning på ett sådant sätt att du får förutsägbarhet och den arbetsbörda som du är bekväm med. Ett jobb går från att vara en statisk uppsättning arbetsuppgifter till att vara en dynamisk uppsättning arbetsuppgifter och relationer som lastbalanseras på samma sätt som exempelvis Internettrafik eller liknande. Här blir problemet att skapa den typen av tekniska, sociala och ekonomiska institutioner som kan bära atomiseringen av de klassiska jobben och bereda vägen för dynamiska jobb (djobb…?) istället. 

Olika modeller betyder alltså olika utmaningar och politiska problem, men också helt olika möjligheter och öppningar för en helt annat effektivitet i ekonomin.

*

Alla dessa modeller har det gemensamt att de gör antaganden om tillgången på arbetsuppgifter. Det är intressant att notera, eftersom det snuddar vid en fråga som jag diskuterat tidigare – och det är frågan om hur mycket arbete det finns. Jag tror fortfarande att mängden arbete är oändlig, men det är fullt möjligt att ha en avvikande åsikt. Jag tror också att den växande komplexiteten innebär att vi faktiskt måste utveckla automatiseringen och olika intelligenta verktyg så snabbt som möjligt, för att lösa de alltmer pressande problem vi ställs inför.

AI, kinesisk folkmusik och mänskliga optima

I den här vetenskapliga artikeln lägger författarna fram en modell för hur de kan generera kinesisk folkmusik med hjälp av ”deep learning”. Det är värt att citera deras sammanfattning:

Regional style in Chinese folk songs is a rich treasure that can be used for ethnic music creation and folk culture research. In this paper, we propose MG-VAE, a music generative model based on VAE (Variational Auto-Encoder) that is capable of capturing specific music style and generating novel tunes for Chinese folk songs (Min Ge) in a manipulatable way. Specifically, we disentangle the latent space of VAE into four parts in an adversarial training way to control the information of pitch and rhythm sequence, as well as of music style and content. In detail, two classifiers are used to separate style and content latent space, and temporal supervision is utilized to disentangle the pitch and rhythm sequence. The experimental results show that the disentanglement is successful and our model is able to create novel folk songs with controllable regional styles. To our best knowledge, this is the first study on applying deep generative model and adversarial training for Chinese music generation.

Att använda maskiner för att skapa musik är inte ett nytt fenomen. Den kände kompositören / datavetaren David Cope använde – i och för sig helt annorlunda – teknik för att göra just detta för flera decennier sedan. Han är bland annat berömd för det underbara och halvknasiga faktum att man på hans webb kan ladda ned 5000 olika Bachkoraler skapade av algoritmer. Jag har själv ofta i föreläsningar använt några av hans automatiskt genererade stycken för att visa att även kreativitet – som ofta framhälls som en unikt mänsklig förmåga – utan bara kan, utan nödvändigtvis måste kunna algoritmiseras i den grova meningen att den kan beskrivas som steg i en process som sedan kan utföras av en maskin. (Fotnot: Copes sajt håller på att vittra bort och det påminner mig om något som Vint Cerf ofta inskärper i oss: vi har ingen bra plan för hur vi skall minnas digitalt).

Den mest triviala modellen av kreativitet är ju enkel: generera massor av möjliga musikstycken och välj sedan ut de som verkar mest intressanta. Det är också möjligt att tänka sig detta som en process: välj ut möjliga ”nästa steg” i ett musikstycke eller en dikt och välj, igen, de mest intressanta. Häri skiljer sig uppgiften väsentligt från att lära en dator att spela, säg, go eller schack. Där handlar det om att välja den optimala vägen framåt givet ett strikt, konkret kriterium: att vinna spelet. I kreativiteten finns det inte samma tydliga optimeringsvillkor. Vad optimerar vi för när vi skapar musik eller litteratur?

Att svara ”inget alls” vore inte bara fel, utan djupt oärligt. Kreativitet optimerar för mindre välartikulerade kriterier, och komplexiteten i denna uppsättning kriterier är enormt fascinerande. Det vi upplever som god konst gör det väl, det som vi upplever som spekulativt är egentligen ett misslyckande att optimera rätt. Här finns en paradox: att vi inte klart kan uttrycka vad det är vi optimerar för betyder inte att vi inte optimerar. Inte heller handlar det om individuella kriterier. Jag har alltmer kommit att tro att det inte finns någon privat konstsyn, lika litet som det finns privata språk. Jag har också börjat tro att det finns rent biologiska lokala optima som vi orienterar oss mot i konsten — tydligt modererade av kulturella särdrag som över tiden kommit att utvecklas till helt egna selektionstryck.

Det är värt att dröja vid. I spel har vi märkt att de lokala optima som vi upptäckt i spel som schack och go inte är globala optima alls. När en dator kan genomsöka spelrummet mer effektivt hittar den andra lokala – eller globala – optima som slår oss. Den känsla som inträder då inträder är känslan av att vi spelar mot något främmande, nästan utomjordiskt. Mjukvaran sätter drottningen i ena hörnet av schackbrädet, datorn spelar ett drag som drag 37 i Sedolmatchen, och plötsligt spelar vi inte i en mänsklig del av spelrummet längre – och datorn vinner. Men för konst är det annorlunda.

För konst handlar det om att kunna utforska det lokala optima som vi redan börjat kartlägga, eller hitta ett nytt sådant mänskligt optima och skapa inom detta. Konst vinner inte om den blir främmande, omänsklig, utomjordisk — utan blir istället helt ointressant. Det i sin tur innebär att konsten utgör en helt annan sorts praktik än spelet, ur ett rent strukturellt perspektiv. När datorn övergav de mänskliga spelen som använts som träningsdata blev den genast bättre – eftersom det lossade förtöjningarna från den mänskliga optima som vi ankrat upp vid. Men ett neuralt nätverk som skapar konst helt utan mänskliga indata blir förmodligen bara irrelevant.

Om detta stämmer innebär det att vi har en intressant fråga att ställa oss om värdet av mänskliga optima i olika sorters problemdomäner. Värdet av mänskliga frön i djuplärandets processer. Hur är det med etik, med konst, med musik, med litteratur, med filosofi? Vilka andra områden finns där vår mänskliga position i lösningsrymden har ett värde i kraft endast av att det är vi som har konstruerat den?

Det är intressant att fundera kring en närmast nihilistisk position här. Antag att någon hävdade att mänskliga optima aldrig har något egenvärde alls – vad skulle det betyda? Jo, det borde kunna betyda – givet att möjlighetsrymderna för konst, etik och musik är flera storleksordningar större än spelrummet för exempelvis go – att en dator skulle kunna upptäcka en bättre musik, en bättre etik och vackrare konst än något som vi tidigare sett, och att vi, när vi såg eller hörde denna konst, omedelbart skulle se att detta var bättre – på samma sätt som gospelaren ser att ett drag faktiskt är bättre än det drag som den mänskliga erfarenhetens ortodoxi skulle föredra.

Här finns ett sorts möjligt demarkationskriterium för olika typer av mänskliga kunskapsdomäner: en där vi kan upptäcka en överlägsen praktik och en där den mänskliga praktiken har ett egenvärde. Det betyder inte att det finns saker som datorer inte kan göra – vilket alltför länge varit en sorts besatthet i diskussionen om AI – utan att det finns saker som utvärderas enligt kriterier som gör det omöjligt för en dator att tävla med en människa på egen hand. 

Till sist, då, just detta: vad säger vi om möjligheten att vi skulle kunna använda AI för att utforska ”the human adjacent possible” i konst, musik eller litteratur? Skulle inte en AI kunna hjälpa oss att utforska det mänskliga optima som vi rör oss i när det gäller dessa domäner? Jo, det tror jag – och det är delvis svindlande.

Låt oss bli medvetet spekulativa för att försöka förstå vad detta betyder, och fråga en till synes enkel, men ändå provokativ fråga:

(i) Skrev Bach sin allra vackraste, mest fulländade musik?

Tänk dig nu hela Bachs kompositionsrymd som ett landskap som vi kan utforska med hjälp av olika sorters AI, och där vi kan hitta tomrum eller utelämnade verk, och kanske hitta en fuga i a-moll som inte skrevs, men som med alla tillgängliga kriterier borde vara den absolut vackraste, mest tekniskt fulländade fuga som Bach hade kunnat skriva. Vi skulle kanske kunna hitta ett requiem av Bach, eller ett koralstycke som han kunde ha fulländat.

Och låt oss bli ännu mer spekulativa: tänk dig att hela den mänskliga samlade konstnärliga produktionen kunde analyseras på samma sätt, och att vi kunde ställa frågor till den för att rekonstruera verk som aldrig skapades, men som i sig hade, om de skapats, varit överlägsna allt annat som skapats. Inte bara blir det då möjligt att fundera kring om det vore möjligt att rent logiskt rekonstruera en version av Aristoteles dialoger – för alltid förlorade för eftervärlden – utan det blir också möjligt att ställa frågor som vilket det vackraste musikstycke Friedrich Nietzsche hade kunnat skriva var. Vi har musik från Nietzsche, vi har teckningar, vi har texter – vore det inte möjligt att med dessa och övriga lokala optima från den mänskliga kulturen leta i rymden av möjliga verk och se vad vi kan hitta?

Vad dessa tankeexperiment fordrar, är att vi funderar kring hur vi tänker kring konst och dess värde. Kontext, receptionshistoria, återkommande användning av konst och musik — alla spelar roll och omöjliggör kanske dessa experiment. Men om de inte gör det skulle vi kunna tänka oss en framtid i vilken vi engagerar oss i en sorts det möjligas kreativa arkeologi och skapar verk som flödar ur en djupare och mer fullständig förståelse av det samlade kulturella arvet.

Det, förstås, är vad många konstnärer redan skulle hävda att de gör – utan ny teknik.