Turing test

Turing -testen eller Turing -testen er en undersøkelse av en maskins evne til å vise intelligent atferd som ligner på eller ikke kan skilles fra et menneskes. Alan Turing foreslo at et menneske skulle evaluere samtaler med naturlig språk mellom et menneske og en maskin designet for å generere svar som ligner på et menneske. Evaluatoren ville vite at en av deltakerne i samtalen er en maskin, og deltakerne vil bli skilt fra hverandre. Samtale vil være begrenset til et medium som kun inneholder tekst, for eksempel et datamaskintastatur og en skjerm , så maskinens evne til å transformere tekst til tale ville være irrelevant. [ 2 ] I tilfelle evaluatoren ikke kan skille nøyaktig mellom menneske og maskin (Turing foreslo opprinnelig at maskinen skulle overbevise en evaluator, etter 5 minutters samtale, 70 % av tiden), ville maskinen ha bestått testen. Denne testen vurderer ikke kunnskapen om maskinen når det gjelder dens evne til å svare riktig på spørsmål, den tar bare hensyn til maskinens evne til å generere svar som ligner på de et menneske ville gitt.

Turing foreslo dette beviset i sitt essay " Computing Machinery and Intelligence " fra 1950 mens han jobbet ved University of Manchester (Turing, 1950; s. 460). [ 3 ]​ Det begynner med ordene: «Jeg foreslår at følgende spørsmål vurderes: 'Kan maskiner tenke?'». Siden ordet "tenke" er vanskelig å definere, bestemmer Turing seg for å "erstatte spørsmålet med et som er nært beslektet og i utvetydige ord.", [ 4 ] Turings nye spørsmål er: "Vil det være tenkelige digitale datamaskiner som har en god ytelse i imitasjonsspillet?" [ 5 ] Turing mente at dette spørsmålet kunne besvares og brukte resten av essayet på å argumentere mot hovedinnvendingene mot ideen om at "maskiner de kan tenke." [ 6 ]

Siden den ble opprettet av Turing i 1950, har testen vist seg å være både svært innflytelsesrik og mye kritisert, i tillegg til å bli et viktig begrep i filosofien om kunstig intelligens. [ 1 ]​ [ 7 ]

Historikk

Filosofisk kontekst

Spørsmålet om evnen til tenkende maskiner har en lang historie, det er delt mellom sinnets materialistiske og dualistiske perspektiver. René Descartes hadde ideer som ligner på Turings test i teksten Discourse on Method (1637) hvor han skrev at automater er i stand til å reagere på menneskelig interaksjon, men argumenterer for at en slik automat mangler evnen til å svare tilstrekkelig på det som blir sagt i hans nærvær på samme måte. slik et menneske kan. Dermed åpner Descartes døren for Turing-testen ved å identifisere mangelen på en passende språklig respons som skiller mennesket fra automaten. Descartes klarer ikke å vurdere at en passende språklig respons kan produseres av en fremtidens automat, og foreslår derfor ikke Turing-testen som sådan, selv om han allerede har resonnementert kriteriene og det konseptuelle rammeverket.

Hvor mange forskjellige automater eller mobile maskiner kan menneskets industri bygge […] Vi kan lett forstå det faktum at en maskin er laget for å uttale ord, til og med reagere på konkrete handlinger som frembringer en forandring i dens organer; for eksempel, hvis han ble berørt på en spesiell måte, ville han ikke spørre hva vi mener; blir den berørt et annet sted, kan det stå at den blir skadet blant annet. Men det hender aldri at han kan ordne talen sin på forskjellige måter for å svare passende på alt som blir sagt i hans nærvær, på samme måte som den laveste klassen av mennesker kan. [ 8 ]

Denis Diderot tar opp i sine Pensées philosophiques et kriterium for Turing-testen:

"Hvis du finner en papegøye som kan svare på alt, vil den uten tvil bli ansett som intelligent." [ 9 ]

Dette betyr ikke at han er enig, men det viser at det allerede var et vanlig argument brukt av materialister på den tiden.

I følge dualismen har ikke sinnet en fysisk tilstand (eller i det minste ikke-fysiske egenskaper) [ 10 ] og kan derfor ikke forklares i strengt fysiske termer. I følge materialismen kan sinnet forklares fysisk, noe som åpner muligheten for å skape kunstige sinn. [ 11 ]

I 1936 vurderte filosofen Alfred Ayer det typiske filosofiske spørsmålet om andre sinn: Hvordan vet vi at andre mennesker opplever samme bevissthetsnivå som oss? I sin bok Language, Truth and Logic foreslo Ayer en metode for å skille mellom en bevisst mann og en ubevisst maskin: «Det eneste argumentet jeg har for å sikre at det som ser ut til å være bevisst, ikke er et bevisst vesen, men en dukke eller en maskin, det er det faktum at den ]12[ikke klarer de empiriske testene som tilstedeværelsen eller fraværet av bevissthet bestemmes ved"

Alan Turing

"Machine intelligence" har vært et tema britiske forskere har fulgt i 10 år før forskningsfeltet kunstig intelligens ( AI ) ble grunnlagt i 1956. [ 13 ] Det var et tema som ofte ble diskutert av medlemmer av "Club of Reason", en uformell gruppe britiske kybernetiske og elektroniske forskere som inkluderte Alan Turing. [ 14 ]

Spesielt Turing hadde jobbet med begrepet maskinintelligens siden minst 1941, [ 15 ] ble en av de første omtalene av "beregningsintelligens" gjort av Turing i 1947. [ 16 ] I rapporten av Turing kalt "intelligent maskineri", [ 17 ] undersøkte han "ideen om hvorvidt det var mulig for en maskin å demonstrere intelligent oppførsel" [ 18 ] og som en del av sin forskning foreslo han det som kan betraktes som en forgjenger for fremtiden din bevis:

Det er ikke vanskelig å designe en papirmaskin som spiller godt sjakk. [ 19 ]​ Du må få 3 menn som forsøkspersoner for eksperimentet. A, B og C. A og C er to dårlige sjakkspillere mens B er maskinoperatør. … To rom brukes med et eller annet arrangement for å overføre trekkene, og det spilles et spill mellom C og enten A eller maskinen. C kan ha problemer med å bestemme hvem han spiller mot. [ 20 ]

Den første publiserte teksten skrevet av Turing og fokuserte utelukkende på maskinintelligens var " Computing Machinery and Intelligence ". Turing starter denne teksten med å si "Jeg har tenkt å ta hensyn til spørsmålet 'Kan maskiner tenke?'". [ 4 ] Turing nevner at den tradisjonelle tilnærmingen er å starte med definisjoner av begrepene «maskin» og «intelligens», bestemme seg for å ignorere dette og starte med å erstatte spørsmålet med et nytt, «som er nært beslektet og i entydige ord». . [ 4 ] Han foreslår i hovedsak å endre spørsmålet om "kan maskiner tenke?" til "Kan maskiner gjøre, hva vi (som tenkende enheter) gjør?". [ 21 ] Fordelen med dette nye spørsmålet er at det "trekker en grense mellom menneskets fysiske og intellektuelle kapasiteter." [ 22 ]

For å demonstrere denne tilnærmingen foreslår Turing en test inspirert av "Imitation Game", der en mann og en kvinne gikk inn i separate rom og resten av spillerne ville prøve å skille mellom hver enkelt ved hjelp av spørsmål og lesing av svarene (skrevet ). skrevet) høyt. Målet med spillet er at deltakerne som er i rommene må overbevise resten om at de er den andre. (Huma Shah hevder at Turing inkluderer forklaringen av dette spillet for å introdusere leseren til spørsmål-og-svar-testen mellom menneske og maskin [ 23 ] ) Turing beskriver sin versjon av spillet som følger:

Vi stiller oss selv spørsmålet: "Hva ville skje hvis en maskin tok rollen som A i dette spillet?" Ville spørsmålsstilleren ta feil like ofte i denne nye versjonen av spillet som da det ble spilt av en mann og en kvinne? Disse spørsmålene erstatter det opprinnelige spørsmålet "Kan maskiner tenke?". [ 22 ]

Senere i teksten foreslås en lignende versjon der en dommer snakker med en datamaskin og en mann. [ 24 ] Selv om ingen av de foreslåtte versjonene er den samme som den vi kjenner i dag, foreslo Turing et tredje alternativ, som han diskuterte i en BBC -radiosending , der en jury stiller spørsmål til en datamaskin og datamaskinens mål er å lure flertallet. av juryen til å tro at det er et menneske. [ 25 ]

Turings tekst vurderte ni antatte innvendinger som inkluderer alle de viktigste argumentene mot kunstig intelligens som hadde oppstått i årene etter publiseringen av teksten hans (se " Computing Machinery and Intelligence "). [ 6 ]

ELIZA og PARRY

I 1966 opprettet Joseph Weizenbaum et program som hevdet å bestå Turing-testen. Dette programmet ble kjent som ELIZA og det fungerte ved å analysere ordene som ble skrevet inn av brukeren på jakt etter nøkkelord. Når det gjelder å finne et nøkkelord, iverksetter en regel som forvandlet brukerens kommentar, og en resultatsetning returneres. Hvis ingen nøkkelord ble funnet, ga ELIZA et generisk svar eller gjentok en av de tidligere kommentarene. [ 26 ] I tillegg utviklet Weizenbaum ELIZA for å gjenskape oppførselen til en Rogeriansk psykoterapeut , slik at ELIZA kunne "ta på seg rollen som noen som ikke vet noe om den virkelige verden." [ 27 ] Programmet var i stand til å lure noen mennesker til å tro at de snakket til en ekte person, og til og med noen forsøkspersoner var "veldig vanskelig å overbevise dem om at ELIZA ikke var et menneske." [ 27 ] Som et resultat blir ELIZA hyllet som en av showene (sannsynligvis den første) som bestod Turing-testen, [ 27 ] [ 28 ] selv om dette er svært kontroversielt (se nedenfor).

PARRY ble opprettet av Kenneth Colby i 1972. Det var et program beskrevet som "ELIZA med karakter." [ 29 ] Han forsøkte å simulere oppførselen til en paranoid schizofren ved å bruke en lignende (sannsynligvis mer avansert) tilnærming til Weizenbaums. PARRY ble testet med en variant av Turing-testen for å validere arbeidet. En gruppe erfarne psykiatere analyserte en gruppe ekte pasienter og datamaskiner som kjørte PARRY-programmet gjennom teletyper. En annen gruppe på 33 psykiatere ble vist utskrifter av samtalene. Begge gruppene ble bedt om å angi hvilke pasienter som var mennesker og hvilke som var datamaskiner. [ 30 ] Psykiaterne var i stand til å svare riktig bare 48 % av gangene, en verdi forenlig med tilfeldige svar. [ 31 ]

I det 21. århundre fortsatte versjoner av disse programmene (kalt " chat-bots ") å lure folk. "CyberLover", et skadelig programvareprogram , forfulgte brukere ved å overbevise dem om å "avsløre informasjon om identiteten deres eller gå inn på et nettsted som ville introdusere skadelig programvare til datamaskinene deres". [ 32 ] Showet dukket opp som en "Valentine's venture", og flørte med folk som "søkte relasjoner på nettet for å samle personlig informasjon". [ 33 ]

Det kinesiske rommet

John Searles tekst "Minds, Brains and Programs" fra 1980 foreslo eksperimentet med "kinesisk rom" og argumenterte for at Turing-testen ikke kunne brukes til å avgjøre om en maskin kunne tenke. Searle observerte at programvare (som ELIZA) kunne bestå Turing-testen ved å manipulere karakterer den ikke hadde forstått. Uten forståelse kan de egentlig ikke klassifiseres som "tenking" på samme måte som mennesker kan, derfor konkluderte Searle med at Turing-testen ikke kan bevise at en maskin kan tenke. [ 34 ] I likhet med Turings test, har Searles argument blitt mye kritisert [ 35 ] og støttet. [ 36 ]

Argumenter som Searles i sinnsfilosofi utløste en mer intens debatt om intelligensens natur, muligheten for intelligente maskiner og verdien av Turing-testen som fortsatte inn på 1980- og 1990-tallet. [ 37 ] Fysikalistisk filosof William Lycan anerkjente fremskrittet av kunstig intelligens, og begynte å oppføre seg som om de hadde sinn. Lycan bruker tankeeksperimentet til en menneskelig robot ved navn Harry som kan samtale, spille golf, spille bratsj, skrive poesi og dermed lure folk som om han var en person med et sinn. Hvis Harry var menneske, ville det være helt naturlig å tenke at han har tanker eller følelser, noe som tyder på at Harry faktisk kan ha tanker eller følelser selv om han er en robot. [ 38 ] [ 39 ] For Lycan "er det ingen problem eller innvendinger mot kvalitativ erfaring i maskiner som ikke er like et dilemma for slik erfaring hos mennesker" [ 40 ] (se Problem of other minds ).

Loebner-prisen

Loebner -prisen gir en årlig plattform for praktiske Turing-tester, med den første konkurransen som fant sted i november 1991. [ 41 ] Laget av Hugh Loebner, Cambridge Center for Behavioral Studies i Massachusetts , USA , organiserte prisene frem til år 2003 inkluderte . Loebner sa at en grunn til at konkurransen ble opprettet var for å fremme AI-forskningen, i det minste delvis, siden det ikke hadde vært noe forsøk på å implementere Turing-testen etter 40 års diskusjon. [ 42 ]

Den første Loebnerpriskonkurransen i 1991 førte til fornyet diskusjon om gjennomførbarheten av Turing-testen og verdien av å fortsette å forfølge den i pressen [ 43 ] og i akademia. [ 44 ] Den første konkurransen ble vunnet av et ubevisst program uten identifiserbar intelligens som klarte å lure naive spørsmålsstillere. Dette brakte frem i lyset mange av manglene ved Turing-testen (diskutert nedenfor): Programmet vant fordi det var i stand til å "etterligne menneskelige skrivefeil"; [ 43 ] , ble usofistikerte avhørere lett lurt [ 44 ] og noen AI-etterforskere mente at testen er en distraksjon fra mer fruktbare undersøkelser. [ 45 ]

Prisene i sølv (kun tekst) og gull (visuelle og lydlige) har ikke blitt vunnet til dags dato, men konkurransen har tildelt bronsemedaljen hvert år til datasystemet som, etter dommernes mening, demonstrerer det "mer menneskelige ” samtaleatferd blant de andre deltakerne. ALICE ( Artificial Linguistic Internet Computer Entity ) har vunnet bronseprisen ved 3 nylige anledninger (2000, 2001 og 2004). Jabberwacky trainee AI vant i 2005 og igjen i 2006. [ 46 ]

Loebnerprisen evaluerer samtaleintelligens, vinnerne er typisk chatbots. Reglene for de første instansene av konkurransen begrenset samtalene: hvert deltakende program og et skjult menneske snakket om et enkelt emne [ 47 ] og avhørerne var begrenset til ett enkelt spørsmål for hver interaksjon med enheten. De begrensede samtalene ble eliminert i konkurransen fra 1995. Samspillet mellom evaluatoren og enheten har variert i de ulike tilfellene av Loebnerprisen. Ved Loebner-prisen i 2003 ved University of Surrey fikk hver avhører samhandle med enheten i 5 minutter, enten det er menneske eller maskin. Mellom 2004 og 2007 var den tillatte interaksjonen mer enn 20 minutter. I 2008 var den tillatte interaksjonen 5 minutter per par, fordi arrangøren Kevin Warwick og koordinatoren Huma Shah mente at dette burde være varigheten av en hvilken som helst test, slik Turing sa det i sin tekst fra 1950: "...den korrekte identifiseringen etter 5. minutter med avhør." [ 48 ] ​​De mente at de tidligere implementerte lange testene var upassende for tilstanden til kunstige samtaleteknologier. [ 49 ] Det er ironisk at konkurransen i 2008 ble vunnet av Elbot fra Artificial Solutions, som ikke simulerte en menneskelig personlighet, men den til en robot, og likevel klarte å lure tre menneskelige dommere med at det var mennesket som fungerte som en robot. [ 50 ]

Under konkurransen i 2009. Basert i Brighton , Storbritannia, var tillatt interaksjon 10 minutter per runde, 5 minutter å snakke med maskinen og 5 minutter å snakke med mennesket. Den ble implementert på denne måten for å teste den alternative lesingen på Turings spådom om at 5-minutters interaksjon skulle være med datamaskinen. For konkurransen i 2010 økte sponsoren interaksjonstiden mellom avhøreren og systemet til 25 minutter. [ 51 ]

Konkurranse ved University of Reading 2014

Den 7. juni 2014 ble en Turing Test-konkurranse arrangert av Kevin Warwick og Huma Shah for 60-årsjubileet for Turings død holdt i Royal Society i London. Den ble vunnet av den russiske samtaleroboten Eugene Goostman . Roboten klarte i løpet av en serie på 5-minutters samtaler å overbevise 33 % av konkurransedommerne om at den var menneskelig. Dommerne inkluderte John Sharkley, sponsor for lovforslaget som fremmer en benådning fra regjeringen for Turing, AI -professor Aaron Sloman og Robert Llewellyn, skuespiller fra Red Dwarf . [ 52 ]​ [ 53 ]​ [ 54 ]​ [ 55 ]

Arrangørene av konkurransen mente at testen hadde blitt "bestått for første gang" på arrangementet og sa: "noen vil si at testen allerede er bestått. Ordene "Turing Test" har blitt brukt på lignende konkurranser rundt om i verden. Imidlertid involverer denne hendelsen flere samtidige sammenligningstester på samme tid enn noen gang før, ble uavhengig verifisert og, avgjørende, ingen samtaler ble begrenset. En ekte Turing-test fastslår ikke spørsmålene eller temaene for samtalene.» [ 53 ]

Konkurransen har møtt kritikk, [ 56 ] for det første ble bare en tredjedel av dommerne lurt av datamaskinen. For det andre så datakarakteren ut til å være en 13 år gammel ukrainsk jente som lærte engelsk som andrespråk. Tildelingen krevde at 30 % av dommerne ble lurt, noe som samsvarer med Turings tekst om datamaskiner og etterretning . Joshua Tenenbaum, en ekspert i matematisk psykologi ved MIT , kalte resultatet lite imponerende. [ 57 ]

Versjoner av Turing-testen

Saul Traigner hevder at det er minst 3 primærversjoner av Turing-testen, hvorav to er foreslått i " Computing Machinery and Intelligence " og en annen som han beskriver som "standardtolkningen". [ 58 ] Selv om det er uenighet om hvorvidt denne "standardtolkningen" ble beskrevet av Turing eller basert på feiltolkning av teksten, klassifiseres ikke disse tre versjonene som likeverdige [ 58 ] og deres styrker og svakheter er forskjellige. [ 59 ]

Huma Shah peker på det faktum at Turing selv var opptatt av muligheten for at en maskin kunne tenke og ga en enkel metode for å undersøke dette gjennom spørsmål og svar økter mellom menneske og maskin. [ 60 ] Shah hevder at det er et imitasjonsspill som Turing kunne ha implementert på to forskjellige måter: a) en en-til-en-test mellom avhøreren og maskinen eller b) en samtidig sammenligning mellom et menneske og en maskin som ble forhørt i parallelt av samme avhører. [ 23 ] Fordi Turing-testen vurderer utskillelighet i ytelsesevne, generaliserer den verbale versjonen naturlig til alle menneskelige evner, verbal og nonverbal (robotisk). [ 61 ]

Imitasjonsspill

Det originale spillet beskrevet av Turing foreslo et partyspill som involverer tre spillere. Spiller A er mann, spiller B er kvinne, og spiller C (som spiller rollen som avhører) er begge kjønn. I spillet har spiller C ingen øyekontakt med noen av de andre spillerne og kan kommunisere med dem gjennom skriftlige notater. Ved å stille spørsmål til spillerne prøver spiller C å finne ut hvem av de to som er hannen og hvem som er kvinnen. Spiller A vil prøve å lure avhøreren ved å få ham til å velge feil spiller mens spiller B vil hjelpe avhøreren med å velge riktig spiller. [ 1 ]

Sterret refererer til dette spillet som "The Copycat Original Game Test". [ 62 ] Turing foreslo at rollen som spiller A skulle fylles av en datamaskin slik at den måtte late som om den var en kvinne og prøve å veilede spørsmålsstilleren til feil svar. Suksessen til datamaskinen vil bli bestemt ved å sammenligne utfallet av spillet når spiller A er datamaskinen med utfallet av spillet når spiller A er mann. Turing uttalte at hvis "spørsmåleren feilaktig bestemmer seg like ofte når spillet spilles [med datamaskinen] som når spillet spilles mellom en mann og en kvinne", [ 22 ] kan man argumentere for at datamaskinen er intelligent.

Den andre versjonen dukket senere opp i Turings tekst fra 1950. I likhet med Imitation Original Game Test, ville rollen som spiller A bli utført av en datamaskin. Rollen som spiller B ville imidlertid bli utført av en mann og ikke en kvinne.

«La oss rette oppmerksomheten mot en spesifikk digital datamaskin kalt C. Er det sant at ved å modifisere datamaskinen slik at den har lagring som øker reaksjonshastigheten på passende måte og ved å gi den et passende program, vil C kunne utføre rollen som A i spillet? imitasjonsspill med rollen som B laget av en mann? [ 22 ]

I denne versjonen vil både spiller A (datamaskinen) og spiller B prøve å veilede spørsmålsstilleren til feil svar.

Standardtolkning

Den generelle forståelsen tilsier at hensikten med Turing-testen ikke er å bestemme spesifikt om en datamaskin vil være i stand til å lure avhøreren til å tro at den er et menneske, men heller dens evne til å etterligne mennesket. [ 1 ] Selv om det er uenighet om hvilken tolkning Turing refererte til, mener Sterret at det var denne [ 62 ] og kombinerer derfor den andre versjonen med den mens andre, som Traiger, ikke [ 58 ] men dette har egentlig ikke førte til en standardtolkning. I denne versjonen er spiller A en datamaskin og kjønnet til spiller B er irrelevant. Målet til avhøreren er ikke å finne ut hvem av dem som er mann og kvinne, men hvem som er datamaskin og hvem som er menneske. [ 63 ] Det grunnleggende problemet med standardtolkningen er at avhøreren ikke kan fortelle hvilken respondent som er menneske og hvilken som er maskin. Det er andre problemer med varighet, men standardtolkningen anser generelt denne begrensningen som noe som bør være rimelig.

spill av imitasjon vs. Standard Turing Test

Det har blitt skapt kontrovers om hvilken av de alternative formlene som er den som Turing foreslo. [ 62 ] Sterret hevder at to bevis kan fås ved å lese Turings tekst fra 1950, og at de ifølge Turing ikke er likeverdige. Testen som består av festspillet og sammenligner suksessfrekvenser omtales som "Original Imitation Game Test" mens testen som består av en menneskelig dommer som snakker med et menneske og en maskin er kjent som "Turings Standard Test", merk at Sterret behandler dette som "standardtolkningen" i stedet for å behandle det som den andre versjonen av imitasjonsspillet. Sterret er enig i at Standard Turing Test (PET) har problemene hans kritikere siterer, men føler at Original Imitation Game Test (JIO Test) derimot viste seg å være immun mot mange av disse på grunn av en avgjørende forskjell: I motsetning til PET, gjør ingen likhet med menneskelig ytelse, selv om den bruker menneskelig ytelse til å definere kriterier for maskinintelligens. Et menneske kan mislykkes i JIO-testen, men det hevdes at denne testen er en av intelligens og å mislykkes indikerer bare mangel på kreativitet. JIO-testen krever kreativiteten knyttet til intelligens og ikke bare «simulering av menneskelig samtaleatferd. Den generelle strukturen til JIO-testen kan brukes med ikke-verbale versjoner av imitasjonsspill. [ 64 ]

Andre forfattere [ 65 ] fortsetter å tolke Turings forslag som selve imitasjonsspillet uten å spesifisere hvordan de skal forklare Turings uttalelse om at beviset han foreslo å bruke den festlige versjonen av imitasjonsspillet er basert på et kriterium: sammenligning av suksessfrekvenser i spillet. i stedet for muligheten til å vinne på bare én runde.

Saygin antydet at det originale spillet sannsynligvis er en måte å foreslå et mindre delvis eksperimentelt design på, siden det skjuler involveringen av datamaskinen. [ 66 ] Imitasjonsspillet inkluderer et "sosialt triks" som ikke finnes i standardtolkningen, siden både datamaskinen og mannen i spillet er pålagt å utgi seg for å være noen de ikke er. [ 67 ]

Bør dataavhøreren vite det?

En viktig del i enhver laboratorietest er eksistensen av en kontroll. Turing gjør det aldri klart om spørsmålsstilleren i testene sine er klar over at en av deltakerne er en datamaskin. Men hvis det var en maskin som hadde potensial til å bestå Turing-testen, ville det være best å anta at dobbeltblind kontroll er nødvendig.

Går tilbake til Original Game of Imitation, sier Turing at bare spiller A vil bli erstattet med en maskin, ikke at spiller C er klar over denne endringen. [ 22 ] Da Colby, FD Hilf, S Weber og AD Kramer undersøkte PARRY, gjorde de det under antagelsen om at avhørerne ikke trengte å vite at en eller flere av de avhørte var en datamaskin. [ 68 ] Som Ayse Saygin, Peter Swirski [ 69 ] og andre har påpekt, utgjør dette en stor forskjell i implementering og testresultat . [ 1 ] En eksperimentell studie som undersøkte brudd på Grices samtalemaksimer ved bruk av transkripsjoner av vinnerne av testen (skjult ringer og avhører) en etter en mellom 1994 og 1999, observerte Ayse Saygin betydelige forskjeller mellom svarene til deltakerne som visste at datamaskiner var involvert og de som ikke gjorde det. [ 70 ]

Huma Shah og Kevin Warwick , som organiserte Loebner-prisen i 2008 ved University of Reading som var vertskap for samtidige sammenligningstester (en dommer og to skjulte foredragsholdere), viste at kunnskap om foredragsholderne ikke utgjorde en vesentlig forskjell i avgjørelsen til dommerne. Disse dommerne ble ikke eksplisitt fortalt arten av parene av skjulte samtalepartnere de skulle forhøre. Dommerne var i stand til å skille mellom menneske og maskin, selv når de sto overfor to maskinkontrollparinger eller to mennesker som infiltrerte mellom menneske- og maskinparingene. Stavefeil ga bort skjulte mennesker, maskiner ble identifisert ved deres responshastighet og større uttrykk. [ 50 ]

Test styrker

Behandlingsevne og enkelhet

Kraften og appellen til Turing-testen kommer fra dens enkelhet. Moderne sinnsfilosofi , psykologi og nevrovitenskap har ikke vært i stand til å gi definisjoner for "intelligens" og "tanke" som er presise og generelle nok til å gjelde for maskiner. Uten disse definisjonene kan ikke de viktigste ukjente i filosofien om kunstig intelligens besvares. Turings test, selv om den er ufullkommen, gir i det minste noe som kan måles og er som sådan en pragmatisk løsning på et vanskelig filosofisk spørsmål.

En rekke temaer

Formatet på testen gjør at spørsmålsstilleren kan gi en rekke intellektuelle oppgaver til maskinen. Turing skrev at: "Spørsmål-og-svar-metodene ser ut til å være tilstrekkelige for å introdusere noen av feltene for menneskelig bestrebelse som vi ønsker å inkludere." [ 71 ] John Haugeland la til: "Å forstå ordene er ikke nok, du må også forstå emnet." [ 72 ]

For å bestå en riktig utformet Turing-test, må maskinen bruke naturlig språk , fornuft , ha kunnskap og lære . Testen kan utvides til å inkludere video som en informasjonskilde sammen med en "luke" som gjenstander kan overføres gjennom, dette ville tvinge maskinen til å teste synet og robotikkevnen samtidig. Sammen representerer de nesten alle problemene som forskning på kunstig intelligens ønsker å løse. [ 73 ]

Feigenbaum - testen er designet for å bruke utvalget av emner som er tilgjengelige for en Turing-test til sin fordel. Det er en begrenset form for Turings spørsmål og svar-spill som setter maskinen opp mot ferdighetene til eksperter på spesifikke felt som litteratur og kjemi . IBMs Watson - maskin oppnådde suksess i et TV-program som stilte både menneskelige og maskinelle deltakere spørsmål om menneskelig kunnskap og samtidig kalt Jeopardy !. [ 74 ]

Vekt på emosjonell og estetisk intelligens

Som en æresutdannet matematikk fra Cambridge, ble Turing forventet å foreslå en beregningsmessig intelligenstest som ville kreve ekspertkunnskap om et svært teknisk felt og som et resultat måtte forutse en annen tilnærming. I stedet krever testen han beskrev i sin tekst fra 1950 bare at datamaskinen skal være i stand til å lykkes med å konkurrere i et felles selskapsspill, med det mener han at ytelsen kan sammenlignes med den til et typisk menneske når det gjelder å svare på en rekke spørsmål som skal vises til være den kvinnelige deltakeren.

Gitt statusen til menneskelig seksuell dimorfisme som et av de eldste temaene , er det implisitt i scenariet ovenfor at spørsmålene som stilles ikke kan involvere spesialisert faktakunnskap eller informasjonsbehandlingsteknikker. Utfordringen for datamaskinen vil være å vise empati for rollen som kvinner samt demonstrere en karakteristikk av estetisk sensibilitet, kvaliteter som vises i dette utdraget som Turing har forestilt seg:

Spørsmål: Kan X fortelle meg lengden på håret hans? Deltaker: Håret mitt er lagdelt og de lengste hårstråene er omtrent 9 tommer lange.

Når Turing introduserer noe spesialisert kunnskap til sine imaginære dialoger, er ikke emnet matematikk eller elektronikk, men poesi:

Spørsmål: Den første linjen i sonetten din lyder: «Jeg kan sammenligne det med en sommerdag», ville ikke «en vårdag» fungere like bra eller bedre? Vitne: Det ville ikke fungere. Spørsmål: Hva med «en vinterdag»? Det burde fungere. Vitne: Ja, men ingen ønsker å bli sammenlignet med en vinterdag.

Turing demonstrerer igjen sin interesse for empati og estetisk sensibilitet som en komponent i kunstig intelligens, og i lys av økende bekymring for en AI som har gått løs, [ 75 ] har det blitt antydet [ 76 ] at denne tilnærmingen kan representere en kritisk innsikt i Turings del, dvs. at intelligens og estetikk vil spille en nøkkelrolle i å skape en «vennlig AI». Imidlertid har det blitt observert at uansett hvilken retning Turing inspirerer oss i avhenger av bevaringen av hans opprinnelige visjon, det vil si at kunngjøringen av en "Standard Interpretation" av Turing-testen (dvs. en som fokuserer kun på diskursiv intelligens) må tas. med forsiktighet.

Testsvakheter

Turing sa ikke eksplisitt at Turing-testen kunne brukes som et mål på intelligens, eller noen annen menneskelig kvalitet. Han ønsket å gi et klart og forståelig alternativ til ordet 'tenke', som senere kunne brukes til å svare på kritikk av muligheten for 'tenkemaskiner', og for å foreslå måter forskningen kunne komme videre på. Imidlertid har det blitt foreslått bruk av Turing-testen som et mål på en maskins "evne til å tenke" eller "intelligens". Dette forslaget har fått kritikk fra filosofer og informatikere. Dette forutsetter at en avhører kan avgjøre om en maskin "tenker" ved å sammenligne oppførselen til et menneske. Hvert element i denne antagelsen har blitt stilt spørsmål ved: påliteligheten av avhørerens dømmekraft, verdien av å sammenligne atferd alene og verdien av å sammenligne maskin med menneske, det er på grunn av disse antakelsene og andre hensyn at noen AI-forskere stiller spørsmål ved relevansen av Turing test i felt.

menneskelig intelligens vs. Intelligens generelt

Turing-testen vurderer ikke direkte om en datamaskin oppfører seg intelligent, kun om den oppfører seg som et menneske. Siden menneskelig atferd og intelligent oppførsel ikke er helt det samme, kan testen mislykkes i å måle intelligens nøyaktig på to måter:

Visse menneskers atferd er ikke intelligent Turings test krever at maskinen viser all menneskelig atferd, uavhengig av om den er intelligent eller ikke. Den undersøker til og med for atferd som vi tror ikke er smart i det hele tatt. Blant dem er mottakelighet for fornærmelser, fristelsen til å lyve eller rett og slett skrivefeil. Hvis en maskin ikke klarer å etterligne denne uintelligente atferden, ville den mislykkes i testen.: Denne innvendingen ble brakt frem i en publikasjon i " The Economist " med tittelen " Artificial Stupidity " kort tid etter den første priskonkurransen av Loebner i 1992. Artikkelen hevdet at vinneren av konkurransen delvis skyldtes maskinens evne til å «etterligne menneskelige skrivefeil». [ 43 ] Turing selv foreslo at programmer legger til feil i informasjonen de sender for å se ut til å være "spillere" av spillet. [ [ 77 ] Visse intelligente atferder er umenneskelige Turing-testen tester ikke for svært intelligent atferd som evnen til å løse vanskelige problemer eller komme opp med originale ideer. Faktisk krever det spesifikt bedrag fra den som spør: Hvis maskinen er mer intelligent enn et menneske, må den fremstå som ikke "veldig" intelligent. Hvis du skulle løse et beregningsproblem som er praktisk talt umulig for et menneske, ville spørsmålsstilleren vite at han eller hun ikke er et menneske, og som et resultat ville datamaskinen mislykkes i testen. Siden intelligens som er hinsides menneskelig ikke kan måles, kan ikke testen brukes til å bygge eller evaluere systemer som er mer intelligente enn mennesker. Av denne grunn har flere alternative tester som er i stand til å evaluere et superintelligent system blitt foreslått [ 78 ]

ekte intelligens vs. Simulert intelligens

Se også: Syntetisk intelligens

Turings test evaluerer kun strengt hvordan forsøkspersonen oppfører seg (det vil si maskinens ytre oppførsel). I denne forbindelse tas et atferdsmessig eller fundamentalistisk perspektiv til studiet av intelligens. ELIZA -eksemplet antyder at en maskin som består testen kan simulere menneskelig samtaleatferd ved å følge en enkel (men lang) liste med mekaniske regler uten å tenke eller ha et sinn i det hele tatt.

John Searle har hevdet at ekstern atferd ikke kan brukes til å bestemme om en maskin "virkelig" tenker eller bare "simulerer tenkning." [ 34 ] Hans kinesiske rom hevder å demonstrere dette, selv om Turing-testen er en god operasjonell definisjon av intelligens, indikerer den ikke om maskinen har et sinn , bevissthet eller intensjonalitet . (Intensjonalitet er et filosofisk begrep for tankens kraft til å handle "om" noe.)

Turing forutså denne kritikken i sin originaltekst [ 79 ] som skrev:

Jeg ønsker ikke å gi inntrykk av at jeg ikke tror på bevissthetens mysterium. Det er for eksempel noe paradoksalt knyttet til ethvert forsøk på å lokalisere henne. Men jeg tror ikke disse mysteriene trenger å løses før vi kan svare på spørsmålet vi har å gjøre med i denne teksten. [ 80 ]

Oppfinnsomheten til avhørerne og den antropomorfe feilslutningen.

I praksis kan testresultater lett bli dominert, ikke av datamaskinens intelligens, men av spørsmålsstillerens holdninger, ferdigheter eller oppfinnsomhet.

Turing spesifiserer ikke integratorens nødvendige ferdigheter og kunnskaper i testbeskrivelsen, men han inkluderte begrepet "gjennomsnittlig avhører": "[den] gjennomsnittlige avhøreren bør ikke ha mer enn 70 % sjanse for å gjøre riktig identifikasjon etter fem minutter av spørrende." [ 48 ]

Shah og Warwick (2009b) viste at eksperter blir lurt og at spørsmålsstillerens strategi, «makt» vs. «solidaritet», påvirker identifikasjon med at sistnevnte blir mer vellykket.

Chatboter som ELIZA har gjentatte ganger lurt folk til å tro at de kommuniserer med mennesker. I dette tilfellet var avhøreren uvitende om muligheten for at hans interaksjon var med en datamaskin. For å lykkes med å fremstå som menneskelig, er det ikke nødvendig for maskinen å ha noen intelligens, bare en overfladisk likhet med menneskelig atferd er nødvendig .

Tidlige Loebner-priskonkurranser brukte usofistikerte avhørere som lett lot seg lure av maskinene. [ 44 ] Siden 2004 har arrangørene av Loebnerprisen inkludert filosofer, informatikere og journalister blant spørsmålsstillerne. Noen av disse ekspertene har imidlertid latt seg lure av maskinene. [ 81 ]

Michael Shermer påpeker at mennesker konsekvent betrakter ikke-menneskelige objekter som mennesker når de har mulighet til det, en feil som kalles den "antropomorfe feilslutningen": de snakker med kjøretøyene sine, tillegger ønsker og intensjoner til naturkrefter (f.eks. "naturen") hater tomhet"). ”) og tilber soloen som et menneske med intelligens. Hvis Turing-testen ble brukt på religiøse gjenstander, ville livløse statuer, steiner og steder konsekvent bestått testen gjennom historien ifølge Shermer. [ referanse nødvendig ] Denne menneskelige tendensen til antropomorfisme reduserer effektivt kravet til Turing-testen med mindre avhørere er opplært til å unngå det.

Feil i menneskelig identifikasjon

Et interessant trekk ved Turing-testen er hyppigheten som forskere forveksler menneskelige deltakere med for maskiner. [ 82 ] Det har blitt antydet at dette er fordi forskere ser etter forventede menneskelige responser i stedet for typiske svar. Dette resulterer i feil kategorisering av enkelte individer som maskiner, noe som kan favorisere det.

Irrelevans og upraktisk: Turing og AI-forskning.

Berømte AI-forskere hevder at å prøve å bestå Turing-testen er en distraksjon fra mer fruktbar forskning. [ 83 ] Testen er ikke et aktivt fokus for akademisk forskning eller kommersiell innsats, som Stuart Russel og Peter Norvig skrev: "AI-forskere har viet liten oppmerksomhet til å bestå Turing-testen." [ 84 ] Det er flere grunner til dette.

For det første er det enklere måter å teste et program på. Mest forskning på AI-relaterte felt er viet til mer spesifikke og beskjedne mål som automatisert planlegging , gjenkjenning av objekter eller logistikk. For å teste intelligensen til programmene når de utfører disse oppgavene, gir forskerne dem rett og slett oppgaven direkte. Russell og Norvig foreslo en analogi med flyhistorien : Fly testes på deres evne til å fly, ikke sammenlignet med fugler. Tekster fra " Aeronautical Engineering " nevner: "Målet med feltet bør ikke defineres som flygende maskiner som flyr så likt duer at de kan lure dem." [ 84 ]

For det andre er det å lage simuleringer av mennesker et vanskelig problem som ikke trenger å løses for å oppfylle de grunnleggende målene for AI-forskning. Troverdige menneskelige karakterer er interessante for et kunstverk, et spill eller et sofistikert brukergrensesnitt, men de har ingen plass i vitenskapen om å lage intelligente problemløsningsmaskiner med denne intelligensen.

Turing ønsket å gi et klart og forståelig eksempel for å hjelpe i diskusjonen om filosofien om kunstig intelligens. [ 85 ] John McCarthy nevner at filosofien til AI er "usannsynlig å ha noen større effekt på praktiseringen av AI-forskning enn vitenskapsfilosofien har på vitenskapens praksis." [ 86 ]

Varianter av Turing-testen

Tallrike versjoner av Turing-testen, inkludert de som er nevnt ovenfor, har blitt diskutert gjennom årene.

Omvendt Turing-test og CAPTCHA

En modifikasjon av Turing-testen hvor målene er mellom maskiner og mennesker er en omvendt Turing-test. Et eksempel er brukt av psykoanalytikeren Wilfren Bion , [ 87 ] som har en spesiell fascinasjon for «stormen» som ble resultatet av møtet mellom et sinn og et annet. I sin bok fra 2000, [ 69 ] blant andre originale ideer om Turing-testen, diskuterer Swirski i detalj det han definerer som Swirski-testen (i utgangspunktet Turings test i revers). Han påpeker at den overvinner alle vanlige innvendinger mot standardversjonen.

RD Hinshelwood [ 88 ] fortsatte å utvikle denne ideen ved å beskrive sinnet som et "apparat for å gjenkjenne sinn". Utfordringen vil være for datamaskinen å avgjøre om den samhandler med et menneske eller en annen datamaskin. Dette er en utvidelse av det opprinnelige spørsmålet Turing prøvde å svare på, og tilbyr sannsynligvis en høy nok standard til å definere at en maskin kan "tenke" på samme måte som vi beskriver som menneskelig.

CAPTCHA er en form for Turing-testen i revers. Før brukeren kan utføre en handling på et nettsted, blir brukeren presentert med en serie alfanumeriske tegn i et forvrengt bilde og bedt om å legge dem inn i et tekstfelt. Dette er med det formål å forhindre inntreden av automatiserte systemer som vanligvis brukes til å misbruke nettstedet. Årsaken bak dette er at programvare som er sofistikert nok til å nøyaktig lese og reprodusere bildet ennå ikke eksisterer (eller ikke er tilgjengelig for den gjennomsnittlige brukeren), så ethvert system som er i stand til å bestå testen må være menneskelig.

Programvare som er i stand til nøyaktig å løse CAPTCHA ved å analysere mønstre på genereringsplattformen, utvikles aktivt. [ 89 ] Optical Character Recognition eller OCR er under utvikling som en løsning på utilgjengelighet av CAPTCHA-systemer for mennesker med funksjonshemminger.

Fagekspert Turing tester.

En annen variasjon er beskrevet som variasjonen for emneekspert Turing Test, der en maskins respons ikke kan skilles fra en respons gitt av en saksekspert. Den er kjent som Feigenbaum-testen og ble foreslått av Edward Feigenbaum i en tekst fra 2003. [ 90 ]

Total Turing test

«Total Turing Test» [ 61 ] er en variant som legger krav til den tradisjonelle testen. Avhøreren tester også subjektets perseptuelle evner (som krever datasyn ) og subjektets evne til å manipulere objekter (som krever robotikk ). [ 91 ]

Minimum Signal Intelligence Test

Minimum Intelligence Signal Test ble foreslått av Chris McKinstry som den "ultimate abstraksjonen av Turing-testen", [ 92 ] der bare binære innganger (sant/falsk eller ja/nei) er tillatt med mål om å fokusere på evnen til å tenke . Problemer med tekstsamtaler som antropomorfisk skjevhet elimineres, og det krever ikke simulering av uintelligent menneskelig atferd ved å la den gå inn i systemer som overgår menneskelig intelligens. Spørsmålene er ikke avhengige av hverandre, men dette ligner på en IQ -test enn et avhør. Den brukes vanligvis til å samle inn statistisk informasjon som ytelsen til AI-programmer måles mot. [ 93 ]

Hutter Award

Arrangørene av Hutterprisen mener naturlig språkforståelse er et vanskelig problem for kunstig intelligens tilsvarende å bestå Turing-prøven.

Informasjonskomprimeringstesten har visse fordeler i forhold til de fleste versjoner av Turing-testen, inkludert:

De største ulempene med denne testen er:

Andre tester basert på kompresjon eller Kolmogorov kompleksitet

En Hutter-pris-lignende tilnærming som dukket opp mye tidligere på slutten av 1990-tallet, er inkludering av kompresjonsproblemer i en utvidet Turing-test, [ 94 ] eller ved tester helt avledet fra Kolmogorov Complexity [ 95 ] Andre relaterte bevis er presentert av Hernandez-Orallo og Dowe. [ 96 ]

Algoritmisk IQ, eller AIC, er et forsøk på å gjøre Legg og Hutters teoretiske universelle mål for intelligens (basert på Solomonoffs induktive likegyldighet ) til en funksjonell praktisk test av maskinintelligens. [ 97 ]

To av de største fordelene med disse testene er deres anvendelighet på ikke-menneskelige intelligenser og fraværet av behovet for menneskelige avhørere.

Ebert test

Turing-testen inspirerte Ebert-testen som ble foreslått i 2011 av filmkritiker Robert Ebert som vurderer om en datasyntetisert stemme er i stand til å produsere intonasjoner, bøyninger, timing og andre ting for å få folk til å le. [ 98 ]

Spådommer

Turing spådde at maskiner til slutt ville bestå testen, faktisk estimerte han at innen år 2000 kunne maskiner med minst 100 MB lagringsplass lure 30 % av menneskelige dommere i en 5-minutters test, og at folk jeg ikke ville se på uttrykket "tenkemaskin" som selvmotsigende. [ 4 ] (I praksis, fra 2009 til 2012, klarte Loebner-prisens chatbots bare å lure en dommer én gang [ 99 ] og dette var fordi den menneskelige deltakeren utga seg for å være en chatbot) [ 100 ] Turing spådde også at maskinlæring ville være en viktig del av å bygge kraftige maskiner, en påstand som nå anses som mulig av AI-forskere. [ 48 ]

I et papir fra 2008 som ble sendt inn til den 19. Midwest Artificial Intelligence and Cognitive Science Conference, spådde Dr. Shane T. Mueller at en variant av Turing-testen kalt "Cognitive Decathlon" ville bli fullført om 5 år. [ 101 ]

Ved å ekstrapolere den eksponentielle veksten av teknologi over flere tiår, spådde fremtidsforsker Ray Kurzweil at maskiner som består Turing-testen ville bli produsert i nær fremtid. I 1990 definerte Kurzweil denne nære fremtiden rundt år 2020, [ 102 ] for 2005 endret han anslaget til år 2029. [ 103 ]

" Long Bet Project Nr. 1 " er en innsats på $20 000 mellom Mitch Kapor (pessimist) og Ray Kurzweil (optimist) på muligheten for at en maskin skal bestå Turing-testen innen år 2029. Under Turing-testen For Long Now, de tre dommerne vil gjennomføre intervjuer med hver av de fire deltakerne (f.eks. datamaskinen og tre mennesker) i to timer for totalt 8 timer med intervjuer. Spillet spesifiserer betingelsene i detalj. [ 104 ]

Konferanser

Turing kollokvium

Året 1990 markerte 40-årsjubileet for den første utgivelsen av Turings tekst " Computing Machinery and Intelligence ", og interessen for den ble gjenopplivet. To store begivenheter fant sted det året, den første var Turing-kollokviet basert på University of Sussex i april, dette samlet akademikere og forskere fra forskjellige disipliner for å diskutere Turing-testen med tanke på fortid, nåtid og fremtid; det andre arrangementet var den årlige Loebnerpriskonkurransen.

Blay Whitby listet opp 4 nøkkelpunkter i historien til Turing-testen som dette: publiseringen av "Computing Machinery and Intelligence" i 1950, kunngjøringen av ELIZA i 1966 av Joseph Weizenbaum , opprettelsen av PARRY av Kenneth Colby og Colloquium of Turing av 1990. [ 105 ]

2005 Conversational Systems Colloquium

I november 2005 var University of Surrey vertskap for et møte med utviklere av kunstige samtaleenheter [ 106 ] som ble deltatt av Loebner-prisvinnere: Robby Garner, Richard Wallace og Rollo Carpenter. Gjesteforelesere inkluderte David Hamill, Hugh Loebner ( sponsor av Loebner -prisen ) Huma Shah.

2008 IASC Turing Test Symposium

Parallelt med Loebner-prisen i 2008 basert ved University of Reading [ 107 ] arrangerte Society for the Study of Artificial Intelligence and Simulation of Behavior (IASC) et symposium dedikert til å diskutere Turing-testen, og ble arrangert av John Barnden, Mark Bishop , Huma Shah og Kevin Warwick [ 108 ] Foredragsholdere inkluderte Royal Institution Director Susan Greenfield, Selmer Bringsjord, Andrew Hodges (Turing-biograf) og Owen Holland (bevissthetsforsker). Det ble ikke oppnådd enighet om en kanonisk Turing-test, men Bringsjord bemerket at en større premie ville resultere i å bestå Turing-testen raskere.

2010 IASC Turing Test Symposium

60 år etter introduksjonen diskuterer Turing-eksperimentet om "kan maskiner tenke?" førte til revurdering av AISB-konvensjonen for det 21.  århundre , holdt fra 29. mars til 1. april 2010 ved De Monthfort University, Storbritannia. IASC er Society for the Study of Artificial Intelligence and Behavioural Simulation. [ 109 ]

Året for Turing og Turing100 i 2012

Gjennom hele 2012 ble det holdt et betydelig antall arrangementer for å feire Turings liv og hans vitenskapelige innvirkning. Turing100-gruppen støttet disse arrangementene og organiserte en spesiell Turing-test på Bletchley Park 23. juni 2012 for å feire 100-årsjubileet for Turings fødsel.

2012 IASC/IACAP Turing Test Symposium

De siste diskusjonene om Turing-testen i et symposium med 11 foredragsholdere, organisert av Vincent C. Müller (ACT og Oxford) og Aladdin Ayeshm (De Montfort) med Mark Bishop, John Barnden, Alessio Piebe og Pietro Perconti.

Notater

  1. abcde Saygin , 2000. _ _ _
  2. Turing foreslo opprinnelig en fjernskriver , et av de få kommunikasjonssystemene for kun tekst tilgjengelig i 1950. ( Turing, 1950 , s. 433)
  3. http://www.turing.org.uk/scrapbook/test.html
  4. abcd Turing , 1950 , s. 433.
  5. ( Turing, 1950 , s. 442) Turing kaller ikke ideen sin "Turing-test", men snarere "Imitation Game"; senere litteratur har imidlertid reservert begrepet "Imitasjonsspill" for å beskrive en bestemt versjon av testen. Se #Versjoner av Turing-testen nedenfor. Turing gir en mer presis versjon av spørsmålet senere i avisen: "[D]isse spørsmålene [er] ekvivalente med dette, 'La oss rette oppmerksomheten mot en bestemt digital datamaskin C. Er det sant at ved å modifisere denne datamaskinen til å ha en tilstrekkelig lagringsplass, passende øke hastigheten på handlingen, og gi den et passende program, kan C fås til å spille rollen til A på en tilfredsstillende måte i imitasjonsspillet, den delen av B som blir tatt av en mann?'" ( Turing, 1950 , s. 442)
  6. a b Turing, 1950 , s. 442–454 og se Russell og Norvig (2003, s. 948) , hvor de kommenterer: "Turing undersøkte en lang rekke mulige innvendinger mot muligheten for intelligente maskiner, inkludert praktisk talt alle de som har blitt reist i det halve århundre siden papiret hans dukket opp."
  7. Russell og Norvig, 2003 , s. 2–3 og 948.
  8. Descartes, Rene (1996). Diskurs om metode og meditasjoner om første filosofi . New Haven og London: Yale University Press . s. 34–5 . ISBN  0300067720 . 
  9. Diderot, D. (2007), Pensees Philosophiques, Addition aux Pensees Philosophiques , [Flammarion], s. 68, ISBN  978-2-0807-1249-3  .
  10. For et eksempel på eiendomsdualisme, se Qualia .
  11. Ved å merke seg at materialisme ikke nødvendiggjør muligheten for kunstige sinn (for eksempel Roger Penrose ), mer enn at dualisme nødvendigvis utelukker muligheten. (Se for eksempel Eiendomsdualisme .)
  12. ^ Ayer, AJ (2001), "Language, Truth and Logic", Nature ( Penguin ) 138 (3498): 140, Bibcode : 1936Natur.138..823G , ISBN  0-334-04122-8 , doi : 8/310180.  .
  13. ^ Dartmouth-konferansene i 1956 blir ansett som "fødselen til AI". ( Crevier, 1993 , s. 49)
  14. ^ McCorduck, 2004 , s. 95.
  15. Copeland, 2003 , s. 1.
  16. Copeland, 2003 , s. to.
  17. "Intelligent Machinery" (1948) ble ikke utgitt av Turing, og så ikke publisering før i 1968 i:
    • Evans, A.D.J.; Robertson (1968), Cybernetics: Key Papers , University Park Press  .
  18. Turing, 1948 , s. 412.
  19. I 1948, i samarbeid med sin gamle kollega, DG Champernowne, begynte Turing å skrive et sjakkprogram for en datamaskin som ennå ikke eksisterte, og i 1952, mens han manglet en datamaskin som var kraftig nok til å kjøre programmet, spilte han et spill der han simulerte det, og tok omtrent en halvtime for hvert trekk. Spillet ble tatt opp og showet tapte for Turings kollega Alick Glennie, selv om han sies å ha vunnet en kamp mot kona til Champernowne.
  20. Turing, 1948 .
  21. Harvard, 2004 , s. 1.
  22. abcde Turing , 1950 , s . 434.
  23. ab Shah , 2010 .
  24. Turing, 1950 , s. 446.
  25. Turing, 1952 , s. 524–525. Turing ser ikke ut til å skille mellom «mann» som kjønn og «mann» som menneske. I det første tilfellet vil denne formuleringen være nærmere imitasjonsspillet, mens den i det andre vil være nærmere de gjeldende beskrivelsene av testen.
  26. Weizenbaum, 1966 , s. 37.
  27. abc Weizenbaum , 1966 , s. 42.
  28. Thomas, 1995 , s. 112.
  29. Bowden, 2006 , s. 370.
  30. Colby et al ., 1972 , s. 42.
  31. ^ Saygin, 2000 , s. 501.
  32. Withers, Steven (11. desember 2007), "Flirty Bot Passes for Human" , iTWire .  
  33. Williams, Ian (10. desember 2007), "Online Love Seerkers Warned Flirt Bots" , V3 .  
  34. ^ a b Searle, 1980 .
  35. Det er et stort antall argumenter mot Searles kinesiske rom . Noen få er:
    • [[Larry Hauser
    Larry Hauser|Hauser, Larry]] (1997), "Searle's Chinese Box: Debunking the Chinese Room Argument", Minds and Machines 7 (2): 199-226, doi : 10.1023/A:1008255830248
      ..
  36. M. Bishop & J. Preston (red.) (2001) Essays on Searles Chinese Room Argument. Oxford University Press.
  37. ^ Saygin, 2000 , s. 479.
  38. ^ Lycan, William G. (1995). Bevissthet (på engelsk) . MIT Press. ISBN  978-0-262-62096-3 . Hentet 27. januar 2020 . 
  39. ^ "GRIN - AI og moral" . www.grin.com (på engelsk) . Hentet 27. januar 2020 . 
  40. ^ "Kvalitativ erfaring i maskiner "På mennesket" . nationalhumanitiescenter.org . Hentet 27. januar 2020 . 
  41. ^ Sundman, 2003 .
  42. ^ Loebner, 1994 .
  43. abc " Kunstig dumhet ", 1992 .
  44. abc Shapiro , 1992 og Shieber , 1994 , blant andre.
  45. ^ Shieber, 1994 .
  46. Jabberwacky er diskutert i Shah og Warwick, 2009a .
  47. ^ "Turing Test, i sesong 4, episode 3" . Scientific American Frontiers . PBS . 1993–1994. Arkivert fra originalen i 2006. 
  48. abc Turing , 1950 , s. 442.
  49. ^ Shah, 2009 .
  50. a b Loebner-prisen 2008 .
  51. ^ "Regler for den 20. Loebner-priskonkurransen" , Loebner.net  .
  52. ^ "Datamaskinen består Turing-testen for første gang ved å overbevise dommerne om at det er en 13 år gammel gutt" . TheVerge . Hentet 8. juni 2014 . og overflødig ( hjelp )  |sitioweb=|publicación=
  53. ^ a b "Turing Test-suksess markerer en milepæl i datahistorien" . University of Reading . Hentet 8. juni 2014 . 
  54. http://www.washingtonpost.com/news/morning-mix/wp/2014/06/09/a-computer-just-passed-the-turing-test-in-landmark-trial/
  55. http://www.pcworld.com/article/2361220/computer-said-to-pass-turing-test-by-posing-as-a-teenager.html
  56. Debunking Eugene: Montreal kognitiv vitenskapsmann tviler på det britiske universitetets Turing-testkrav CBC Canada "As It Happens" 10. juni 2014
  57. Adam Mann (9. juni 2014). "Den datamaskinen fikk faktisk en F på Turing-testen" . Kablet . Hentet 9. juni 2014 . 
  58. abc Traiger , 2000 .
  59. ^ Saygin, 2008 .
  60. ^ Shah, 2011 .
  61. ^ a b Oppy, Graham & Dowe, David (2011) Turing-testen . Stanford Encyclopedia of Philosophy .
  62. abcMoor , 2003. _ _
  63. Trager, 2000 , s. 99.
  64. Sterrett, 2000 .
  65. ^ Genova, 1994 , Hayes og Ford, 1995 , Heil, 1998 , Dreyfus, 1979
  66. R.Epstein, G. Roberts, G. Poland, (red.) Parsing the Turing Test: Philosophical and Methodological Issues in the Quest for the Thinking Computer. Springer: Dordrecht, Nederland
  67. ^ Thompson, Clive (16. juli 2005). "Den andre Turing-testen" . Utgave 13.07 ( WIRED magazine) . Hentet 10. september 2011 . «Som en homofil mann som tilbrakte nesten hele livet sitt i skapet, må Turing ha vært godt klar over de sosiale vanskelighetene med å konstant forfalske sin virkelige identitet. Og det er en deilig ironi i det faktum at flere tiår med AI-forskere har valgt å ignorere Turings kjønnsvridende test – bare for å få den grepet av tre kvinner i høyskolealder».  . ( Fullversjon ).
  68. ^ Colby et al ., 1972 .
  69. ab Swirski , 2000 .
  70. ^ Saygin og Cicekli, 2002 .
  71. Turing, 1950 , under "Kritikk av det nye problemet".
  72. Haugeland, 1985 , s. 8.
  73. ^ "Disse seks disiplinene," skriver Stuart J. Russell og Peter Norvig , "representerer det meste av AI." Russell og Norvig, 2003 , s. 3
  74. Watson :
  75. Urban, Tim (16. februar 2015). "AI-revolusjonen: vår udødelighet eller utryddelse" . Vent men hvorfor . Hentet 5. april 2015 . 
  76. ^ Smith, GW (27. mars 2015). "Kunst og kunstig intelligens" . ArtEnt. Arkivert fra originalen 25. juni 2017 . Hentet 27. mars 2015 . 
  77. Turing, 1950 , s. 448.
  78. Flere alternativer til Turing-testen, designet for å evaluere maskiner som er mer intelligente enn mennesker:
  79. Russell og Norvig (2003, s. 958–960) identifiserer Searles argument med den Turing svarer.
  80. Turing, 1950 .
  81. ^ Shah og Warwick, 2010 .
  82. Warwick, K. og Shah, H., "Human Misidentification in Turing Tests", Journal of Experimental and Theoretical Artificial Intelligence, DOI:10.1080/0952813X.2014.921734, 2014
  83. ^ Shieber, 1994 , s. 77.
  84. ^ a b Russell og Norvig, 2003 , s. 3.
  85. Turing, 1950 , under overskriften «The Imitation Game», hvor han skriver: «I stedet for å forsøke en slik definisjon skal jeg erstatte spørsmålet med et annet, som er nært knyttet til det og uttrykkes i relativt entydige ord».
  86. [[John McCarthy (dataforsker) John McCarthy (dataforsker)|McCarthy, John]] (1996), "The Philosophy of Artificial Intelligence" , Hva har AI til felles med filosofi?  .
  87. ^ Bion, 1979 .
  88. ^ Hinshelwood, 2001 .
  89. [[Jitendra Malik Jitendra Malik|Malik, Jitendra]]; Mori, Greg, Breaking a Visual CAPTCHA  .
  90. McCorduck, 2004 , s. 503–505, Feigenbaum, 2003 . Fagstoffeksperttesten er også nevnt i Kurzweil (2005)
  91. Russell og Norvig, 2010 , s. 3.
  92. http://tech.groups.yahoo.com/group/arcondev/message/337
  93. [[Chris McKinstry Chris McKinstry|McKinstry, Chris]] (1997), "Minimum Intelligent Signal Test: An Alternative Turing Test" , Canadisk kunstig intelligens (41)  .
  94. DL Dowe og AR Hajek (1997), "A computational extension to the Turing Test" , Proceedings of the 4th Conference of the Australasian Cognitive Science Society , arkivert fra originalen 2011-06-28 , hentet 2009-07-21 .  .
  95. ^ Jose Hernandez-Orallo (2000), "Beyond the Turing Test" , Journal of Logic, Language and Information 9 (4): 447-466, doi : 10.1023/A:1008367325700 , hentet 2009-07-21 .  .
  96. Hernandez-Orallo og Dowe, 2010 .
  97. An Approximation of the Universal Intelligence Measure, Shane Legg og Joel Veness, 2011 Solomonoff Memorial Conference
  98. Alex_Pasternack (18. april 2011). "En MacBook kan ha gitt Roger Ebert sin stemme, men en iPod reddet livet hans (video)" . hovedkort . Arkivert fra originalen 2011-09-06 . Hentet 12. september 2011 . «Han kaller det «Ebert-testen» etter Turings AI-standard...» 
  99. http://www.loebner.net/Prizef/loebner-prize.html
  100. http://www.newscientist.com/article/dn19643-prizewinning-chatbot-steers-the-conversation.html
  101. Shane T. Mueller, PhD (2008), "Er Turing-testen fortsatt relevant? A Plan for Developing the Cognitive Decathlon to Test Intelligent Embodied Behavior” , Paper sendt til den 19. Midwest Artificial Intelligence and Cognitive Science Conference : 8pp , åpnet  2010-09-08 .
  102. ^ Kurzweil, 1990 .
  103. ^ Kurzweil, 2005 .
  104. Kapor, Mitchell; Kurzweil, Ray, «Innen 2029 vil ingen datamaskin – eller «maskinintelligens» – ha bestått Turing-testen» , The Arena for Accountable Predictions: A Long Bet  .
  105. Whitby, 1996 , s. 53.
  106. ALICE Anniversary and Colloquium on Conversation , ALICE Artificial Intelligence Foundation, arkivert fra originalen 16. april 2009 , hentet 29. mars 2009  .
  107. ^ Loebner-prisen 2008 , University of Reading , hentet 2009-03-29  .
  108. ^ AISB 2008 Symposium on the Turing Test , Society for the Study of Artificial Intelligence and the Simulation of Behaviour, arkivert fra originalen 2009-03-18  , hentet 2009-03-29 .
  109. Towards a Comprehensive Intelligence Test (TCIT): Revurdering av Turing-testen for det 21. århundres symposium , arkivert fra originalen 11. februar 2016 , hentet 6. juni 2015  .

Referanser

Annen lesning

Eksterne lenker