Ang AI ay maaaring maging isang sakuna para sa sangkatauhan. Iniisip ng isang nangungunang computer scientist na nasa kanya ang solusyon.
Isinulat ni Stuart Russell ang aklat sa AI at nangunguna sa paglaban upang baguhin kung paano namin ito binuo.

Ang kwentong ito ay bahagi ng isang grupo ng mga kwento na tinatawag
Paghahanap ng mga pinakamahusay na paraan upang gumawa ng mabuti.
Si Stuart Russell ay isang nangungunang AI researcher na literal na sinulat (well, co-authored) ang nangungunang aklat-aralin Naaayon sa paksa. Siya rin, sa nakalipas na ilang taon, ay nagbabala na ang kanyang larangan ay may potensyal na puntahan sakuna mali .
Sa isang bagong libro, Human Compatible , ipinaliwanag niya kung paano. Ang mga AI system, sabi niya, ay sinusuri sa kung gaano sila kahusay sa pagkamit ng kanilang layunin: manalo ng mga video game, pagsusulat ng parang tao na teksto, paglutas ng mga puzzle. Kung tumama sila sa isang diskarte na akma sa layuning iyon, tatakbo sila kasama nito, nang walang tahasang pagtuturo ng tao na gawin ito.
Ngunit sa diskarteng ito, itinakda namin ang aming sarili para sa kabiguan dahil ang layunin na ibinigay namin sa AI system ay hindi lamang ang bagay na pinapahalagahan namin. Isipin ang isang self-driving na kotse na may layunin na makarating mula sa Point A hanggang Point B ngunit hindi namin alam na nagmamalasakit din kami sa kaligtasan ng mga pasahero at ng mga pedestrian sa daan. O isang health care cost-saving system na diskriminasyon laban sa mga itim na pasyente dahil inaasahan nito na mas maliit ang posibilidad na hanapin nila ang pangangalagang pangkalusugan na kailangan nila.
Ang mga tao ay nagmamalasakit sa maraming bagay: pagiging patas, batas, demokratikong input, ating kaligtasan at pag-unlad, ang ating kalayaan. AI system, sabi ni Russell Human Compatible , pakialam lang sa kung ano man ang inilagay natin bilang kanilang layunin. At nangangahulugan ito na mayroong isang sakuna sa abot-tanaw.
Nakilala ko si Russell sa UC Berkeley, kung saan pinamumunuan niya ang Center para sa Human-Compatible AI , upang pag-usapan ang tungkol sa kanyang aklat at tungkol sa mga panganib na dulot ng advanced na artificial intelligence. Narito ang isang transcript ng aming pag-uusap, na-edit para sa haba at kalinawan.
Kelsey Piper
Ano ang kaso na ang advanced AI ay maaaring mapanganib para sa sangkatauhan?
Stuart Russell
Upang masagot ang tanong na iyon, kailangan nating maunawaan: paano idinisenyo ang mga AI system? Ano ang ginagawa nila? At sa Standard Model [ng mga AI system] bumuo ka ng makinarya, algorithm, at iba pa na idinisenyo upang makamit ang mga partikular na layunin na inilagay mo sa programa.
Kaya kung ito ay isang chess program, binibigyan mo ito ng layunin na talunin ang iyong kalaban, na manalo sa laro. Kung ito ay isang self-driving na kotse, ang pasahero ay naglalagay sa layunin: [halimbawa,] Gusto kong nasa airport.
Para maayos ang lahat. Dumarating ang problema kapag nagiging mas matalino ang mga sistema. Kung inilagay mo sa maling layunin, ang system na humahabol dito ay maaaring gumawa ng mga aksyon na labis mong ikinalulungkot.
Tinatawag namin itong problemang King Midas. Tinukoy ni Haring Midas ang kanyang layunin: Gusto kong maging ginto ang lahat ng mahawakan ko. Nakuha niya talaga ang hinihiling niya. Sa kasamaang palad, kasama doon ang kanyang pagkain at inumin at mga miyembro ng kanyang pamilya, at namatay siya sa paghihirap at gutom. Maraming kultura ang may parehong kuwento. Binibigyan ka ng genie ng tatlong kahilingan. Laging ang pangatlong hiling ay paki-undo ang unang dalawang hiling dahil sinira ko ang mundo.
At sa kasamaang-palad, sa mga system na mas matalino at samakatuwid ay mas makapangyarihan kaysa sa amin, hindi mo kailangang makakuha ng pangalawa at pangatlong kahilingan.
Kaya ang problema ay nagmumula sa pagtaas ng mga kakayahan, kasama ng aming kawalan ng kakayahan na tukuyin ang mga layunin nang buo at tama. Maaari ba nating ibalik ang ating carbon dioxide sa mga makasaysayang antas upang maibalik natin sa balanse ang klima? Mukhang isang mahusay na layunin. Buweno, ang pinakamadaling paraan upang gawin iyon ay alisin ang lahat ng mga bagay na gumagawa ng carbon dioxide, na nangyayari sa mga tao. Gusto mong pagalingin ang cancer sa lalong madaling panahon. Napakaganda, tama? Ngunit ang pinakamabilis na paraan upang gawin ito ay ang magpatakbo ng mga medikal na pagsubok na kahanay ng milyun-milyong paksa ng tao o bilyun-bilyong paksa ng tao. Kaya binibigyan mo ang lahat ng kanser at pagkatapos ay makikita mo kung anong mga paggamot ang gumagana.
Kelsey Piper
Hindi ba natin maisusulat ang lahat ng hindi natin ibig sabihin? Huwag lumabag sa anumang batas, huwag pumatay ng sinuman ...
Stuart Russell
Kaya, sinubukan naming magsulat ng batas sa buwis sa loob ng 6,000 taon. Gayunpaman, ang mga tao ay gumagawa ng mga butas at paraan sa paligid ng mga batas sa buwis upang, halimbawa, ang ating mga multinasyunal na korporasyon ay nagbabayad ng napakaliit na buwis sa karamihan ng mga bansang kanilang pinapatakbo. Nakakakita sila ng mga butas. At ito ang tinatawag kong loophole principle sa libro. Hindi mahalaga kung gaano ka kahirap maglagay ng mga bakod at panuntunan sa paligid ng pag-uugali ng system. Kung mas matalino ito kaysa sa iyo, hahanap ito ng paraan para magawa ang gusto nito.
Kelsey Piper
Human Compatible inilalarawan ang problemang ito. Naglalagay kami ng mga maling layunin sa mga system na ito. Sinusubukan at kumpletuhin ng mga system ang kanilang mga layunin ngunit ang kanilang mga layunin ay hindi sumasaklaw sa lahat ng bagay na pinapahalagahan namin. Ano ang solusyon?
Stuart Russell
Kung magpapatuloy ka sa kasalukuyang landas, ang mas mahusay na AI ay nakakakuha, ang mas masahol na bagay para sa amin. Para sa anumang naibigay na maling nakasaad na layunin, mas mahusay na nakakamit ng isang sistema ang layuning iyon, mas malala ito.
Ang diskarte na iminungkahi namin sa ikalawang kalahati ng aklat ay ang pagdidisenyo namin ng mga AI system sa ganap na naiibang paraan. Huminto kami sa paggamit ng karaniwang modelo, na nangangailangan sa amin na tukuyin ang isang nakapirming layunin. Sa halip, ang AI system ay mayroong constitutional requirement na ito ay kapaki-pakinabang sa mga tao.
Pero alam nya yun hindi alam kung ano ang ibig sabihin nito. Hindi nito alam ang aming mga kagustuhan. At alam nito na hindi nito alam ang aming mga kagustuhan tungkol sa kung paano dapat magbukas ang hinaharap.
Kaya nakakakuha ka ng ganap na iba't ibang pag-uugali. Karaniwan, ang mga makina ay nagpapaliban sa mga tao. Humihingi sila ng pahintulot bago gumawa ng anumang bagay na nakakagulo sa bahagi ng mundo.
Kelsey Piper
At wala silang mga insentibo upang linlangin tayo tungkol sa mga epekto ng isang kurso ng pagkilos?
Stuart Russell
Isa pang layer ng komplikasyon iyon kung saan nagkakamali ang karaniwang modelo.
Ang isang sistema na nagsusumikap sa isang layunin na nakapirming nagmamasid sa pag-uugali ng tao at inaasahan na ang tao ay maaaring subukang manghimasok dito. Sa halip na sabihing, Oh, oo, mangyaring i-off ako o baguhin ang layunin, ang [AI na ito] ay talagang magpapanggap na ginagawa ang gusto ng mga tao para lang pigilan tayong manghimasok nang matagal hanggang sa magkaroon ito ng sapat na kapangyarihan upang makamit nito ang layunin sa kabila pakikialam ng tao. Kaya binibigyan mo ito ng insentibo upang linlangin kami tungkol sa mga kakayahan nito, tungkol sa mga plano nito. At malinaw na hindi ito ang gusto natin.
[Ang isang AI na sinusubukang matutunan kung ano ang gusto ng mga tao] ay may insentibo na maging tapat tungkol sa mga plano nito dahil gusto nitong makakuha ng feedback at iba pa.
Kelsey Piper
Isa kang nangungunang AI researcher sa loob ng mga dekada. Nagtataka ako kung saan ka naging kumbinsido na ang AI ay mapanganib.
Stuart Russell
Kaya sa loob ng mahabang panahon ay hindi ako komportableng nalaman na wala kaming sagot sa tanong na: Paano kung magtagumpay ka? Sa katunayan, ang unang edisyon ng [aking] aklat-aralin ay may isang seksyon na may pamagat na iyon, dahil ito ay isang medyo mahalagang tanong upang itanong kung ang isang buong larangan ay tumutulak patungo sa isang layunin. At kung mukhang, kapag nakarating ka doon, na maaari mong alisin ang sangkatauhan mula sa isang bangin, kung gayon iyon ay isang problema.
Kung tatanungin mo, okay, gagawa kami ng mga bagay na mas matalino, mas makapangyarihan kaysa sa amin. Paano natin inaasahan na [panatilihin] natin ang kapangyarihan mula sa mas makapangyarihang [mga entidad] magpakailanman? Hindi halata na may sagot ang tanong na iyon.
Sa katunayan, sinabi ng [computer scientist na si Alan] Turing na kailangan nating asahan na ang mga makina ay makokontrol. Siya ay ganap na nagbitiw dito at ang aming mga species ay mapapakumbaba, gaya ng sinabi niya. Kaya't malinaw na isang nakakagambalang estado ng mga gawain.
Ito ay mas malinaw sa akin simula sa unang bahagi ng 2010s. Ako ay nasa sabbatical sa Paris. Nagkaroon ako ng mas maraming oras upang pahalagahan ang kahalagahan ng karanasan at sibilisasyon ng tao. At pansamantala, ang iba pang mga mananaliksik, karamihan sa labas ng larangan, ay nagsimulang ituro ang mga mode na ito ng pagkabigo: na ang mga nakapirming layunin ay humantong sa lahat ng mga hindi kanais-nais na pag-uugali, panlilinlang at potensyal na di-makatwirang masamang kahihinatnan mula sa pagkonsumo ng mapagkukunan, mula sa mga insentibo sa pagtatanggol sa sarili.
So the confluence of those things led me to start thinking about, okay, paano natin aayusin ang problema?
Kelsey Piper
Nabasa ko ang ilang mga kritisismo at tugon sa Human Compatible . Ang isang bagay na naririnig mo ay nag-aalala tungkol sa AI ngayon ay tulad ng mga tao noong 1700s na nag-aalala tungkol sa kung paano pipigilan ang mga space shuttle mula sa pagsabog. Dahil hindi namin alam kung ano ang magiging pangkalahatang AI, hindi namin maaaring isipin kung paano ito idisenyo nang ligtas.
Stuart Russell
Sa tingin ko, kapaki-pakinabang ang pagbabalik-tanaw sa kasaysayan ng nuclear energy at nuclear physics, dahil marami itong pagkakatulad. Hindi, hindi ito perpektong pagkakatulad. Ngunit nang imbento ni Leo Szilard ang nuclear chain reaction, hindi niya alam kung aling mga atomo ang maaaring mahikayat na dumaan sa isang fission reaction at makagawa ng mga neutron na magbubunga ng mas maraming reaksyon ng fission.
Sinabi niya, Okay, ito ay isang posibleng paraan kung saan maaaring magkaroon ng chain reaction.
At nagawa niyang magdisenyo ng nuclear reactor sa batayan lamang na iyon , kabilang ang mga mekanismo ng pagkontrol ng feedback na magpapanatili ng reaksyon sa subcritical na antas upang hindi ito sumabog. Nagkaroon kami ng plano nang hindi alam na may ganoong reaksyon.
Kaya maaari mong pag-usapan ang pangkalahatang istraktura at disenyo ng mga system nang hindi nauunawaan kung paano gagawin ang lahat ng mga bahagi sa paraang gusto mo. Ang isang bagay na malinaw tungkol sa mga pangkalahatang sistema ng AI [ay] sila ay magiging mas matalino kaysa sa mga mayroon tayo ngayon. At ang punto tungkol sa karaniwang modelo [ng mga layunin ng AI] ay ang mas matalinong sistema, mas malala ang nangyayari.
Kelsey Piper
Isa pang linya ng pagpuna na nakita ko — sa tingin ko ito ay isang bagay na mayroon si Yann LeCun sa Facebook ipinahayag - ay hindi lang natin kailangang mag-alala na hindi gagawin ng mga system ang gusto nating gawin nila. Hindi kami gagawa ng mga sistemang ganoon.
Stuart Russell
Iyan ay tulad ng pagtatalo, Well, siyempre, hindi kami magtatayo ng mga nuclear reactor na sumabog kaya hindi namin kailangang mag-alala tungkol sa kaligtasan ng nuklear. tama? Iyan ay katawa-tawa. Sa libro, sinasabi ko na parang nasa eksena ng isang aksidente at sinasabing walang dapat tumawag ng ambulansya dahil isang tao ay tatawag ng ambulansya.
Ang tanging paraan para makuha mo ang kaligtasang nuklear ay sa pamamagitan ng pag-aalala tungkol sa mga paraan na maaaring sumabog ang [mga reaktor] at pinipigilan silang sumabog.
Ang isang kawili-wiling argumento, na tinalakay ko nang kaunti sa aklat, ay maaari mong isipin ang mga korporasyon bilang, sa isang kahulugan, mga makina. Ang mga ito ay epektibong mga makina na naka-set up upang i-maximize ang isang iniresetang layunin, ibig sabihin, quarterly na kita. Maaari mong tingnan ang industriya ng fossil fuel bilang isang super-intelligent na makina na talagang, sa pagtugis ng layunin nito, ay niloko ang sangkatauhan. Kaya't gumawa sila ng isang 50-taong uri ng pampulitika na pagbabagsak, kampanya sa disinformation sa relasyon sa publiko upang maipagpatuloy nila ang pagbomba ng carbon dioxide.
Mayroon nang mga quasi-machine super-intelligent na entity na nagdudulot ng mga problema dahil sila ay nagtataguyod ng mga maling layunin, at malinaw na hindi ito ang kaso na syempre gumagana out.
Gumagawa si Yann LeCun ng iba pang mga argumento, gayundin si Steven Pinker [isa pang AI risk skeptic]. [Ang isang argumento ay] na isang pagkakamali na isipin na ilalagay natin ang mga layunin ng dominasyon sa mundo, ang mga layunin ng pagtatanggol sa sarili, pangangalaga sa sarili. Walang dahilan para gawin iyon. At hangga't hindi tayo, walang masamang mangyayari.
At iyon, sa palagay ko, ay maling pakahulugan o hindi pagkakaunawaan sa isa sa mga pangunahing argumento sa buong debateng ito, na hindi mo mayroon upang ilagay ang mga layuning iyon. Ang mga ito ay mga subgoals ng pagpupursige sa halos anumang nakapirming layunin.
Kelsey Piper
Ano ang pinakamalaking maling akala tungkol sa aklat o tungkol sa iyong trabaho na nakita mo?
Stuart Russell
Mayroong pangkalahatang maling kuru-kuro tungkol sa AI — na ipinahayag ng Hollywood para sa mga dahilan ng pagkakaroon ng mga kawili-wiling plot at ng media, dahil tila gusto nilang maglagay ng mga larawan ng Terminator robot sa bawat artikulo — na ang bagay na kailangan nating alalahanin ay ang kamalayan, na kahit papaano ay hindi sinasadyang magkaroon ng kamalayan ang mga makinang ito at pagkatapos ay kapopootan nila ang lahat at susubukang patayin tayo.
At iyon ay isang kabuuang pulang herring lamang. Ang bagay na inaalala natin dito ay ang karampatang, epektibong pag-uugali sa mundo. Kung ang mga makina ang magpapasya sa atin, hindi tayo iniisip sa totoong mundo, kailangan nating malaman kung paano natin masisiguro na sila ay kumikilos lamang sa ngalan natin at hindi kumikilos nang salungat sa ating mga interes.
Mag-sign up para sa Future Perfect newsletter. Dalawang beses sa isang linggo, makakakuha ka ng isang pag-iipon ng mga ideya at solusyon para sa pagharap sa aming pinakamalalaking hamon: pagpapabuti ng kalusugan ng publiko, pagpapababa ng pagdurusa ng tao at hayop, pagpapagaan ng mga sakuna na panganib, at — sa madaling salita — pagpapabuti sa paggawa ng mabuti.