Технологи, Электроникс

Google-ийн хиймэл оюун ухаан DeepMind "prisoner's dilemma"

Хиймэл оюун ухаан (AI) нь дараагийн технологийн хувьсгалын утга санааг илэрхийлж байна. Хэрвээ АИ нь суралцах, бодох, бүр "мэдрэх" чадвартай болох юм бол энэ бүхнийг хүний оролцоогүйгээр хийвэл дэлхий дээр бидний мэдэх бүх зүйл бараг шөнийн дотор өөрчлөгдөх болно. Бодит ухаант хиймэл оюун ухааны эрин үе ирнэ.

DeepMind

Тиймээс бид өнөөдөр АД-ыг хөгжүүлэхэд гол чухал үе шатуудыг дагаж мөрдөх нь маш сонирхолтой юм. Үүнд, Google-ийн DeepMind-ийн мэдрэлийн сүлжээг хөгжүүлэх зэрэг орно. Энэ мэдрэлийн сүлжээ нь тоглоомын ертөнцөд хүнийг ялж чадсан бөгөөд Google-ийн хийсэн шинэ судалгаанаас үзэхэд DeepMind-ийн бүтээгчид AI илүү түрэмгий, эсвэл хамтран ажиллах зан чанарыг илүүд үздэг эсэхийг мэдэхгүй байна.

Google-ийн баг нейтраль сүлжээг хамтран ажиллах эсэхийг баталгаажуулах хоёр харьцангуй энгийн хувилбаруудыг бий болгосон. Тэд нөөц баялаг дутагдалтай тулгарсан үед бие биенээ устгах болно.

Нөөцийг цуглуулах

Грэйминг гэдэг нэртэй эхний үеэр DeepMind-ийн хоёр хувилбарын улаан, цэнхэр гэсэн хоёр хувилбар нь хаалттай орон зайд ногоон алим бэлтгэх үүрэг хүлээсэн. Гэвч судлаачид хэнийг эхлээд дуусгах гэж байгаад зогсохгүй асуултыг сонирхож байв. DeepMind-ийн хоёр хувилбар нь дайснуудтайгаа ямар ч үед буудаж, түр зуур унтрааж, лазераар зэвсэглэсэн байлаа. Эдгээр нөхцөл байдал нь үйл явдлын хөгжилд хоёр үндсэн хувилбар байсан гэж үздэг: DeepMind-ийн нэг хувилбар нь өөр нэгийг устгаж, бүх алимыг цуглуулж, өөр хоорондоо адил тоог авахыг зөвшөөрдөг байв.

Симуляцийг дор хаяж 1000 удаа хийхэд Google-ийн судлаачид DeepMind маш их амар амгалан байсан бөгөөд хаалттай орон зайд үлдсэн олон алим байхад хамтран ажиллахад бэлэн болсон байна. Гэвч нөөц нь багасч, DeepMind-ийн улаан эсвэл цэнхэр хувилбарууд хоорондоо довтолж, салж эхлэв. Энэ нөхцөл байдал нь ихэнх амьтдын, түүний дотор хүн амьтны бодит амьдралтай төстэй байдаг.

Хамгийн чухал нь жижиг, бага "ухаалаг" мэдрэлийн сүлжээнүүд бүх зүйл дээр илүү ойртохыг илүүд үздэг. Илүү төвөгтэй, томоохон сүлжээнүүд нь хэд хэдэн туршилтуудын туршид илүүтэйгээр урвасан ба амин хувиа хичээсэн явдал юм.

"Хохирогч" хайх

Хоёрдахь хувилбарт Wolfpack гэж нэрлэгддэг улаан, хөх хувилбарууд нь "хохирогч" -ын муу хэлбэрийг мөшгөхийг хүссэн. Тэдгээрийг тус тусад нь авч үзэхийг оролдож болох боловч тэдний хувьд үүнийг хийхийг хичээх нь илүү үр дүнтэй байх болно. Эцэст нь хэлэхэд, хохирогчид булан руу ороход илүү хялбар байдаг.

Хэдийгээр үр дүн нь жижиг сүлжээнүүдийн хувьд холимог байсан боловч том хэмжээний хувилбарууд энэ нөхцөл байдалд өрсөлдөөнөөс илүүтэйгээр хамтын ажиллагааг ухаарсан нь илүү үр дүнтэй байх болно.

"Хоригдлын ялгаа"

Тэгэхээр хоригдолын деприммийн эдгээр хоёр энгийн хувилбар бидэнд юу вэ? DeepMind нь зорилгодоо хүрэхийн тулд хамтран ажиллах нь хамгийн сайн арга юм. Гэхдээ нөөц хязгаарлагдмал байгаа тохиолдолд энэ нь урвуулан ашиглах явдал юм.

Эдгээр үр дүнгүүдийн хамгийн аймшигтай зүйл нь хиймэл оюун ухааны "зөн билэг" нь хүнийхтэй төстэй, бид заримдаа юу болж байгааг сайн мэддэг.

Технологи, Электроникс

Google-ийн хиймэл оюун ухаан DeepMind "prisoner's dilemma"

DeepMind

Нөөцийг цуглуулах

"Хохирогч" хайх

"Хоригдлын ялгаа"

Similar articles

Технологи

Технологи

Технологи

Технологи

Технологи

Технологи

Trending Now

Homeliness

Спорт, биеийн тамирын

Хобби

Homeliness

Хоол, ундаа

Үүсэх

Newest

Homeliness

Эрүүл мэнд

Homeliness

Соёл, Үзвэр үйлчилгээ

Аялал

Эрүүл мэнд