Через активного розвитку технологій машинного навчання, штучного інтелекту і робототехніки багато фахівців висловлюють свої побоювання щодо можливості так званого повстання машин. Не в останню чергу це пов'язано з тим, що у численних фантастичних оповіданнях і фільмах роботи підпорядковували собі людство або ж зовсім знищували людей по тій або іншій причині. Щоб цього не сталося, два найбільших розробника в області штучного інтелекту вирішили об'єднати свої зусилля. Мова йде про компанії DeepMind, що належить Google, і Open AI, заснованої Ілона Маском - творцем SpaceX і Tesla Motors.
DeepMind і Open AI опублікували дослідницьку статтю, в якій описується новий метод машинного навчання. Його суть полягає в отриманні сигналів від людей для вивчення нових завдань. Фахівці вважають, що це повинно бути безпечніше, ніж дозволяти штучного інтелекту самостійно вирішувати ту чи іншу задачу, що може привести до несподіваних наслідків.
На думку дослідників, головна проблема полягає в тому, що штучний інтелект використовує найбільш ефективний метод для досягнення максимальної вигоди. Це можна порівняти з тим, щоб згребти все розкидані речі з підлоги в шафу і назвати цю кімнату чистою. Чисто технічно кімната дійсно є чистою, але це не той результат, який потрібно. Машини здатні знаходити такі обхідні шляхи і використовувати їх для вирішення будь-якої проблеми.
Нагальна проблема полягає в системі винагород. Саме в цьому напрямку обидві компанії зосередили свої зусилля.
Замість того, щоб створювати надмірно складну систему винагороди, яку можуть обійти машини, дослідники використовували людський внесок для винагороди штучного інтелекту. Коли машина вирішує проблему, як цього хотіли тренери, вона отримує позитивний відгук. За допомогою цього методу система змогла навчитися грати в прості відеоігри.
У DeepMind і Open AI тільки почали працювати в цьому напрямку, але компанії вважають, що контроль з боку людини допоможе запобігти небажаним наслідкам рішень, прийнятих машинами.