В Україні має вийти книга «Код творчості. Як штучний інтелект вчиться писати, малювати, думати». Публікуємо уривок з неї

Українське видавництво ArtHuss готує до друку книгу «Код творчості. Як штучний інтелект вчиться писати, малювати, думати». Її автором є Маркус де Сейтуа, британський письменник, дослідник теорії чисел і ведучий серіалу BBC «Історія математики». У цій книзі він досліджує природу творчості, а також закликає нас переглянути, що означає бути людиною.

Пропонуємо прочитати фрагмент цього видання і гадаємо, це буде цікаво усім, хто цікавиться ігровою індустрією та світом штучного інтелекту.

Увага! На сайті ArtHuss діє промокод gamedevdou, який дає знижку 15% на будь-які купівлі через кошик.


Уривок з книги «Код творчості»

...Якщо для здійснення своєї мрії — створення програми, що грає в Ґо, Гассабіс збирався використовувати метод, яким мозок навчається вирішувати проблеми, йому мало би допомогти знання про те, як, власне, працює мозок. Тож він вирішив вступити до аспірантури з нейробіології при Університетському коледжі Лондона. Саме там, під час перерв на каву в процесі лабораторної роботи, Гассабіс почав обговорювати плани про створення компанії для випробування своїх ідей із нейробіологом Шейном Леґґом. Та обставина, що вони ніколи не ділилися з викладачами мрією присвятити своє життя розробкам штучного інтелекту, показує, наскільки мало уваги приділялося штучному інтелекту ще десять років тому. Але вони відчували, що йдуть правильним шляхом, і у вересні 2010 року двоє науковців вирішили створити разом із Мустафом Сулейманом, другом дитинства Гассабіса, свою фірму. Так з’явилася на світ компанія DeepMind.

Компанії потрібні були гроші, але спочатку Гассабісу ніяк не вдавалося залучити бодай якісь капітали. Більшості інвесторів ідея компанії, присвяченої іграм і дослідженням інтелекту, здавалася недостатньо серйозною. Однак знайшлися й ті, хто повірив у це. Серед інвесторів, які першими вклали кошти в цей проєкт, були Ілон Маск і Пітер Тіль. Тіль ніколи не інвестував за межами Кремнієвої долини й намагався вмовити Гассабіса перебратися на Західне узбережжя США. Але Гассабіс, який народився і виріс у Лондоні, наполягав на своєму, стверджуючи, що в Лондоні набагато більше незатребуваних талантів, яких можна залучити до справи. Гассабіс згадує абсурдну розмову з юристкою Тіля. «„А в Лондоні є закони про інтелектуальну власність?“ — невинним тоном запитала вона. Я думаю, їм здавалося, що ми з якогось Тімбукту!». Засновникам компанії довелося віддати інвесторам більшу частину акцій, зате вони отримали гроші, що дозволяли розпочати вирішення проблеми штучного інтелекту.

Створення машини, здатної навчитися грати в Ґо, усе ще було далекою мрією. Спершу вони взялися за завдання, яке здавалося менш незрозумілим: освоєння ігор Atari 1980-х років. Імовірно, компанія Atari відповідальна за багато учнівських прогулів 1970-х і початку 1980-х. Я особисто добре пам’ятаю, скільки часу витратив, граючи на приставці Atari 2600 свого друга в Pong, Space Invaders та Asteroids. Ця приставка була одним із перших пристроїв, конструкція яких дозволяла грати не в одну, а в кілька різних ігор, що завантажувалися на касетах. Така система відкрила можливість створити з часом цілий спектр різноманітних ігор. Давніші приставки дозволяли грати лише в одну гру, що була фізично вбудована в них.

Одна з моїх улюблених ігор Atari називалася Breakout. У верхній частині екрану була стіна з різнокольорових цеглинок, а гравець керував розташованою внизу ракеткою, яку можна було рухати ліворуч або праворуч за допомогою джойстика. Кулька відскакувала від ракетки й летіла убік цеглинок. Щоразу, коли вона поціляла в якусь цеглинку, та зникала. Метою гри було вибити з екрану всю цеглу. За влучання в одну з жовтих цеглинок, із яких складалася нижня частина стіни, нараховувалося одне очко. Червоні цеглинки у верхній частині приносили по сім очок. У міру зникнення цегли ракетка ставала все меншою, а кулька літала все швидше, це ускладнювало гру.

Одного разу ми вигадали хитрий спосіб зламати гру, і це була неймовірна втіха. Треба було пробити тунель крізь цеглу на краю екрану, тоді кулька пролітала крізь нього, опинялася поверх стіни й починала скакати туди-сюди, відбиваючись від верхнього краю екрана та верхніх цеглинок і поступово руйнуючи стіну. Гравець міг розслабитися і просто стежити за процесом, поки кулька зрештою не прилітала знову вниз. Треба було тільки тримати ракетку напоготові, щоб знову відбити кульку вгору. Дуже приємна стратегія!

Гассабіс та інші члени групи, яку він збирав у цей час, також багато грали в комп’ютерні ігри в дитинстві. Можливо, їхнім батькам було приємно дізнатися, що час і сили, витрачені на ці ігри, не було змарновано. Гра Breakout виявилася ідеальним полігоном для перевірки можливостей колективу DeepMind запрограмувати комп’ютер на навчання ігор. Написати програму для кожної окремої гри було порівняно нескладно. Але Гассабіс і його колеги ставили собі набагато важчі завдання.

Вони хотіли написати програму, яка отримувала б на вході стан пікселів екрану та поточний рахунок — і грала так, щоб максимізувати рахунок. Правила гри програмі не повідомляються: вона повинна випадковим чином експериментувати, рухаючи в різні боки ракетку в Breakout або по-різному стріляючи з лазерної гармати по кораблях прибульців, що знижуються, у Space Invaders. Кожного разу, коли програма робить хід, вона може оцінити, чи привів він до збільшення рахунку — чи не справив жодного ефекту.

Ця програма реалізує концепцію навчання, що виникла ще в 1990-х роках, із підкріпленням, яке передбачає коригування ймовірності певних дій залежно від впливу на функцію винагороди або рахунок. Наприклад, у грі Breakout можна ухвалити лише одне-єдине рішення — зрушити ракетку, розташовану внизу екрана, ліворуч або праворуч. Спочатку вибір робиться з імовірністю 50 на 50. Але якщо випадкове переміщення ракетки веде до поціляння по кульці, через короткий час після цього рахунок збільшується. Тоді програма перекалібровує ймовірність зміщення вліво або вправо з урахуванням цієї нової інформації. Це збільшує ймовірність пересування в тому ж напрямку, у якому рухається кулька. Нововведенням було поєднання такого навчання з нейронними мережами, які мали оцінювати стан пікселів і вирішувати, які саме елементи співвідносяться зі зростанням рахунку.

Спочатку, оскільки комп’ютер просто тестував випадкові ходи, гра була жахлива; він майже не набирав очок. Але щоразу, коли черговий випадковий хід зумовлював збільшення рахунку, програма запам’ятовувала цей хід і активніше використовувала його надалі. Поступово випадкові ходи зникли, і почав виявляти більш обґрунтований малюнок гри — ходи, котрі, як програма з’ясувала на досвіді, сприяли зростанню рахунку.

Варто подивитися відеоролик, що його співробітники DeepMind доклали як ілюстрацію до написаної згодом статті про цю роботу. У ньому показано, як програма навчається грати у Breakout. Спочатку видно, як вона випадково рухає ракетку туди-сюди, аби дізнатися, що з цього вийде. Потім, коли кулька нарешті поціляє в ракетку, відскакує від неї й розбиває цеглу, а рахунок збільшується, програма починає переписувати саму себе. Очевидно, що дотик пікселів ракетки з пікселями кульки дає позитивний результат. Після 400 партій програма грає вже майстерно: ракетка постійно спрямовує кульку то туди, то сюди.

Але справжнього шоку я зазнав, коли побачив, що вона відкрила, зігравши 600 партій. Вона знайшла нашу лазівку! Не знаю точно, скільки партій довелося зіграти нам у дитинстві, щоб освоїти цей фокус, але, судячи з кількості часу, який ми витратили з другом, їх цілком могло бути й більше. І ось тобі на! Керуючи ракеткою, програма стала пробивати з боків тунелі, щоб заганяти кульку в простір між верхом стіни і верхнім краєм екрану. Після цього рахунок починає зростати дуже швидко, а комп’ютеру майже нічого не доводиться робити. Наскільки пам’ятаю, коли ми з другом відкрили цей трюк, то аж стрибали від захвату. Машина ж не відчула нічого...


Підписуйтеся на Telegram-канал @gamedev_dou, щоб не пропустити найважливіші статті і новини

👍ПодобаєтьсяСподобалось1
До обраногоВ обраному0
LinkedIn


Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Підписатись на коментарі