Користь і шкода AI для генерування зображень. Швидкі відповіді на непрості питання

Привіт усім. Після войсчату на тему штучного інтелекту, з’явилася ідея спільно з Gamedev.DOU створити блог з питаннями-відповідями по цій темі й зібрати основну важливу інформацію в одному місці. Нехай вона буде вам корисною =]

Розглянуті питання:

— Що таке AI (штучний інтелект) для генерації зображень
— Як працює AI
— Чому художники розпочали протест проти цієї технології
— Які найбільші страхи у художників перед AI
— Художники теж використовують референси в роботі. Чому AI не може робити так само
— Чи доречно порівнювати протести художників проти AI з луддизмом, появою фотокамери тощо
— Я не художник. Чому мене це має хвилювати
— Чи можна якось дізнатися, чи потрапили мої роботи/фотографії/особисті зображення будь-якого іншого характеру в базу даних AI
— Кому належать генеровані зображення? Якщо я згенерую картинку, чи стаю я автоматично авторкою/автором цієї картинки
— За яких умов художників би влаштувало співіснування з AI
— Чи є для 2D/3D художників якісь плюси такого стрімкого розвитку «художнього» штучного інтелекту
— Чи мають страйки проти AI якийсь практичний сенс
— Що я можу зробити для підтримки протесту/правової регуляції AI
— Що робити 2Д-художникам, щоб убезпечити себе від перспективи того, що їх замінить AI

Що таке штучний інтелект для генерації зображень

Мова йде про програмний продукт, нейромережу, котра здатна генерувати зображення на основі текстових запитів (наприклад, Midjourney, Dall-e, Stable Diffusion та інші). Такі нейромережі створюються шляхом машинного навчання (тренування) — наданні комп’ютерам здатності покращувати продуктивність у виконанні задачі завдяки використанню інформації з певної бази даних (наприклад, з набору зображень).

Як працює AI

Такі AI, як Stable Diffusion, покладаються на математичний процес, який називається Diffusion (з англ. — розмиття, дифузія). Цей процес використовується для зберігання стислих копій зображень, на яких «тренується» AI, для їх подальшої рекомбінації задля отримання інших зображень. Простими словами, це інструмент для створення колажу 21-го століття.

Діаграма нижче ілюструє процес дифузії на прикладі спіралі: спершу комп’ютер визначає оригінальне зображення спіралі як базове, і «дифузить» його — додає шум доти, доки зображення повністю не втрачає форму. Після цього запускається зворотний процес — прибирання шуму із зображення, допоки воно знову не набуде форми спіралі. Таким чином ми отримуємо копію оригінального зображення, однак з неточностями й відмінностями, бо шум в процесі дещо деформував оригінальний малюнок.

Джерело зображення: матеріал взято з судового позову художників проти Stable Diffusion. Тут можна дізнатися ще більше, дуже рекомендую прочитати всю справу, а також закріплені у ній посилання на дослідження

У 2020 році процес Diffuse удосконалили технологією інтерполяції з прихованими (латентними) зображеннями. Якщо коротко, то AI навчився генерувати копії оригінальних зображень, зберігати ці копії як приховані (латентні), і надалі уже зі змішування латентних зображень створювати похідні зображення — кінцевий продукт, який бачить користувач.

Чому художники розпочали протест проти цієї технології

Основна причина протестів — використання робіт художників (і не тільки) для тренування AI без їхньої згоди на це. Наразі усі відомі мені AI (Midjourney, Stable Diffusion, Dall-e, Lensa) працюють на базах даних, котрі наповнені авторським контентом.

З відповіді на питання «Як працює AI?» можемо побачити, що AI не здатен створити новий образ. Він може лише скопіювати уже наявні зображення і змішати їх для утворення похідного зображення. Тому, увесь генерований такими AI контент є, по суті, прихованим колажем із робіт різних авторів. Оскільки використані для генерування роботи належать конкретним людям — використання їхнього доробку без згоди на це є грубим порушенням авторського права.

Які найбільші страхи у художників перед AI

⦁ Бути заміненими на AI в роботі.

⦁ Зменшення глобальної ціни за візуальний контент через перенасичення ринку генерованими картинками.

⦁ Крадіжка авторських робіт для тренування AI без їхньої на це згоди (грубе порушення авторського права).

⦁ Розмиття/крадіжка імені автора (генерація безмежної кількості контенту під іменем конкретного автора, в його стилі, шляхом тренування AI на його роботах без його на це згоди, й подальша монетизація копій робіт автора) (грубе порушення авторського права).

⦁ Як наслідок — проблематика доказовості, неможливість відрізнити генеровані копії від оригінальних робіт автора. Якщо автор не може довести авторство над своїми ж роботами — це ставить під питання існування авторського права як такого.

Художники теж використовують референси в роботі. Чому AI не може робити так само

Коли людина надихається мистецтвом інших — вона цю інформацію пропускає через фільтр власних навичок, досвіду, ідей та емоцій. Якщо ви перед групою художників поставите яблуко і попросите їх його намалювати — ви отримаєте унікальні малюнки, не схожі один на одного. В кожному малюнкові проявиться індивідуальність автора.

В AI такого фільтра немає, він може генерувати картинки лише на базі чогось. Простими словами: якщо ви напишете у запиті до AI «яблуко» — AI вибере кілька фотографій яблук й на базі цих фотографій видасть вам похідне зображення.

Якщо ви попросите «яблуко в стилі Густава Клімта» — він змішає фотографії яблук із фотографіями робіт Густава Клімта й у вас, скоріш за все, вийде яблуко з догенерованими патернами й орнаментами із робіт Клімта. Якщо ж в базі AI не знайдеться робіт цього художника — ви ніяк не зможете повторити його стиль, а тому знову отримаєте звичайне яблуко.

Людина, малюючи яблуко, не потребує використання фотографії яблука чи малюнка цього яблука іншим автором як основи для своєї роботи. Людині для цього достатньо власної пам’яті й уяви, тоді як AI не здатен генерувати жоден контент без бази даних з контенту, створеного людьми.

Чи доречно порівнювати протести художників проти AI з луддизмом, появою фотокамери тощо

⦁ Коротка відповідь — ні, це все дуже різні ситуації.

⦁ Термін «луддизм» з’явився в літературі на позначення перших стихійних виступів робітників заводів проти впровадження машин у роботі мануфактур на заміну працівникам і капіталістичної експлуатації у Великій Британії. На противагу повстанням луддитів, художники не виступають «проти AI», художники проти «неетичного AI», проти порушення авторського права й проти кібербулінгу митців на тему AI (знецінення праці авторів, хоч усі наявні AI працюють саме на авторському контенті, погроз стосовно викрадення портфоліо конкретних митців для тренування AI тощо).

⦁ Стосовно появи фотографії — то фотомистецтво не є залежним від захищеного авторським правом джерела, тоді як AI цілком і повністю залежать від витворів мистецтва, створених людьми. Якщо вже використовувати аналогію з фотографією — то тут більш доцільно було б ужити порівняння з фотографом, котрий сфотографував витвір мистецтва художника і намагається монетизувати цю фотографію під своїм авторством уже як новий витвір.

Я не художник. Чому мене це має хвилювати

Є неетичні проблеми в AI, які стосуються усіх людей будь-яких професій:

1) У базах даних AI є не лише матеріали мистецького характеру, але й особисті фотографії, медичні матеріали, порнографія тощо (для цікавості — можете перевірити, чи не поцупили, бува, й ваші особисті дані haveibeentrained.com.

2) Наразі вилучити контент з уже тренованих AI неможливо. Принаймні розробники AI запевняють, що зараз AI не здатен забувати те, що вже «вивчив».

3) Авторське право стосується не лише художників. Це також застосовується до фотографів, дизайнерів, аніматорів, письменників, програмістів, кінематографістів, музикантів, композиторів, копірайтерів, контент-мейкерів тощо. Так сталося, що художники першими стикаються зі значними проблемами стосовно AI, тоді як вплив на інші індустрії поки що — наскільки мені відомо — не такий значний.

Чи можна якось дізнатися, чи потрапили мої роботи/фотографії/особисті зображення будь-якого іншого характеру в базу даних AI

Так, для цього можете скористатися цим сайтом: haveibeentrained.com.

Кому належать генеровані зображення. Якщо я згенерую картинку, чи стаю я автоматично авторкою/автором цієї картинки

Оскільки наразі немає закону, який би дав визначення авторства генерованого зображення, компанії зі створення AI визначили це по-своєму: одні вважають, що саме вони володіють правами на всі зображення, згенеровані користувачами з допомогою їхнього AI. Інші вирішили оприлюднити всі згенеровані зображення у відкритий доступ.

Деякі з користувачів намагалися закріпити себе як авторів генерованого ними контенту для подальшої легалізованої монетизації, однак з відомих мені прикладів їм було відмовлено у наданні авторства.

Приклад 1: кейс із коміксом, повністю згенерованим AI — відмова в отриманні авторського права.

UPD: Після написання блогу з’явилася інформація про те, що відмова була видана через помилку в системі. Нещодавно рішення про відмову відмінили, однак процес досі триває. На момент написання цього тексту, Бюро авторських прав США ще не винесло рішення з цього приводу. Детальніше тут

Приклад 2: відмова Стівену Талеру в отриманні авторського права на згенероване зображення.

За яких умов художників би влаштувало співіснування з AI

ШІ повинен стати легальним та етичним. Для цього потрібно 5 речей:

1) Заборона використання в тренуванні AI контенту, захищеного авторським правом без згоди на це автора.

2) Система підписки Opt-in — ВСІ захищені авторським правом роботи автоматично заборонено додавати в бази даних AI, можна додати лише якщо сам автор дасть на це згоду (наразі авторам пропонується система opt-out — автоматично весь авторський контент «підписаний» до тренування, якщо автор проти — «відписка» лежить на його відповідальності).

3) Притягнення до відповідальності тих, хто знехтував авторським правом й призвів до розробки й випуску неетичних AI.

4) «Виправлення» уже наявних AI — вилучення з баз даних всього авторського контенту, або якщо це неможливо — запуск нових етичних версій з відфільтрованими даними й заборона попередніх неетичних версій.

5) Правове регулювання AI, генерованого контенту і тих, хто працюватиме з такими інструментами.

Чи є для 2D/3D-художників якісь плюси такого стрімкого розвитку «художнього» штучного інтелекту

Цей інструмент має великий потенціал стати дуже корисним. На цей момент я не можу користуватися ним, бо я не хочу брати участь в масовій крадіжці авторського контенту.

Але коли з’явиться етична версія, котра працюватиме без порушень авторського права, або якщо в мене з’явиться можливість натренувати AI на своїх роботах без використання чужого контенту, захищеного авторським правом — я залюбки поекспериментую з цим інструментом. Думаю, що зможу навіть отримати немало користі від нього для візуалізації своїх ідей в найближчому майбутньому.

Чи мають страйки проти AI якийсь практичний сенс

Ми вже пройшли фазу страйків, і зараз знаходимося на початку фази «правових війн» — на цю мить мені відомо про два судових позови на Stability AI, DeviantArt і midjourney стосовно порушення ними авторського права.

⦁ З кейсом художниць можна ознайомитися за цим посиланням.

⦁ Зі заявою про судовий позов Getty images можна ознайомитись тут.

Що я можу зробити для підтримки протесту/легалізації AI

1) Поширювати правдиву інформацію про AI, як саме він працює і чому/в який спосіб порушує права художників, особливо серед людей, не пов`язаних з креативними індустріями (на жаль, багато хто порівнює протест художників з луддизмом, у питанні вище ми вже розібрали, чому це порівняння не коректне)

2) Підтримувати можливі майбутні протести чи інші спроби авторів та юристів до врегулювання цієї проблеми. За можливості — підтримати монетою/поширенням збори коштів на правове врегулювання AI в США/ЄС (в Україні наразі подібних зборів/обговорень щодо регуляції AI на державному рівні я не зустрічала):

— в США: www.gofundme.com/...​ists-from-ai-technologies

— в ЄС: www.gofundme.com/...​nd-data-from-ai-companies

3) Підтримувати одне одного — ділитися новинами, знаннями й досвідом в цій справі. Об’єднуватися й триматися разом. Пам’ятайте, що ви не на одинці з цією проблемою.

4) Ви також можете допомогти судовому позову художників проти Stable Diffusion: якщо ви виявили що ваші роботи без вашого дозволу були використані в AI-генераторах, якщо ви стикаєтеся з булінгом і тролінгом з боку користувачів AI в крадіжці ваших робіт й генерації копій на базі ваших робіт, якщо ви знаєте людей, котрі монетизують генерований арт неетично через кікстартер, патреон, ютюб, етсі, артстейшн чи інші соцмережі, якщо ви втратили робоче місце/клієнтів через заміну на AI, чи якщо знаєте когось хто стикнувся з такими проблемами — про це можна і треба звітувати сюди: www.saverilawfirm.com/...​xgJeiTKboRp2cFEUsJ_EAUsIs.

Що робити 2Д-художникам, щоб убезпечити себе від перспективи того, що їх замінить AI

⦁ Найголовніше — не ховатися від ситуації що склалася. Є бажання удати, ніби нічого не відбувається, однак з таким підходом вам буде набагато складніше і довше пристосовуватися до нової реальності в майбутньому.

⦁ Зараз все дуже швидко змінюється. Важливо тримати руку на пульсі й спостерігати, в яку сторону це все буде розвиватись (власне зараз головне питання, вдасться відстояти авторське право перед AI чи ні).

⦁ Розвиватися й самовдосконалюватися. Мова не стільки про те, як краще/швидше намалювати картинку, а скоріш про те, як зробити свої роботи більш унікальними, такими, які AI повторити без вас не здатен. Це може бути унікальний стиль, оригінальні ідеї, приховані смисли, глибокі знання про зображені об’єкти у ваших роботах тощо (наприклад зараз чітко видно, що персонажа, котрий належить до конкретної реальної культури з її унікальним одягом, орнаментами, символами й значеннями AI згенерувати не здатен. Він може видати схожий силует і кольори, але якщо придивитись до деталей — там буде суцільна каша). Пам’ятаймо, що AI може лише копіювати, але не здатен створити щось нове унікальне. Вдихнути ідею в зображення може лише людина.

⦁ Якщо є бажання — повивчайте AI: як він працює і де він міг би пришвидшити роботу саме для вас. Ці навички можуть стати вам дуже корисними в майбутньому. Однак на разі не використовуйте його в роботі/для клієнтів, бо: 1) це не етично і порушує авторські права інших митців. 2) на разі отримати законне право власності на генерований контент неможливо.

⦁ Не опускайте руки. У вас є величезна перевага, до котрої AI не може дотягнутися. Як би швидко й багато нейромережі не генерували візуального шуму — саме те, що ми відчуваємо, переживаємо, думаємо й вкладаємо в наше мистецтво — це робить нас людьми і є тим найбільшим скарбом, котрий жоден штучний інтелект повторити не здатен.

Дякую що переглянули статтю до кінця. Сподіваюсь, зібрана тут інформація буде вам корисною.

До зустрічі, і бережіть себе <3


Підписуйтеся на Telegram-канал @gamedev_dou, щоб не пропустити найважливіші статті і новини

👍ПодобаєтьсяСподобалось5
До обраногоВ обраному0
LinkedIn


Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Як працює AI

Мені здається, ви трохи викревлено описали ідею. Те, що нейронна мережа чимось схожа на автоенкодер, це не означає, що вона робитиме «колаж». Адже мережа одна, а навчальних зображеннь мільйони. І якщо там не проявляється аномальний overfit, то говорити про «колаж» дуже не коректно.

Чи доречно порівнювати протести художників проти AI з луддизмом

Чи це те ж саме — ні. Чи коректно порівнювати — так. Так само, що художник по дереву буде вирізьблювати місяць, на відповідному обладнанні можна скопіювати тисячним тиражом за той самий час.

Що робити 2Д-художникам

Адаптовуватись. Сприймати це як інструмент. Як колись було з фотошопом, наприклад. Згенеровані зображення гарні, але там зображено не те, що в голові у автора.

Тут важливо не плутати мистецтво та ремесло. Ремесло вимагає ефективності і тут АІ — інструмент. А мистецтво — це інше. Тут ціна ніколи не визначалась продуктам ... частіше емоціями/харизмою/історією/репутацією чи просто випадком. Для того, щоб намалювати чорний квадрат, АІ не потрібен. Так як і зараз тотальна автоматизація не вбиває handmade, попит на ручну роботу залишиться.

Щодо авторського права ... якщо мережа видала зображення яке не є ідентичним авторському (до певної межі), то не бачу предмету зловживання.

Про втрату copywrite коміксом,- неправда. Кріс вже отримала пояснення від Copywrite Office , що це помилка в їх базах, зза оновлення, чи щось на кшталт.
Проте уточню, що отримати той copywrite було доволі нелегко, і вимагало доведення, що вона використала не повністю сирі зображення прямо з генератора зображень, а робила постобробку.

На момент написання статті, авторці коміксу було відмовлено в отримані авторських прав (посилання на новину про це прикріплене в статті). Я не знайшла інформації, котра б засвідчила протилежне чи спростувала інформацію про неотримання авторкою коміксу авторських прав на нього. Якщо щось змінилося і у вас є посилання-підтвердження цього — я залюбки з ним ознайомлюся =]

Дякую =] . В статті йдеться про те, що справді по коміксу було видано відмову в авторському праві, це відбулося через збій у системі й нещодавно відмову відкликали. Однак процес прийняття рішення по коміксу досі триває. Інформація про це з’явилась після того, як я почала писати цей блог. Однак я поговорю з редакторами, щоб додати невеличкий апдейт в реченні про комікс

Людина, малюючи яблуко, не потребує використання фотографії яблука чи малюнка цього яблука іншим автором як основи для своєї роботи. Людині для цього достатньо власної пам’яті й уяви, тоді як AI не здатен генерувати жоден контент без бази даних з контенту, створеного людьми.

Природа, створюючи «новий контент» (нові біологічні види — рослин, тварин) не потребує використання фотографії чи малюнка біологічних видів з інших планет (це і про сучасність, і про зародження життя на Землі). Природі для цього достатньо лише своєї еволюційної уяви. Тоді як людина не здатна генерувати жоден контент без своєї пам’яті та не базуючись на тому, що вона «підгледіла» у Природи.

Людина протягом життя збирає свою «базу даних» у власній пам’яті — все що вона колись почула, побачила, торкнулась і т.д. Якщо взяти сліпу з народження людину, у якої було нуль візуальної стимуляції — наскільки великим художником вона зможе стати? Як така людина зможе намалювати хоча б сонце, якщо вона навіть не знає, що означає «жовтий колір»? А значення слова «круглий» знає лише тактильно, охоплюючи руками круглі предмети.

Аналогічно й АІ — йому потрібна якась база, якісь «спогади побаченого», щоб мати змогу генерувати щось нове, хоча й схоже на побачені стилі. Тому АІ використовує малюнки та фотографії у якості «пам’яті» про те, що він «бачив». Сподіватися, що «сліпий АІ» на голому місці створить щось принципово нове — так само наївно, як і сподіватися, що сліпа людина стане крутим художником.

Художники та юристи звичайно можуть спробувати боротися, але років через 50 нам все це ретроспективно здасться боротьбою з вітряними млинами.
Прогрес не зупинити, бо художники не перестануть викладати свої роботи в інтернет. А що потрапило в інтернет — рано чи пізно буде використано як «їжа для росту могутності АІ».

Погоджуюсь із тим що ви написали, за винятком єдиного нюансу — повністю пропущеної етичної й правової складової. Правова регуляція АІ — це не повітряний млин, а цілком логічний процес створення законодавчої бази для регуляції генерованого контенту і захисту прав авторів. Авторське право — це те, що наприклад захищає музичні композиції в мережі від негегального використання — так, після появи напстера ви можете «спіратити» композицію, але для зручного і легального користування музичним контентом, вам доведеться «купити» підписку на цю музику наприклад у Spotify, придбати платівку для особистого прослуховування, або ж придбати авторські права для використання цієї музики в комерційних цілях. Подібна правова регуляція потрібна і для генерації візуального контенту.

— «Сподіватися, що „сліпий АІ“ на голому місці створить щось принципово нове...» — є масса контенту не захищеного авторським правом (наприклад витвори мистецтва давнини), а бажання тренувати АІ на авторському контенті можна реалізувати етичним і легальним чином — наприклад, створенням сервісу підписки для художників по типу «spotify», де художник має право сам вирішувати, чи надавати свої роботи для тренування АІ, і де він отримуватиме грошову компенсацію за генерацію контенту на базі його робіт. Більше інформації про це знайдете у відповіді на питання «За яких умов художників би влаштувало співіснування з AI»

«Прогрес не зупинити...» — на цей коментарій є відповідь у питанні: «Чи доречно порівнювати протести художників проти AI з луддизмом, появою фотокамери тощо»

— «А що потрапило в інтернет — рано чи пізно буде використано...» — до слова, весь авторський контент, що знаходиться в мережі, ондаково підлягає захищенню авторського права, й брати такі роботи без дозволу й використовувати їх без дозволу автора — це грубе порушення авторського права.

а фотографувати в музеї і виставляти в мережу фотки можна?)

Для особистих цілей — можна, якщо в музеї дозволена зйомка =] Для комерційних цілей — потрібно перевіряти, чи експонат, який Ви фотографуєте, не захищений авторським правом (до слова, авторське право перестає діяти від 70 років після смерті автора/авторки, і її/його творчий доробок стає суспільним надбанням). Якщо захищений — зв’язуватися з автором/власником прав і питати дозволу

Підписатись на коментарі