Як штучний інтелект змінює індустрію локалізації і чого очікувати в цьому році

Всім привіт. Мене звати Юлія Швидка, і вже протягом двох років я працюю у сфері локалізації та близько 7 років загалом у сфері перекладу. Наразі я є менеджером з локалізації в геймдев-компанії Bini Games.

Мабуть, кожен з нас вже помітив наскільки стрімко штучний інтелект (ШІ) увірвався в наші з вами життя, і як він з кожним днем все глибше входить у всі сфери, змінюючи їхню динаміку та напрямок розвитку. Те, що вже робить Midjourney, Blaze AI, Pixverse та ще багато інших нейромереж вражає! ШІ — це просто електрика 21 століття.

І, звичайно, локалізація є однією з областей, де впровадження ШІ обіцяє перевернути сталі, вже звичні нам підходи до роботи та відкрити нові перспективи.

Локалізація, яка раніше вимагала величезних зусиль, кропіткої роботи та часу, тепер отримує нові інструменти та перспективи від ШІ. Тому, у цій статті, я пропоную розглянути, як штучний інтелект впливає на сучасний ринок локалізації, які перспективи відкриваються завдяки його впровадженню і, звичайно, розібратися з наріжним питанням всіх дискусій, чи може ШІ повністю замінити людину-перекладача?

Значний прогрес машинного перекладу з використанням ШІ

Штучний інтелект дав неймовірний поштовх у розвитку інструментів машинного перекладу, таких як Google Translate, Bing Translate, DeepL та багатьох інших. А нам добре відомо, що ця технологія перекладу пройшла досить довгий шлях з часу свого виникнення у 1950-х роках. У сучасних умовах технології на основі штучного інтелекту можуть перекласти цілу повість менше ніж за дві хвилини. На додаток, аналізуючи мільйони запитів, ШІ може визначати та намагатися розуміти сленг чи ідіоми.

У Google надали приклад, що демонструє, наскільки добре їх остання технологія нейронного машинного перекладу (NMT) розуміє значення французької ідіоми:

Автоматизація робочих процесів локалізації завдяки ШІ

Традиційні інструменти локалізації здатні на відмінно впоратися з точним перекладом контенту, але, ви, мабуть, помічали, що вони не завжди достатньо швидкі. Особливо коли горять дедлайни і швидкість якісного виконання завдання стає критичною, виникає потреба у більш оперативних інструментах.

ШІ виконує завдання набагато швидше, водночас дозволяючи компанії локалізувати свій контент зі значно меншими витратами. Така практика вже стала доволі розповсюдженою, багато компаній вже віддають перевагу ШІ та машинному перекладу, ніж перекладачам саме тому, що це швидко і дозволяє заощадити кошти.

Локалізація мультимедійного контенту

Чи знали ви, що ШІ вже може перекладати та локалізувати зображення, відео та аудіофайли? Ця технологія допомагає зробити вебсайти більш доступними для користувачів зі всього світу. За допомогою ШІ набагато легше локалізувати весь контент — текст, відео, файли чи зображення для вашої цільової аудиторії.

Наприклад, команда аналітиків даних в Meta запровадила ШІ, яке може автоматично перекладати зображення та фотографії. На додаток, ШІ перекладає слова у схожому шрифті і стилі. Ця технологія безумовно має значущий потенціал для подальшого розвитку.

Чого очікувати в 2024 році?

Щодо трендів в локалізації на 2024 рік, то наразі провідні спеціалісти в індустрії локалізації та розвитку ШІ, відмічають наступні покращення в технологіях роботи ШІ:

  • Розвиток технології speech-to-speech. Очікується ще більш стрімкий розвиток технології автоматичного розпізнавання і перекладу вашої усної мови. На speech-to-speech покладають великі надії, ця технологія революціонізує міжнародні комунікації в бізнесі та багатомовне обслуговування клієнтів, коли міжнародна комунікація є більш комфортною і ефективною.
  • ШІ за межами машинного перекладу. У 2024 роль ШІ в локалізації виходить за межі простого машинного перекладу, очікується, що дубляж у відео та інструменти дубляжу на основі ШІ змінять звичні нам процеси локалізації мультимедіа і зроблять їх більш ефективними.
  • Багатомовний контент на YouTube. Коли YouTube запровадив на своїй платформі технологію Multi-language Audio Track (MLA) — дубляж вашого контенту одразу на інші мови, і впровадження MLA значно збільшило кількість переглядів контенту. Ця функція та інструменти локалізації на основі ШІ дозволять блогерам ефективніше охоплювати глобальну аудиторію. Тільки подумайте наскільки це полегшить сприйняття контенту для багатьох людей і посприяє міжкультурній комунікації.

Отже, ШІ є швидким та ефективним, він вчиться набагато швидше за людей та оброблює величезні обсяги контенту, що є фантастичним і навіть трохи лячним (Скайнет напевно була такою ж на початку свого розвитку :)

Але погляньмо правді у вічі, невже все настільки ідеально і немає причин хвилюватися?

Питання відповідальності

Вивчаючи тему ШІ та взагалі з роками свого досвіду керування проєктами з локалізації, я помітила один важливий момент — Коли ШІ виконує більшість або навіть всю роботу, хто має відповідати за кінцевий результат? До кого ми можемо звернутися, якщо щось піде не за планом?

У традиційній структурі команди очевидно хто і за що відповідає. Перекладачі, редактори, спеціалісти LQA тестування та менеджери проєктів мають налагоджений алгоритм роботи і гарантують, що все буде виконано на найвищому рівні. На кожному етапі роботи будуть люди, які відповідатимуть за те, що кожен елемент контенту не лише якісно перекладено, але й культурно адаптовано.

Однак з ШІ це все стає досить невизначеним. Якщо ШІ помиляється, особливо перекладаючи специфічні культурні явища або адаптуючи культурні норми, то хто має відповідати?

Хоча б одна маленька неточність — невдало перекладений жарт, ідіома або діалог, і це може обернутись великим скандалом, звинуваченнями в бік компанії розробника, яка випустила цей контент та навіть позовом до суду.

Хто має нести відповідальність в такому випадку? Ви можете подумати — звичайно компанія розробник ШІ. І будете праві. Але є одне але: якщо в контракті або правилах використання цей розробник вкаже, що не несе відповідальності за те, що генерує нейромережа, з чим ви вже погодились, що тоді?

Саме такі нюанси в черговий раз доводять, що нам конче необхідні чіткі правила та закони для регулювання роботи ШІ, які наразі залишаються досить невизначеними.

Кейс перекладу за допомогою ШІ

Дозвольте мені поділитися деякими враженнями з тестовою роботою над багатомовним проєктом, над яким я працювала. Було вирішено що, ШІ бере на себе найважче завдання — переклад основної частини тексту, а вже людина, себто носій мови-редактор, буде його редагувати.

Результати вийшли неоднозначні: з одного боку ШІ може непогано перекладати європейські мови, знову ж таки, з деякими погрішностями з боку культурній адаптації.

З іншого боку, переклади на такі мови, як спрощена китайська, японська, гінді та бенгальська вийшли зовсім невтішними і потребували не просто редагування, а повний переклад наново носієм мови.

І я впевнена, що таких випадків наразі буде виникати багато, хоча б з тієї причини, що мовних груп і різних діалектів дуже багато. Звичайно, ШІ ще навчається, але чи буде він настільки круто знати всі тонкощі та деталі через 5-10 років?

Бо на відміну від решти сфер розвитку, мова — це не щось статичне, розвиток і унікальність мови проявляється в найдрібніших деталях, у нових виразах, які виникають в результаті комунікації та взаємодії між людьми. Це не лише засіб спілкування, це живий організм, який адаптується до змін у суспільстві та відображає його розмаїття.

Отже, завжди будуть нові локальні вирази, прислів’я і слова за якими ШІ може або не встигнути, або некоректно зрозуміти і передати їх сенс.

Co-piloting і наша роль в індустрії

Звичайно, час не стоїть на місці — ШІ вже існує в нашому житті і надалі він буде розвиватись ще швидше. А оскільки він поступово стає звичайною частиною нашого робочого процесу, думаю, нам варто переглянути наші перспективи розвитку в цьому.

Тож маємо одвічне питання в галузі локалізації: коли машинний переклад буде настільки якісним, як і людський переклад? Саме ця тема завжди провокувала безліч обговорень і дебатів.

Але можливо, це не зовсім вірне питання, можливо доцільніше було б запитати себе «Коли автоматизований переклад надасть настільки якісні результати перекладу в певних умовах роботи?» .

Цей трохи зміщений акцент змінює фокус нашої уваги на процеси та інструменти. Основне завдання полягає в успішній інтеграції технології штучного інтелекту до процесів, що вже існують.

Під час нещодавнього обговорення на LocDiscussion, Бруно Герман, провідний спеціаліст стратегій розвитку контенту за допомогою ШІ, виділив 3 сфери управління даними, у яких лінгвісти будуть відігравати ключову роль у галузі розвитку ШІ: обробка даних (Data Curation), вилучення даних (Data Extraction) і структурування даних (Data Structuring).

Щоб побудувати LLM (велику мовну модель) для ШІ, початковим кроком зазвичай є збір даних із різних джерел, таких як бази даних, вебсайти чи документи. Він передбачає отримання необроблених структурованих і неструктурованих даних у вихідному форматі без будь-яких змін.

Лінгвісти володіють глибоким розумінням мови, включаючи нюанси, ідіоми та регіональні варіанти перекладу. Ці знання є неоціненними, коли справа доходить до усунення неоднозначності значення та забезпечення точного вилучення.

Лінгвісти також на відмінно справляються з розшифровкою контексту, що є критичним аспектом вилучення даних, можуть допомогти у створенні нових та вдосконаленні існуючих правил вилучення.

Ці правила керують алгоритмами визначення певної інформації в тексті, підвищуючи точність процесу вилучення. Лінгвісти відіграють ключову роль у перевірці даних, їхній досвід допомагає перевірити точність отриманої інформації, особливо у сферах, де точність має першочергове значення, наприклад у юридичній чи медичній сферах. Отже, співпраця людини та технологій залишається важливою для осмислення моря текстової інформації, що постійно розширюється.

Тому, як на мене, нам не варто думати або тим більше боятися, що ШІ замінить нас. Натомість потрібно адаптувати наші ролі локалізаторів і всіх залучених спеціалістів в індустрії під ці зміни і спостерігати за тим, до якої еволюції може призвести наша спільна робота.

Йдеться про встановлення чітких правил і стандартів для ролі ШІ в наших проєктах. Нам потрібно встановити стандарти якості для штучного інтелекту, мати план, на випадок коли щось піде не так, і, що найважливіше, забезпечити, щоб за процесом завжди була людина.

Настав час, коли штучний інтелект має бути не вашим конкурентом, а вашим «другим пілотом» і саме ми люди, спеціалісти у своїй сфері, відповідальні за те, куди і як ми направляємо ці технології.

Креативність

«Уява більш важлива, аніж знання. Знання обмежені, в той час як уява охоплює увесь світ, стимулюючи прогрес та породжуючи еволюцію»

Ви можете подумати що це сказав Джейсон Стетхем, але ні то був Ейнштейн :)

Останнє, про що не варто забувати, — це те, що люди мислять хаосом. В нас постійно змінюється настрій, думки, ми всі різні, і людська уява та креативність відкривають перед нами нескінченні можливості.

Такий непередбачуваний, хаотичний спектр мислення — це, без жартів, справжня сила людського розуму і талант, талант генерувати такі перли в перекладі, як «дієвидло» (інтерфейс), огр на ім’я «Пан Прибій» (Lord Riptide), «діторобчик» (плед), пес «Панчохер» (англ Knickers), «Влип, як муха в мед» (англ Sticky Situation) та ще дуже багато інших варіантів локалізації й перекладу, за фінальними варіантами яких багато годин кропіткої роботи, міркувань, обговорень, пошуку і відсилок.

Власне, це і є та унікальність і талант, що навряд чи в ШІ реально закласти при розробці. Тому, чи може ШІ замінити команду локалізаторів вже зараз? Ні. А чи зможе він замінити нас через 5-10 років? Маловірогідно.

Підписуйтеся на Telegram-канал @gamedev_dou, щоб не пропустити найважливіші статті і новини

👍ПодобаєтьсяСподобалось8
До обраногоВ обраному0
LinkedIn


Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Підписатись на коментарі