Intel Labs представила AI-модель LDM3D. Вона генерує 3D-панорами на базі текстових запитів

Intel Labs у співпраці з Blockade Labs представила технологію, яка генерує 3D-зображення за допомогою текстових запитів. Вона отримала назву (Latent Diffusion Model for 3D) використовує процес дифузії — так само, як Stable Diffusion. Та особливість LDM3D в тому, що вона може генерувати карту глибини для створення панорамних сферичних зображень на 360 градусів.

Через це розробники вважають її «революційною» і вважають, що LDM3D може докорінно змінити створення цифрового контенту в метавсесвітах і вплинути на широкий спектр галузей, від розваг та ігор до архітектури та дизайну.

Зараз розробники виклали у відкритий доступ модель LDM3D, яку можуть використовувати всі охочі дослідники в галузі машинного навчання і оптимізувати для своїх потреб.

Щоб продемонструвати роботу LDM3D розробники створили застосунок DepthFusion. Він створює об’ємні інтерактивні панорами, використовуючи двомірні RGB-зображення та карти глибини. Результати команда показала у відео:

Підписуйтеся на Telegram-канал @gamedev_dou, щоб не пропустити найважливіші статті і новини

👍ПодобаєтьсяСподобалось3
До обраногоВ обраному0
LinkedIn


Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Підписатись на коментарі