Intel Labs представила AI-модель LDM3D. Вона генерує 3D-панорами на базі текстових запитів
Intel Labs у співпраці з Blockade Labs представила технологію, яка генерує 3D-зображення за допомогою текстових запитів. Вона отримала назву (Latent Diffusion Model for 3D) використовує процес дифузії — так само, як Stable Diffusion. Та особливість LDM3D в тому, що вона може генерувати карту глибини для створення панорамних сферичних зображень на 360 градусів.
Через це розробники вважають її «революційною» і вважають, що LDM3D може докорінно змінити створення цифрового контенту в метавсесвітах і вплинути на широкий спектр галузей, від розваг та ігор до архітектури та дизайну.
Зараз розробники виклали у відкритий доступ модель LDM3D, яку можуть використовувати всі охочі дослідники в галузі машинного навчання і оптимізувати для своїх потреб.
Щоб продемонструвати роботу LDM3D розробники створили застосунок DepthFusion. Він створює об’ємні інтерактивні панорами, використовуючи двомірні RGB-зображення та карти глибини. Результати команда показала у відео:
Немає коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарів