Point-E, czyli AI ciągle w natarciu – modele 3D z promptu

Tagi:


Nie wszyscy zdążyli się zorientować, że od kilku tygodni żyjemy już w nowej erze, a ci którzy już tego doświadczyli wciąż próbują nadać sens temu, co obserwują. To era, w której sztuczna inteligencja (tak zwana) osiągnęła poziom rozwoju, który zaczyna mieć wpływ na to jak pracujemy i czym będziemy się zajmować.

Jordan Peterson, w niedawnym wywiadzie przyrównał przełom jaki wyznaczyły narzędzia typu chatGPT do wynalezienia druku. Nie umiem ocenić nawet czy przesadził, a może nie doszacował, ale skoro tempo rozwoju tych technologii zgina tęgie umysły do takich porównań… to wiedz, że coś się dzieje.

Po udanych debiutach Midjourney, Dall-E-2 i Stable Diffusion , a następnie chatGPT oraz zapowiedziach innych narzędzi tego typu oczywiście musiała przyjść kolej na modele 3D generowane z tzw. promptu. Prace nad taką ścieżką rozwoju prowadzone są już od jakiegoś czasu, ale wygenerowanie obiektu geometrycznego jest o wiele bardziej skomplikowane niż wygenerowanie obrazu. Ten proces angażuje szereg technik / algorytmów, które mają na celu zapewnienie „spójności” wynikowego modelu. W dostępnych rozwiązaniach do stworzenia geometrii obiektu z promptu we wstępnej fazie i tak wykorzystuje się generowanie obrazu z promptu, chciałoby się rzec „klasycznie”. W efekcie powstaje chmura punktów wygenerowanego obiektu.

link do platformy: https://huggingface.co/spaces/openai/point-e

Oczywiście na razie nie robi to może wielkiego wrażenia, bo rozdzielczość jest mocno ograniczona ze względu na ilość parametrów potrzebną do generowania samych obrazów oraz moc obliczeniową potrzebną do wygenerowania modelu, ale pozwala zrozumieć ideę.

Oczywiście przekształceniem chmury punktów na siatkę lub tzw. mesh zajmują się już narzędzia dobrze w naszej branży opanowane. Tutaj dostępne są artykuły opisujące wykorzystane techniki wraz z linkami do repozytoriów.

Point·E: A System for Generating 3D Point Clouds from Complex Prompts

Alex Nichol / Heewoo Jun / Prafulla Dhariwal / Pamela Mishkin / Mark Chen

DREAMFUSION: TEXT-TO-3D USING 2D DIFFUSION

Ben Poole / Ajay Jain / Jonathan T. Barron / Ben Mildenhall

Po co to komu?

Czy da się tak zbudować model domu? Dziś jeszcze nie i prorokuję, że jeżeli kiedykolwiek modele faktycznych obiektów będą realizowane za pomocą AI, to będą wykorzystywały do parametryzacji faktyczne modele 3D, a nie zdjęcia (lub zdjęcia projektów). Można wyobrażać sobie połączenie tych technologii dla bardziej widowiskowego efektu, ale projektanci wciąż będą potrzebni – przynajmniej jeszcze przez jakiś czas, o czym piszę tutaj.

Obstawiam, że dzisiaj największym polem do wykorzystania technologii są gry oraz przemysł kinowy. Wygenerowanie prototypowych modeli będzie nieporównywalnie tańsze niż zatrudnianie zespołu „modelerów”, którzy stanowią już przecież gałąź przemysłu kinowego, gamingowego i efektów specjalnych.

Być może moja wyobraźnia jest za krótka, ale na razie nie widzę do czego jeszcze to mogłoby się przydać, ale właśnie wpadłem na pomysł, żeby zapytać o to chatGPT (tak, wyrabiam w sobie powoli nawyk, że jak czegoś nie wiem, to pytam ChatGPT- bo wie więcej) i oto, co na ten temat mówi chatGPT:

Podczas gdy istniejące wcześniej modele 3D mogą być przydatne w wielu przypadkach, generowanie obiektów 3D z monitu ma kilka zalet:

  • Dostosowywanie: Generowanie obiektów 3D z monitu pozwala na większą personalizację i kontrolę nad końcowym wynikiem. Użytkownicy mogą określić określone cechy i atrybuty, które chcą mieć w swoich obiektach 3D, takie jak rozmiar, kształt, tekstura i kolor.
  • Elastyczność: dzięki możliwości generowania obiektów 3D z monitu użytkownicy mogą szybko generować obiekty do szerokiego zakresu celów, bez konieczności wyszukiwania lub kupowania wcześniej istniejących modeli. Może to być szczególnie przydatne w sytuacjach, gdy potrzebny jest unikalny lub niestandardowy obiekt.
  • Wydajność: Generowanie obiektów 3D z monitu może być szybsze i wydajniejsze niż ręczne tworzenie ich od podstaw, zwłaszcza w przypadku złożonych obiektów.
  • Spójność: Korzystając z generatora obiektów 3D z monitu, użytkownicy mogą zapewnić spójność swoich obiektów, ponieważ oprogramowanie wykorzystuje standardowe algorytmy i procesy do tworzenia obiektów.

Te korzyści sprawiają, że generowanie obiektów 3D z monitu jest cennym narzędziem dla szerokiego zakresu zastosowań i branż, w tym projektowania, inżynierii, architektury i innych.

Trudno coś tutaj dodać, choć pewnie dziś jeszcze nie wiemy, do czego to może się przydać.

„tak więc Panie i Panowie, trzymajcie kapelusze, bo
Giganci ponownie będą chodzić po Ziemi”

Jordan Peterson + Jonathan Pageau

Komentarze

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *