Un approccio innovativo alla generazione di modelli 3D

Microsoft ha lanciato una nuova versione di TRELLIS, un framework avanzato per la generazione di modelli 3D. Sebbene esistano diversi strumenti simili, TRELLIS si distingue per il suo approccio unico.

Secondo Microsoft:

“Il punto di forza è una rappresentazione unificata Structured LATent (SLAT), che consente il decoding verso diversi formati di output, come Radiance Fields, 3D Gaussians e mesh. Questo è reso possibile grazie all’integrazione di una griglia 3D scarsamente popolata con funzionalità visive dense multiview, estratte da un potente modello di visione, catturando in modo completo sia le informazioni strutturali (geometria) sia quelle testurali (aspetto) e mantenendo flessibilità durante il decoding.”

Le principali funzionalità di TRELLIS

TRELLIS offre diverse attività generative:

  • Da testo a asset 3D

  • Da immagine ad asset 3D

  • Generazione di varianti 3D

  • Modifica di asset 3D

Come funziona TRELLIS

Il processo si basa su una combinazione di strutture sparse e rappresentazioni visive avanzate:

  • Latenti locali: Definiti su voxel attivi che intersecano la superficie dell’oggetto.

  • Caratteristiche visive: Derivate da viste densamente renderizzate del modello 3D e integrate con voxel attivi.

  • Decoding flessibile: I decoder possono trasformare SLAT in diverse rappresentazioni 3D di alta qualità, combinando dettagli geometrici e visivi.

Esempi e prestazioni

Microsoft ha presentato numerosi esempi che dimostrano le capacità di TRELLIS. Modelli complessi vengono generati con notevole precisione partendo da immagini altrettanto elaborate. Tuttavia, le prestazioni possono variare:

  • Input complessi: Le immagini di macchine o dispositivi tecnici producono risultati impressionanti.

  • Limitazioni: Immagini di esseri umani o elementi organici mostrano risultati meno accurati.

Un esempio mostrato riguarda un’immagine generata di una macchina complessa. Il modello 3D risultante è stato estremamente preciso, indicando che TRELLIS è ottimizzato per immagini di oggetti meccanici piuttosto che organici.

Implicazioni future

TRELLIS rappresenta un passo intrigante verso lo sviluppo di servizi generativi 3D avanzati. Con ulteriori ottimizzazioni e ampliamenti del training, il framework potrebbe diventare la base per nuove applicazioni nel design e nella modellazione tridimensionale.

 

Di Fantasy

Lascia un commento