L'Instant NeRF AI de NVIDIA rend des scènes 3D à partir de photos 2D en quelques secondes

Dans le contexte : Nvidia a joué avec les NeRF. Non, ils ne se sont pas tiré dessus avec des fléchettes en mousse. Le terme NeRF est l’abréviation de Neural Radiance Field. C’est une technique qui utilise l’IA pour créer une scène en trois dimensions à partir d’une poignée d’images fixes (rendu inverse). Selon la profondeur souhaitée, il faut généralement des heures ou des jours pour obtenir des résultats.

La branche de recherche AI de Nvidia a travaillé sur le rendu inverse et a développé un champ de rayonnement neuronal qu’il appelle Instant NeRF car il peut rendre la scène 3D jusqu’à 1 000 fois plus rapidement que les autres techniques NeRF. Le modèle AI n’a besoin que de quelques secondes pour s’entraîner sur quelques dizaines d’images fixes prises sous plusieurs angles, puis quelques dizaines de millisecondes de plus pour restituer une vue 3D de la scène.

Étant donné que le processus est le contraire de la prise d’un Polaroid – c’est-à-dire la transformation instantanée d’une scène 3D en une image 2D – Nvidia a recréé une photo d’Andy Warhol à l’aide d’un Polaroid. Cette semaine, l’équipe de recherche a présenté une démo des résultats d’Instant NeRF à Nvidia GTC (ci-dessous).

« Instant NeRF pourrait être utilisé pour créer des avatars ou des scènes pour des mondes virtuels, pour capturer les participants à une vidéoconférence et leurs environnements en 3D, ou pour reconstruire des scènes pour des cartes numériques 3D », a déclaré Nvidia. « Collecter des données pour alimenter un NeRF, c’est un peu comme être un photographe de tapis rouge essayant de capturer la tenue d’une célébrité sous tous les angles – le réseau de neurones nécessite quelques dizaines d’images prises à partir de plusieurs positions autour de la scène, ainsi que la position de la caméra de chacun de ces coups. »

Le NeRF génère l’image 3D à partir de ces dizaines d’angles, remplissant les blancs si nécessaire. Il peut même compenser les occlusions. Par exemple, si un objet bloque la vue du sujet dans l’une des images, l’IA peut toujours remplir cet angle même si elle ne voit pas bien ou pas du tout le sujet.

Le seul point faible de la technologie concerne les objets en mouvement.

« Dans une scène qui comprend des personnes ou d’autres éléments en mouvement, plus ces prises de vue sont rapides, mieux c’est », a déclaré Nvidia. « S’il y a trop de mouvement pendant le processus de capture d’image 2D, la scène 3D générée par l’IA sera floue. »

Pour plus de détails techniques, consultez le blog de Nvidia. Vous pouvez également visionner le reste du discours d’ouverture de Jensen Huang sur GTC sur YouTube.

L’Instant NeRF AI de NVIDIA rend des scènes 3D à partir de photos 2D en quelques secondes

R9 Pro de retour en stock : pourquoi tout le monde s’arrache ce purificateur d’eau

MacBook Neo + AirPods 4 à prix cassé grâce à ce code réduction Cdiscount

EZVIZ EP8 Ultra : Sonnette connectée avatar double objectif qui surveille même les colis

XBOW teste l’outil Mythos Preview d’Anthropic pour la sécurité offensive

Une nouvelle faille Veeam expose les serveurs de sauvegarde à des attaques RCE

Le service de messagerie du gouvernement français piraté par une attaque de détournement de comptes

WhatsApp change définitivement sur iPhone vous pourrez enfin utiliser deux comptes sans changer de téléphone

Siri IA contre Gemini la copie la plus farfelue d iOS face à Android

TEST Reolink Home Hub : L’enregistrement de vos caméras Wi-Fi sans abonnement

TEST Reolink Solar Floodlight Cam : Caméra de sécurité Wi-Fi solaire éblouissante et dissuadante

TEST JIMMY Matrix M9 Pro + S9 : Eau purifiée, chaude ou gazeuse en quelques secondes