Cosmos 3

3 · Family: Cosmos

NVIDIA open world foundation model (omni-model) for physical AI. Combines vision reasoning, multimodal generation and robot action prediction.

✓ Active✓ Public access⚖ Open weightsWorld ModelRobotics foundation modelMultimodal📁 Cosmos

Parameters

65B (Super) / 16B (Nano)

parameters

Release date

31 May 2026

🏢NVIDIAProducer

Access:APIDownloadHostedDeployment:☁ Cloud💻 Local📱 On-device

Overview

Cosmos 3 is an open world foundation model released by NVIDIA at GTC Taipei during COMPUTEX 2026 (May 31, 2026). It is the first omni-model in the Cosmos family with native reasoning, world generation and action generation in a single Mixture-of-Transformers architecture (separate transformer blocks for reasoning and generation).

The model handles input and output across modalities: text, image, video, ambient sound and action data (numerical — joint angles, gripper positions, trajectory points). Native action generation enables Cosmos 3 to serve as a World Action Model (WAM) backbone for post-training robot policies.

The family includes: Cosmos 3 Super (65B parameters, highest physics accuracy, for robotics and AV post-training), Cosmos 3 Nano (16B, lightweight, optimized for fast inference and policies), and the announced Cosmos 3 Edge (on-device, forthcoming). Additional variants on Hugging Face: Cosmos3-Super-Image2Video, Cosmos3-Super-Text2Image, Cosmos3-Nano-Policy-DROID.

Weights and code are released under the OpenMDW 1.1 license (Linux Foundation), permitting training, modification, redistribution and deployment. A Cosmos 3 Nano post-trained policy ranked first on the RoboLab and RoboArena leaderboards, and Cosmos 3 variants lead the open-weights leaderboards on Artificial Analysis, Physics-IQ, R-Bench, PAI-Bench, VANTAGE-Bench and the TAR challenge. Applications: robot policy training, synthetic data generation, environment simulation for autonomous vehicles, video analytics agents for industrial use.

Classification

World ModelRobotics foundation modelMultimodal

Family: Cosmos

Applications

Robot policy training Robotic manipulation

Access & deployment

APIDownloadHosted

CloudLocalOn-device

Weights: Open weights

Key parameters

🧩 Parameters: 65B (Super) / 16B (Nano)

✓ Fine-tuning

📥 Input: text, image, video, audio…

Robotics

Robot controlRobot manipulationBimanual manipulationEmbodied task planningScene understandingSpatial reasoningSpatial predictionEnvironment modelingVisual grounding

Platforms

NVIDIA Cosmos

Technical specification

Parameters

65B (Super) / 16B (Nano)

parameters

License

OpenMDW 1.1 (Linux Foundation)

Features:✓ Fine-tuning

Modalities

⬇ Input

textimagevideoaudiorobot_sensorsrobot_state_data

⬆ Output

textimagevideoaudiorobot_actionsrobot_commandsmotion_trajectories

Capabilities and applications

Native model capabilities

Synthetic data generation

Generating synthetic datasets that preserve the statistical properties of the original — used for model training, testing, and privacy protection.

Category: structured_generation

Reasoning

The model's ability to reason logically and solve complex problems.

Category: reasoning

Video Understanding

Category: video

Multimodal understanding

Category: multimodal

Planning

Forming and executing action plans for complex tasks.

Category: planning

Robotics

Robot controlRobot manipulationBimanual manipulationEmbodied task planningScene understandingSpatial reasoningSpatial predictionEnvironment modelingVisual grounding

Application domains

Robot policy training Robotic manipulation

Technical architecture

Core Architecture

TRTransformer

Model Form

WMWorld Models WAWAM

Deployment and security

☁ Available on platforms

☁NVIDIA CosmosPlatform

Sources and related pages

6 sources

WebNVIDIA Cosmos — Physical AI with World Foundation Modelsnvidia.com BlogHow Cosmos 3 Helps Physical AI Think Before It Acts (NVIDIA Blog)blogs.nvidia.com RepoCosmos3 collection on Hugging Facehuggingface.co Reponvidia/Cosmos on GitHubgithub.com ReportCosmos 3 Technical Reportresearch.nvidia.com WebNVIDIA Launches Cosmos 3, the Open Frontier Foundation Model for Physical AInvidianews.nvidia.com

Browse related topics

📁 Cosmos 🌐 Robot policy training 🌐 Robotic manipulation 🧠 Transformer 🧠 World Models 🧠 WAM ☁ NVIDIA Cosmos All world model models All robotics foundation model models