Gemini 3 Flash

3 Flash · Family: Gemini

Gemini 3 Flash is a multimodal language model by Google DeepMind from the Gemini 3 family, designed for fast inference and low cost while retaining reasoning capabilities comparable to Gemini 3 Pro.

⏳ Preview⏳ Limited accessLLMMultimodalReasoning modelTool-using model📁 Gemini

Context window

tokens

Max output

65,536

tokens

Release date

17 December 2025

🔬Google DeepMindResearch lab 🏢GoogleOwner

Access:APIHostedDeployment:☁ Cloud

Overview

Gemini 3 Flash is an AI model developed by Google DeepMind, announced on December 17, 2025 as an expansion of the Gemini 3 model family. It is a multimodal model supporting text, image, video, audio, and PDF document inputs, generating text and code as output.

The model has a context window of up to 1 million tokens and a maximum output of 64,000 tokens. It supports tools including function calling, structured output, search as a tool, and code execution. It is available via the Gemini API, Google AI Studio, Vertex AI, Gemini CLI, Android Studio, Google Antigravity, and the Gemini app.

The model's knowledge cutoff is January 2025. It is available in preview. The number of parameters has not been publicly disclosed by the developer.

Classification

LLMMultimodalReasoning modelTool-using model

Family: Gemini

Applications

Coding Content generation Document analysis Workflow automation Writing assistance Q&A / Question answering Research assistance Data analysis

Access & deployment

APIHosted

Cloud

Weights: Closed

Key parameters

📏 Context: 1M

✓ Tools

📥 Input: text, image, audio, video…

Platforms

Vertex AI

Technical specification

Context window

tokens

Max output tokens

65,536

tokens per response

Knowledge cutoff

1 Jan 2025

Knowledge boundary

License

proprietary

Hardware requirements

Available only through Google cloud infrastructure (Gemini API, Vertex AI, Google AI Studio).

Features:✓ Tool use

Modalities

⬇ Input

textimageaudiovideodocuments

⬆ Output

textcode

Capabilities and applications

Native model capabilities

Reasoning

The model's ability to reason logically and solve complex problems.

Category: reasoning

Multi-step reasoning

Carrying out multi-step chains of reasoning across long, complex tasks.

Category: reasoning

Long context

Maintaining coherence and focus across very long input context.

Category: language

Multimodal understanding

Category: multimodal

Coding

Generating, analysing and modifying source code.

Category: coding

Function Calling

Category: planning

Structured output

Producing data in structured formats such as JSON.

Category: structured_generation

Audio understanding

Category: audio

Image understanding

Analysing and interpreting the content of images.

Category: vision

Video Understanding

Category: video

Chart understanding

Reading and interpreting charts, tables and diagrams.

Category: vision

Diagram reasoning

Category: reasoning

OCR

Recognising text within images and documents.

Category: vision

Multilingual

Understanding and generating text in many languages.

Category: language

Planning

Forming and executing action plans for complex tasks.

Category: planning

Streaming output

Category: reasoning

Interleaved Multimodal Input

Category: reasoning

Application domains

Coding Content generation Document analysis Workflow automation Writing assistance Q&A / Question answering Research assistance Data analysis Search assistance

Benchmark results

15 benchmarks

Humanity's Last Exam

accuracy · No tools, Gemini 3 Flash Thinking

33.7%%