Gemini 3.5 Flash

3.5 Flash · Family: Gemini

Fast multimodal model from the Gemini 3.5 family, optimized for agentic coding, long context and advanced reasoning with low latency.

⏳ Preview⏳ Limited accessLLMMultimodalReasoning modelTool-using model📁 Gemini

Context window

tokens

Max output

65,536

tokens

🔬Google DeepMindResearch lab 🏢GoogleOwner

Access:APIHostedDeployment:☁ Cloud

Overview

Gemini 3.5 Flash is a model from the Gemini 3.5 family developed by Google DeepMind. Designed as a fast, multimodal model aimed at frontier intelligence per dollar, it combines advanced reasoning with the low latency characteristic of Flash variants.

It accepts text, images, video, audio and PDF documents as input and produces text and code as output. The model offers a 1M token context window, up to 64k output tokens, and supports function calling, structured output, code execution and search as a tool. Knowledge cutoff is January 2025.

Available through the Gemini app, Gemini API, Google AI Studio, Gemini Enterprise, Google AI Mode, Google Antigravity and Android Studio. Status: Preview.

Classification

LLMMultimodalReasoning modelTool-using model

Family: Gemini

Applications

Coding Data analysis Document analysis Content generation Workflow automation Research assistance Q&A / Question answering Summarization

Access & deployment

APIHosted

Cloud

Weights: Closed

Key parameters

📏 Context: 1M

✓ Tools

📥 Input: text, image, audio, video…

Platforms

Vertex AI Google Antigravity Gemini Enterprise Agent Platform Google AI Studio

Technical specification

Context window

tokens

Max output tokens

65,536

tokens per response

Knowledge cutoff

1 Jan 2025

Knowledge boundary

License

proprietary

Hardware requirements

Available only through Google cloud infrastructure (Gemini API, Vertex AI, Google AI Studio).

Features:✓ Tool use

Modalities

⬇ Input

textimageaudiovideodocuments

⬆ Output

textcode

Capabilities and applications

Native model capabilities

Reasoning

The model's ability to reason logically and solve complex problems.

Category: reasoning

Multi-step reasoning

Carrying out multi-step chains of reasoning across long, complex tasks.

Category: reasoning

Long context

Maintaining coherence and focus across very long input context.

Category: language

Multimodal understanding

Category: multimodal

Coding

Generating, analysing and modifying source code.

Category: coding

Function Calling

Category: planning

Structured output

Producing data in structured formats such as JSON.

Category: structured_generation

Audio understanding

Category: audio

Image understanding

Analysing and interpreting the content of images.

Category: vision

Video Understanding

Category: video

Chart understanding

Reading and interpreting charts, tables and diagrams.

Category: vision

OCR

Recognising text within images and documents.

Category: vision

Multilingual

Understanding and generating text in many languages.

Category: language

Planning

Forming and executing action plans for complex tasks.

Category: planning

Interleaved Multimodal Input

Category: reasoning

Application domains

Coding Data analysis Document analysis Content generation Workflow automation Research assistance Q&A / Question answering Summarization Multimodal document understanding Knowledge work Translation

Benchmark results

14 benchmarks

Terminal-bench 2.1

accuracy · Terminus-2 harness

76.2%%