Google Gemini logo
FreemiumBy Google DeepMind

Google Gemini

Suite de modelos de IA multimodal de Google DeepMind con capacidades de texto, imagen, audio, video y código, integrada en el ecosistema de Google con agentes autónomos y razonamiento avanzado.

APIOpen Source
0
0
2

Description

¿Qué es Google Gemini?

Google Gemini es la familia de modelos de inteligencia artificial multimodal desarrollada por Google DeepMind. Lanzada inicialmente como Gemini 1.0 en diciembre de 2023, ha evolucionado rápidamente hasta Gemini 3, lanzado en noviembre de 2025, considerado el modelo más inteligente de Google.
La aplicación Gemini supera los 650 millones de usuarios mensuales, y AI Overviews (respuestas con IA en búsqueda) alcanza los 2 mil millones de usuarios mensuales.

Características Principales

Modelos Disponibles (Diciembre 2025)

Serie Gemini 3

  • Gemini 3 Pro: El modelo más inteligente de Google, con razonamiento estado del arte y capacidades agénticas avanzadas
  • Gemini 3 Deep Think: Modo de razonamiento extendido para problemas complejos (disponible para AI Ultra)

Serie Gemini 2.5

  • Gemini 2.5 Pro: Modelo de alto rendimiento con ventana de contexto de 1M tokens
  • Gemini 2.5 Flash: Modelo rápido y económico con "thinking" habilitado por defecto
  • Gemini 2.5 Flash-Lite: Versión más económica para tareas de alto volumen

Modelos de Generación

  • Imagen 4: Generación de imágenes de alta calidad
  • Nano Banana Pro: Modelo de generación de imágenes con razonamiento y búsqueda
  • Veo 3 / Veo 3.1: Generación de video con audio sincronizado

Capacidades

  • Comprensión y generación multimodal (texto, imagen, audio, video)
  • Ventana de contexto de hasta 1 millón de tokens
  • Razonamiento avanzado con modo "Thinking"
  • Deep Research: investigación profunda automatizada
  • Agentes autónomos (Gemini Agent, Project Mariner)
  • Generación de imágenes y videos
  • Integración nativa con Google Workspace
  • Gemini CLI: agente de código en terminal (open source)
  • Jules: agente de programación asíncrono
  • Grounding con Google Search
  • Interfaces generativas interactivas en AI Mode
  • Soporte para MCP (Model Context Protocol)

Planes y Precios (Diciembre 2025)

Planes de Consumidor

PlanPrecioCaracterísticas Principales
Gratis$0Acceso limitado a Gemini 2.5, generación básica de imágenes
Google AI Pro$19.99/mesGemini 3 Pro, Deep Research, 1M contexto, Veo 3.1 Fast, 2TB almacenamiento
Google AI Ultra$49.99/mesTodo lo de Pro + Veo 3 completo, Deep Think, Gemini Agent, límites más altos

Para Estudiantes

  • Google AI Pro gratis por 1 año para estudiantes verificados (18+) en países seleccionados

Para Empresas

  • Google Workspace: Gemini integrado en Gmail, Docs, Sheets, Slides, Meet
  • Vertex AI: Precios personalizados con SLAs empresariales

Precios de API (Gemini 3 Pro)

  • Input: $2.50 / 1M tokens (hasta 200K contexto)
  • Output: $10.00 / 1M tokens
  • Long Context (>200K): $5.00 input, $20.00 output / 1M tokens
  • Grounding con Google Search: $14 / 1,000 consultas

Precios de API (Gemini 2.5 Flash)

  • Input: $0.15 / 1M tokens
  • Output: $0.60 / 1M tokens

Integraciones y Herramientas

Aplicaciones Google

  • Gmail, Google Drive, Docs, Sheets, Slides, Meet, Chat
  • Google Photos, Google Maps
  • Google Search (AI Overviews y AI Mode)
  • NotebookLM (con audio overviews)
  • Android Auto

Herramientas de Desarrollo

  • Gemini CLI: Agente open source para terminal (Apache 2.0)
  • Gemini Code Assist: Extensión para VS Code e IDEs
  • Jules: Agente de programación asíncrono
  • Google AI Studio: Playground y gestión de API
  • Vertex AI: Plataforma empresarial en Google Cloud
  • Google Antigravity: Plataforma de desarrollo agéntico

Frameworks Soportados

  • LangChain, LangGraph
  • LlamaIndex
  • Vercel AI SDK
  • Pydantic AI
  • n8n
  • Composio

Seguridad y Privacidad

  • Cifrado en tránsito y en reposo
  • Cumplimiento SOC 2, ISO 27001
  • Opción de no entrenar con datos del usuario (planes de pago)
  • Vertex AI: endpoints privados, SLAs garantizados

Especificaciones Técnicas

ModeloContexto InputOutput MáximoKnowledge Cutoff
Gemini 3 Pro1M tokens64K tokensEnero 2025
Gemini 2.5 Pro1M tokens65K tokensSeptiembre 2024
Gemini 2.5 Flash1M tokens65K tokensSeptiembre 2024

Key Features

Modelos multimodales (texto, imagen, audio, video)
Gemini 3 Pro con razonamiento estado del arte
Modo Deep Think para problemas complejos
Ventana de contexto de 1 millón de tokens
Deep Research automatizado
Agentes autónomos (Gemini Agent, Project Mariner)
Generación de imágenes con Imagen 4 y Nano Banana Pro
Generación de video con Veo 3
Síntesis de voz con modelos TTS nativos
Gemini CLI open source para terminal
Jules: agente de programación asíncrono
Integración nativa con Google Workspace
AI Mode con interfaces generativas interactivas
Grounding con Google Search en tiempo real
NotebookLM con audio overviews
Gemini Code Assist para IDEs
Google Antigravity para desarrollo agéntico
Interactions API para agentes
Batch API con hasta 90% descuento
Context caching para reducir costos
Soporte MCP (Model Context Protocol)
SDKs oficiales para Python, Node.js, Go, Swift
Integración con Android Auto

Use Cases

Asistencia de escritura en Gmail y Google Docs

Análisis de datos en Google Sheets

Creación de presentaciones en Google Slides

Investigación profunda automatizada

Programación y desarrollo de software

Generación de contenido creativo

Análisis de documentos PDF extensos

Generación de imágenes profesionales

Creación de videos cortos

Automatización de tareas empresariales

Brainstorming y generación de ideas

Traducción y localización de contenido

Resumen de documentos y videos

Asistencia educativa y tutoría

Análisis financiero con AI Mode

Creación de agentes personalizados

Automatización de workflows con n8n

Desarrollo de aplicaciones con IA

Asistencia de voz en Android Auto

Gestión de proyectos de código

Reviews de Usuarios

IAs Relacionadas

Freemium
ChatGPT logo

ChatGPT

OpenAI

API

ChatGPT de OpenAI es un asistente de IA versátil que destaca en conversaciones naturales, creación de contenido y resolución de problemas complejos. Con sus capacidades multimodales avanzadas, procesa texto, voz e imágenes para optimizar tu productividad y creatividad.

Generación de Texto#Traducción#Freemium#Generación de Código#GPT-4#Redacción Publicitaria#Resumen#App Móvil
Freemium
Claude logo

Claude

Anthropic

APIOpen Source

Asistente de IA conversacional de Anthropic con enfoque en seguridad y razonamiento avanzado, líder en tareas de programación y flujos de trabajo agénticos con modelos Opus, Sonnet y Haiku.

Generación de Texto#Investigación#Traducción#Freemium#Generación de Código#Redacción Publicitaria#Presentaciones#Claude#Legal#Resumen#Extensión de Navegador#API#Depuración#Educación#Excel#App Móvil#Plugin
Freemium
Perplexity AI logo

Perplexity AI

Perplexity AI

APIOpen Source

Motor de búsqueda potenciado por IA que proporciona respuestas directas con citas verificables, investigación profunda automatizada y acceso a múltiples modelos LLM como GPT-5, Claude y Gemini.

Generación de Texto#Investigación#Resumen#Extensión de Navegador#API#Citas#App Móvil