El mundo de la IA atrae por el gran potencial de los agentes de IA, entidades que los usuarios pueden dirigir para percibir su entorno, tomar decisiones e implementar medidas para lograr objetivos específicos. Los modelos Gemini de Google, con sus capacidades avanzadas de razonamiento, multimodalidad y llamada a función, proporcionan una base sólida para crear agentes de IA. Además del vibrante ecosistema de marcos de trabajo de código abierto, los desarrolladores ahora cuentan con las herramientas necesarias para crear aplicaciones agénticas sofisticadas.
En esta entrada, te explicaremos cómo crear agentes de IA con modelos de Google Gemini utilizando marcos de trabajo de código abierto populares, como LangGraph, CrewAI, LlamaIndex o Composio. Te contaremos cómo cada marco de trabajo aprovecha sus fortalezas en diferentes situaciones.
Los modelos de Gemini, incluido el más reciente, Gemini 2.5, ofrecen varias ventajas para el desarrollo de agentes:
La elección del marco de trabajo suele depender de los requisitos específicos de tu agente o de los casos de uso. A continuación, se presentan algunas opciones populares. Cada una ofrece diferentes fortalezas y enfoques para el desarrollo de agentes.
LangGraph, una extensión de LangChain, te permite crear aplicaciones con estado y multiactor representando los flujos de trabajo como gráficos. Cada nodo del gráfico es un paso (p. ej., una llamada de LLM o la ejecución de una herramienta) y los perímetros definen el flujo de control. LangGraph es excelente para flujos de trabajo complejos y con estado donde la visibilidad y el control sobre el proceso de razonamiento del agente son fundamentales. Si utilizas los modelos de Google Gemini con LangGraph, puede sacar provecho de su razonamiento avanzado y de su llamada a función para cada paso, lo que permite la reflexión iterativa y el uso de herramientas. Comienza a usar LangChain o LangGraph.
CrewAI se diseñó para orquestar agentes de IA autónomos que colaboran para lograr objetivos complejos. Simplifica el desarrollo de sistemas multiagente, ya que te permite definir agentes con roles, objetivos e historias de fondo específicos, y luego asignarles tareas. CrewAI se integra perfectamente con los modelos de Google Gemini. Al potenciar tus agentes de CrewAI con modelos de Gemini, puedes aprovechar su excelente capacidad de razonamiento y comprensión del lenguaje para el rol especializado de cada agente, lo que permite establecer una colaboración y ejecución de tareas más efectivas. Comienza a usar CrewAI.
LlamaIndex es un marco de trabajo que se diseñó para crear agentes de conocimiento utilizando LLM conectados a tus datos. Se destaca en la ingestión de datos, la indexación y la provisión de capacidades de recuperación, lo que permite a los desarrolladores crear flujos de trabajo multiagente que pueden automatizar diferentes tipos de trabajo de conocimiento. LlamaIndex ofrece integraciones directas con los modelos de Gemini, de modo que puedes usarlos para incorporar generación y estrategias de recuperación avanzadas, y sintetizar respuestas basadas en tus datos privados. Esto es fundamental para crear agentes que puedan razonar y responder preguntas sobre información que no está presente en los datos generales del entrenamiento del LLM. LlamaIndex es compatible con modelos de Gemini de solo texto y multimodales, por lo que permite usar RAG sobre texto e imágenes. Comienza a usar LlamaIndex.
Composio es un marco de trabajo centrado en simplificar la integración de herramientas y APIs externas en agentes de IA. Proporciona una capa administrada para la autenticación y ejecución de una amplia gama de herramientas prediseñadas, que actúa de manera efectiva como un conector universal para tus agentes. Esto permite a los desarrolladores brindar rápidamente a sus agentes capacidades para interactuar con servicios como GitHub, Slack, Google Workspace y Notion, entre otros, sin necesidad de administrar autenticaciones de APIs individuales o crear wrappers de herramientas personalizados. Composio con modelos de Google Gemini aprovecha las capacidades de llamada a función de Gemini para seleccionar y utilizar de forma inteligente estas herramientas, de modo que tus agentes puedan realizar una amplia gama de tareas del mundo real. Comienza a usar Composio.
¿Tienes todo listo para empezar a crear agentes de IA con modelos de Google Gemini hoy mismo? Aquí te explicamos cómo hacerlo:
Explora este anuncio y todas las novedades de Google I/O 2025 en io.google a partir del 22 de mayo.