Panoramica di Vertex AI Agent Engine

Vertex AI Agent Engine (in precedenza LangChain su Vertex AI o Vertex AI Reasoning Engine) è una Google Cloud piattaforma che consente agli sviluppatori di eseguire il deployment, gestire e scalare gli agenti AI in produzione. Agent Engine gestisce l'infrastruttura per scalare gli agenti in produzione, in modo da poterti concentrarti sulla creazione di applicazioni. Il motore Vertex AI Agent offre le seguenti funzionalità:

  • Runtime gestito:

    • Esegui il deployment e scala gli agenti con un runtime gestito e funzionalità di gestione end-to-end.
    • Utilizza le funzionalità di sicurezza, tra cui la conformità a VPC-SC e la configurazione dell'autenticazione e di IAM.
    • Accedi a modelli e strumenti come le chiamate di funzione.
    • Esegui il deployment di agenti creati utilizzando diversi framework Python:
  • Qualità e valutazione:

    • Garantisci la qualità degli agenti con il servizio integrato Gen AI Evaluation.
    • Migliora il rendimento degli agenti con Example Store.
    • Ottimizza gli agenti con le esecuzioni di addestramento del modello Gemini.
  • Gestisci il contesto:

    • Sessioni: le sessioni dell'agente ti consentono di archiviare le singole interazioni tra utenti e agenti, fornendo fonti definitive per il contesto della conversazione.

    • Example Store: ti consente di archiviare ed estrarre in modo dinamico esempi few-shot.

  • Monitoraggio:

Panoramica concettuale del motore Vertex AI Agent

Vertex AI Agent Engine fa parte di Vertex AI Agent Builder, una suite di funzionalità per scoprire, creare ed eseguire il deployment di agenti di IA.

Crea ed esegui il deployment su Vertex AI Agent Engine

Nota:per un'esperienza di sviluppo e deployment semplificata e basata su IDE con Vertex AI Agent Engine, valuta la possibilità di utilizzare agent-starter-pack. Fornisce modelli pronti all'uso, un'interfaccia utente integrata per la sperimentazione e semplifica il deployment, le operazioni, la valutazione, la personalizzazione e l'osservabilità.

Il flusso di lavoro per creare un agente su Vertex AI Agent Engine è il seguente:

Passaggi Descrizione
1. Configura l'ambiente Configura il tuo progetto Google e installa la versione più recente dell'SDK Vertex AI per Python.
2. Sviluppare un agente Sviluppare un agente che può essere implementato su Vertex AI Agent Engine.
3. Esegui il deployment dell'agente Esegui il deployment dell'agente nel runtime gestito di Vertex AI Agent Engine.
4. Utilizzare l'agente Esegui una query sull'agente inviando una richiesta API.
5. Gestire l'agente di cui è stato eseguito il deployment Gestisci ed elimina gli agenti che hai dispiegato in Vertex AI Agent Engine.

I passaggi sono illustrati nel seguente diagramma:

Crea ed esegui il deployment di un agente 

Framework supportati

La tabella seguente descrive il livello di supporto fornito da Vertex AI Agent Engine per vari framework di agenti:

Livello di assistenza Framework di agenti
Modello personalizzato: puoi adattare un modello personalizzato per supportare il deployment in Vertex AI Agent Engine dal tuo framework. CrewAI, framework personalizzati
Integrazione dell'SDK Vertex AI: Vertex AI Agent Engine fornisce modelli gestiti per framework nell'SDK e nella documentazione di Vertex AI. AG2, LlamaIndex
Integrazione completa: le funzionalità sono integrate per funzionare nel framework, nel motore dell'agente Vertex AI e nell'ecosistema Google Cloud più ampio. Agent Development Kit (ADK), LangChain, LangGraph

Esegui il deployment in produzione con Agent Starter Pack

L'Agent Starter Pack è una raccolta di modelli di agenti di IA generativa pronti per la produzione creati per Vertex AI Agent Engine. Lo Starter Pack per gli agenti fornisce quanto segue:

  • Modelli di agenti predefiniti: ReAct, RAG, multi-agente e altri modelli.
  • Spazio di gioco interattivo: testa e interagisci con il tuo agente.
  • Infrastruttura automatizzata: utilizza Terraform per una gestione semplificata delle risorse.
  • Pipeline CI/CD: workflow di deployment automatico che sfruttano Cloud Build.
  • Osservabilità: supporto integrato per Cloud Trace e Cloud Logging.

Per iniziare, consulta la guida rapida.

Casi d'uso

Per scoprire di più su Vertex AI Agent Engine con esempi end-to-end, consulta le seguenti risorse:

Caso d'uso Descrizione Link
Creare agenti connettendosi ad API pubbliche Convertire valute.

Crea una funzione che si connetta a un'app di cambio valuta, consentendo al modello di fornire risposte accurate a query come "Qual è il tasso di cambio tra euro e dollari oggi?"
Notebook SDK Vertex AI per Python - Introduzione alla creazione e al deployment di un agente con Vertex AI Agent Engine
Progettazione di un progetto di energia solare comunitaria.

Identifica le potenziali località, cerca gli uffici governativi e i fornitori pertinenti ed esamina le immagini satellitari e il potenziale solare di regioni ed edifici per trovare la posizione ottimale per installare i pannelli solari.
Notebook SDK Vertex AI per Python: creazione e dispiegamento di un agente API Google Maps con il motore Vertex AI Agent
Creare agenti connettendosi ai database Integrazione con AlloyDB e Cloud SQL per PostgreSQL. Post del blog - Annuncio di LangChain su Vertex AI per AlloyDB e Cloud SQL per PostgreSQL

Notebook SDK Vertex AI per Python - Eseguire il deployment di un'applicazione RAG con Cloud SQL per PostgreSQL in Vertex AI Agent Engine

Notebook SDK Vertex AI per Python - Eseguire il deployment di un'applicazione RAG con AlloyDB per PostgreSQL in Vertex AI Agent Engine
Crea agenti con strumenti che accedono ai dati nel tuo database. Notebook SDK Vertex AI per Python: dispiegamento di un agente con il motore Vertex AI Agent e MCP Toolbox per i database
Esegui query e comprendi i datastore strutturati utilizzando il linguaggio naturale. Notebook SDK Vertex AI per Python - Creazione di un agente di ricerca conversazionale con Vertex AI Agent Engine e RAG su Vertex AI Search
Esegui query e comprendi i database di grafo utilizzando il linguaggio naturale Post del blog: agenti AI e GraphRAG di GenAI che utilizzano il motore di agenti Vertex AI con LangChain e Neo4j
Esegui query e comprendi gli store di vettori utilizzando il linguaggio naturale Post del blog: semplifica RAG di IA generativa con MongoDB Atlas e Vertex AI Agent Engine
Creare agenti con Agent Development Kit (anteprima) Crea ed esegui il deployment di agenti utilizzando Agent Development Kit. Agent Development Kit: esegui il deployment nel motore Vertex AI Agent
Creare agenti con framework OSS Crea ed esegui il deployment di agenti utilizzando il framework open source OneTwo. Post del blog: OneTwo e Vertex AI Agent Engine: esplorazione dello sviluppo di agenti di IA avanzati su Google Cloud
Crea ed esegui il deployment di agenti utilizzando il framework open source LangGraph. Notebook SDK Vertex AI per Python: creazione e dispiegamento di un'applicazione LangGraph con Vertex AI Agent Engine
Agenti di debug e ottimizzazione Crea e monitora gli agenti utilizzando OpenTelemetry e Cloud Trace. Notebook SDK Vertex AI per Python - Debug e ottimizzazione degli agenti: una guida al monitoraggio nel motore Vertex AI Agent

Sicurezza aziendale

Vertex AI Agent Engine supporta i Controlli di servizio VPC per rafforzare la sicurezza dei dati e mitigare i rischi di esfiltrazione di dati. Quando i Controlli di servizio VPC sono configurati, l'agente di cui è stato eseguito il deployment mantiene l'accesso sicuro alle API e ai servizi Google, come l'API BigQuery, l'API Cloud SQL Admin e l'API Vertex AI, garantendo un funzionamento senza problemi all'interno del perimetro definito. È fondamentale che Controlli di servizio VPC blocchi efficacemente tutto l'accesso a internet pubblico, confinando il movimento dei dati ai confini della rete autorizzata e migliorando notevolmente la posizione di sicurezza dell'azienda.

Aree geografiche supportate

Vertex AI Agent Engine è supportato nelle seguenti regioni:

Regione Località Descrizione Fase di avvio
us-central1 Iowa Sono supportate le versioni v1 e v1beta1. GA
us-west1 Oregon Sono supportate le versioni v1 e v1beta1. GA
europe-west1 Belgio Sono supportate le versioni v1 e v1beta1. GA
europe-southwest1 Madrid Sono supportate le versioni v1 e v1beta1. GA
asia-east1 Taiwan Sono supportate le versioni v1 e v1beta1. GA
asia-northeast1 Tokyo Sono supportate le versioni v1 e v1beta1. GA

Per le sessioni del motore dell'agente, sono supportate le seguenti regioni:

Regione Località Descrizione Fase di avvio
us-central1 Iowa La versione v1beta1 è supportata. Anteprima

Quota

Le seguenti quote e limiti si applicano a Vertex AI Agent Engine per un determinato progetto in ogni regione.
Quota Valore
Creazione/eliminazione/aggiornamento di Vertex AI Agent Engine al minuto 10
Query/StreamQuery Vertex AI Agent Engine al minuto 60
Numero massimo di risorse Vertex AI Agent Engine 100

Prezzi

I prezzi si basano sulle risorse di calcolo (ore vCPU) e di memoria (ore GiB) utilizzate dagli agenti di cui è stato eseguito il deployment nel runtime gestito di Vertex AI Agent Engine.

Prodotto ID SKU Prezzo
vCPU ReasoningEngine 8A55-0B95-B7DC 0,0994 $/vCPU-ora
Memoria del ReasoningEngine 0B45-6103-6EC1 0,0105 $/GiB-ora

Per ulteriori informazioni, consulta la sezione Prezzi.

Passaggi successivi