Vertex AI Agent Engine (in precedenza LangChain su Vertex AI o Vertex AI Reasoning Engine) è una Google Cloud piattaforma che consente agli sviluppatori di eseguire il deployment, gestire e scalare gli agenti AI in produzione. Agent Engine gestisce l'infrastruttura per scalare gli agenti in produzione, in modo da poterti concentrarti sulla creazione di applicazioni. Il motore Vertex AI Agent offre le seguenti funzionalità:
Runtime gestito:
- Esegui il deployment e scala gli agenti con un runtime gestito e funzionalità di gestione end-to-end.
- Utilizza le funzionalità di sicurezza, tra cui la conformità a VPC-SC e la configurazione dell'autenticazione e di IAM.
- Accedi a modelli e strumenti come le chiamate di funzione.
- Esegui il deployment di agenti creati utilizzando diversi framework Python:
Qualità e valutazione:
- Garantisci la qualità degli agenti con il servizio integrato Gen AI Evaluation.
- Migliora il rendimento degli agenti con Example Store.
- Ottimizza gli agenti con le esecuzioni di addestramento del modello Gemini.
Gestisci il contesto:
Sessioni: le sessioni dell'agente ti consentono di archiviare le singole interazioni tra utenti e agenti, fornendo fonti definitive per il contesto della conversazione.
Example Store: ti consente di archiviare ed estrarre in modo dinamico esempi few-shot.
Monitoraggio:
- Scopri il comportamento dell'agente con Google Cloud Trace (supporta OpenTelemetry), Cloud Monitoring e Cloud Logging.
Vertex AI Agent Engine fa parte di Vertex AI Agent Builder, una suite di funzionalità per scoprire, creare ed eseguire il deployment di agenti di IA.
Crea ed esegui il deployment su Vertex AI Agent Engine
Nota:per un'esperienza di sviluppo e deployment semplificata e basata su IDE con Vertex AI Agent Engine, valuta la possibilità di utilizzare agent-starter-pack. Fornisce modelli pronti all'uso, un'interfaccia utente integrata per la sperimentazione e semplifica il deployment, le operazioni, la valutazione, la personalizzazione e l'osservabilità.
Il flusso di lavoro per creare un agente su Vertex AI Agent Engine è il seguente:
Passaggi | Descrizione |
---|---|
1. Configura l'ambiente | Configura il tuo progetto Google e installa la versione più recente dell'SDK Vertex AI per Python. |
2. Sviluppare un agente | Sviluppare un agente che può essere implementato su Vertex AI Agent Engine. |
3. Esegui il deployment dell'agente | Esegui il deployment dell'agente nel runtime gestito di Vertex AI Agent Engine. |
4. Utilizzare l'agente | Esegui una query sull'agente inviando una richiesta API. |
5. Gestire l'agente di cui è stato eseguito il deployment | Gestisci ed elimina gli agenti che hai dispiegato in Vertex AI Agent Engine. |
I passaggi sono illustrati nel seguente diagramma:
Framework supportati
La tabella seguente descrive il livello di supporto fornito da Vertex AI Agent Engine per vari framework di agenti:
Livello di assistenza | Framework di agenti |
---|---|
Modello personalizzato: puoi adattare un modello personalizzato per supportare il deployment in Vertex AI Agent Engine dal tuo framework. | CrewAI, framework personalizzati |
Integrazione dell'SDK Vertex AI: Vertex AI Agent Engine fornisce modelli gestiti per framework nell'SDK e nella documentazione di Vertex AI. | AG2, LlamaIndex |
Integrazione completa: le funzionalità sono integrate per funzionare nel framework, nel motore dell'agente Vertex AI e nell'ecosistema Google Cloud più ampio. | Agent Development Kit (ADK), LangChain, LangGraph |
Esegui il deployment in produzione con Agent Starter Pack
L'Agent Starter Pack è una raccolta di modelli di agenti di IA generativa pronti per la produzione creati per Vertex AI Agent Engine. Lo Starter Pack per gli agenti fornisce quanto segue:
- Modelli di agenti predefiniti: ReAct, RAG, multi-agente e altri modelli.
- Spazio di gioco interattivo: testa e interagisci con il tuo agente.
- Infrastruttura automatizzata: utilizza Terraform per una gestione semplificata delle risorse.
- Pipeline CI/CD: workflow di deployment automatico che sfruttano Cloud Build.
- Osservabilità: supporto integrato per Cloud Trace e Cloud Logging.
Per iniziare, consulta la guida rapida.
Casi d'uso
Per scoprire di più su Vertex AI Agent Engine con esempi end-to-end, consulta le seguenti risorse:
Sicurezza aziendale
Vertex AI Agent Engine supporta i Controlli di servizio VPC per rafforzare la sicurezza dei dati e mitigare i rischi di esfiltrazione di dati. Quando i Controlli di servizio VPC sono configurati, l'agente di cui è stato eseguito il deployment mantiene l'accesso sicuro alle API e ai servizi Google, come l'API BigQuery, l'API Cloud SQL Admin e l'API Vertex AI, garantendo un funzionamento senza problemi all'interno del perimetro definito. È fondamentale che Controlli di servizio VPC blocchi efficacemente tutto l'accesso a internet pubblico, confinando il movimento dei dati ai confini della rete autorizzata e migliorando notevolmente la posizione di sicurezza dell'azienda.
Aree geografiche supportate
Vertex AI Agent Engine è supportato nelle seguenti regioni:
Regione | Località | Descrizione | Fase di avvio |
---|---|---|---|
us-central1 |
Iowa | Sono supportate le versioni v1 e v1beta1 . |
GA |
us-west1 |
Oregon | Sono supportate le versioni v1 e v1beta1 . |
GA |
europe-west1 |
Belgio | Sono supportate le versioni v1 e v1beta1 . |
GA |
europe-southwest1 |
Madrid | Sono supportate le versioni v1 e v1beta1 . |
GA |
asia-east1 |
Taiwan | Sono supportate le versioni v1 e v1beta1 . |
GA |
asia-northeast1 |
Tokyo | Sono supportate le versioni v1 e v1beta1 . |
GA |
Per le sessioni del motore dell'agente, sono supportate le seguenti regioni:
Regione | Località | Descrizione | Fase di avvio |
---|---|---|---|
us-central1 |
Iowa | La versione v1beta1 è supportata. |
Anteprima |
Quota
Le seguenti quote e limiti si applicano a Vertex AI Agent Engine per un determinato progetto in ogni regione.Quota | Valore |
---|---|
Creazione/eliminazione/aggiornamento di Vertex AI Agent Engine al minuto | 10 |
Query/StreamQuery Vertex AI Agent Engine al minuto | 60 |
Numero massimo di risorse Vertex AI Agent Engine | 100 |
Prezzi
I prezzi si basano sulle risorse di calcolo (ore vCPU) e di memoria (ore GiB) utilizzate dagli agenti di cui è stato eseguito il deployment nel runtime gestito di Vertex AI Agent Engine.
Prodotto | ID SKU | Prezzo |
---|---|---|
vCPU ReasoningEngine | 8A55-0B95-B7DC | 0,0994 $/vCPU-ora |
Memoria del ReasoningEngine | 0B45-6103-6EC1 | 0,0105 $/GiB-ora |
Per ulteriori informazioni, consulta la sezione Prezzi.