BigQuery 中的 AI 简介
BigQuery 提供各种 AI 功能,可让您执行以下操作:
- 执行预测性机器学习 (ML)。
- 针对 Gemini 等大语言模型 (LLM) 运行推理。
- 使用嵌入和向量搜索构建应用。
- 使用内置代理来协助编码。
- 创建数据流水线。
- 通过代理工具访问 BigQuery 功能。
机器学习
借助 BigQuery ML,您可以训练、评估模型并运行推理,以完成时序预测、异常值检测、���类、回归、聚簇、降维和推荐等任务。
您可以通过Google Cloud 控制台、bq 命令行工具、REST API 或在 Colab Enterprise 笔记本中使用 BigQuery ML 功能。BigQuery ML 让 SQL 专业人员能够使用现有的 SQL 工具和技能来构建和评估模型,从而实现机器学习的普及,并加快模型开发速度,因为它可以将机器学习引入数据中,而无需移动数据。您可以使用 BigQuery ML 来帮助您完成以下类型的机器学习任务:
- 使用 GoogleSQL 查询创建和运行机器学习模型。
- 创建 Colab Enterprise 笔记本以执行机器学习工作流。借助笔记本,您可以交替使用 SQL 和 Python,并使用任何 AI 或 ML Python 库进行开发。
- 借助可解释 AI 了解预测性机器学习模型的结果。
- 使用 TimesFM、
ARIMA_PLUS和ARIMA_PLUS_XREG模型对时序数据执行预测和异常值检测。 - 通过贡献分析,生成有关多维数据中关键指标变化的分析洞见。
如需了解详情,请参阅 BigQuery 中的机器学习简介。
AI 函数
BigQuery 提供各种 SQL 函数,可用于执行文本生成、文本或非结构化数据分析和翻译等 AI 任务。这些函数可访问 Vertex AI、Cloud AI API 或内置 BigQuery 模型提供的 Gemini 和合作伙伴 LLM 模型,以执行这些任务。
AI 函数分为以下几类:
生成式 AI 函数这些函数可帮助您执行内容生成、分析、总结、结构化数据提取、分类、嵌入生成和数据丰富等任务。生成式 AI 函数有两种类型:
特定于任务的函数。这些函数可帮助您将 Cloud AI API 用于以下任务:
如需了解详情,请参阅任务专用解决方案概览。
搜索
BigQuery 提供了各种搜索函数和功能,可帮助您高效查找特定数据或发现数据(包括多模态数据)之间的相似之处。
- 文本搜索。您可以使用
SEARCH函数对非结构化文本或半结构化JSON数据执行标记化搜索。您可以创建搜索索引来提高搜索性能,这样 BigQuery 就可以优化使用SEARCH函数以及其他函数和运算符的查询。如需了解详情,请参阅搜索已编入索引的数据。 - 嵌入生成。您可以使用 Vertex AI 提供或托管的模型,也可以使用在 BigQuery 中导入和运行的模型来生成多模态嵌入。
- 向量搜索。您可以使用
VECTOR_SEARCH函数搜索嵌入,以查找语义上相似的项。嵌入是表示文本或图片等实体的高维数值向量,通常由机器学习模型生成。您可以创建向量索引来提高向量搜索性能,该索引使用近似最近邻搜索技术来提供更快、更接近的结果。向量搜索的常见用例包括语义搜索、推荐和检索增强生成 (RAG)。如需了解详情,请参阅向量搜索简介。
辅助性 AI 功能
BigQuery 中的 AI 赋能的辅助功能统称为 Gemini in BigQuery,可帮助您发现、准备、查询和直观呈现数据。
- 数据分析。生成有关数据的自然语言问题,以及用于回答这些问题的 SQL 查询。
- 数据准备。生成具备上下文感知能力的建议,以清理、转换和丰富数据。
- SQL 代码辅助。 生成、补全并解释 SQL 查询。
- Python 代码辅助。 生成、补全并解释 Python 代码,包括 PySpark 和 BigQuery DataFrames。
- 数据画布。使用自然语言查询数据,通过图表直观呈现结果,并提出后续问题。
- SQL 转换器。创建 Gemini 增强型 SQL 转换规则,帮助您将以其他方言编写的查询迁移到 GoogleSQL。
代理
代理是一种软件工具,可以使用 AI 代表您完成任务。您可以使用内置代理,也可以创建自己的代理来帮助您处理、管理、分析和直观呈现数据:
使用数据科学代理在 Colab Enterprise 笔记本中自动执行探索性数据分析、数据处理、机器学习任务和可视化分析洞见。
使用数据工程代理构建、修改和管理数据流水线,以在 BigQuery 中加载和处理数据。您可以使用自然语言提示从各种数据源生成数据流水线,或调整现有数据流水线以满足您的数据工程需求。
使用 Gemini CLI,通过自然语言提示在终端中与 BigQuery 数据进行交互。
使用 MCP Toolbox 将您自己的 AI 工具连接到 BigQuery 并与数据互动。
后续步骤
- 如需详细了解机器学习,请参阅 BigQuery 中的机器学习简介。
- 如需详细了解 SQL 中的生成式 AI 函数,请参阅生成式 AI 概览。
- 如需详细了解如何搜索数据,请参阅搜索已编入索引的数据和向量搜索简介。
- 如需详细了解辅助 AI 功能,请参阅 Gemini in BigQuery。
- 如需详细了解如何将代理与 BigQuery 搭配使用,请参阅将 BigQuery 与 MCP、Gemini CLI 和其他代理搭配使用。