BigQuery 中的 AI 简介

BigQuery 提供各种 AI 功能,可让您执行以下操作:

  • 执行预测性机器学习 (ML)。
  • 针对 Gemini 等大语言模型 (LLM) 运行推理。
  • 使用嵌入和向量搜索构建应用。
  • 使用内置代理来协助编码。
  • 创建数据流水线。
  • 通过代理工具访问 BigQuery 功能。

机器学习

借助 BigQuery ML,您可以训练、评估模型并运行推理,以完成时序预测、异常值检测、���类、回归、聚簇、降维和推荐等任务。

您可以通过Google Cloud 控制台、bq 命令行工具、REST API 或在 Colab Enterprise 笔记本中使用 BigQuery ML 功能。BigQuery ML 让 SQL 专业人员能够使用现有的 SQL 工具和技能来构建和评估模型,从而实现机器学习的普及,并加快模型开发速度,因为它可以将机器学习引入数据中,而无需移动数据。您可以使用 BigQuery ML 来帮助您完成以下类型的机器学习任务:

如需了解详情,请参阅 BigQuery 中的机器学习简介

AI 函数

BigQuery 提供各种 SQL 函数,可用于执行文本生成、文本或非结构化数据分析和翻译等 AI 任务。这些函数可访问 Vertex AI、Cloud AI API 或内置 BigQuery 模型提供的 Gemini 和合作伙伴 LLM 模型,以执行这些任务。

AI 函数分为以下几类:

  • 生成式 AI 函数这些函数可帮助您执行内容生成、分析、总结、结构化数据提取、分类、嵌入生成和数据丰富等任务。生成式 AI 函数有两种类型:

    • 通用 AI 函数可让您完全控制和透明地选择要使用的模型、提示和参数。
    • 托管式 AI 函数为过滤、评级和分类等常规任务提供简化的语法。BigQuery 会为您选择一个经过优化、可兼顾费用和质量的模型。
  • 特定于任务的函数。这些函数可帮助您将 Cloud AI API 用于以下任务:

如需了解详情,请参阅任务专用解决方案概览

BigQuery 提供了各种搜索函数和功能,可帮助您高效查找特定数据或发现数据(包括多模态数据)之间的相似之处。

  • 文本搜索。您可以使用 SEARCH 函数对非结构化文本或半结构化 JSON 数据执行标记化搜索。您可以创建搜索索引来提高搜索性能,这样 BigQuery 就可以优化使用 SEARCH 函数以及其他函数和运算符的查询。如需了解详情,请参阅搜索已编入索引的数据
  • 嵌入生成。您可以使用 Vertex AI 提供或托管的模型,也可以使用在 BigQuery 中导入和运行的模型来生成多模态嵌入
  • 向量搜索。您可以使用 VECTOR_SEARCH 函数搜索嵌入,以查找语义上相似的项。嵌入是表示文本或图片等实体的高维数值向量,通常由机器学习模型生成。您可以创建向量索引来提高向量搜索性能,该索引使用近似最近邻搜索技术来提供更快、更接近的结果。向量搜索的常见用例包括语义搜索、推荐和检索增强生成 (RAG)。如需了解详情,请参阅向量搜索简介

辅助性 AI 功能

BigQuery 中的 AI 赋能的辅助功能统称为 Gemini in BigQuery,可帮助您发现、准备、查询和直观呈现数据。

  • 数据分析。生成有关数据的自然语言问题,以及用于回答这些问题的 SQL 查询。
  • 数据准备。生成具备上下文感知能力的建议,以清理、转换和丰富数据。
  • SQL 代码辅助。 生成、补全并解释 SQL 查询。
  • Python 代码辅助。 生成、补全并解释 Python 代码,包括 PySpark 和 BigQuery DataFrames。
  • 数据画布。使用自然语言查询数据,通过图表直观呈现结果,并提出后续问题。
  • SQL 转换器。创建 Gemini 增强型 SQL 转换规则,帮助您将以其他方言编写的查询迁移到 GoogleSQL。

代理

代理是一种软件工具,可以使用 AI 代表您完成任务。您可以使用内置代理,也可以创建自己的代理来帮助您处理、管理、分析和直观呈现数据:

  • 使用数据科学代理在 Colab Enterprise 笔记本中自动执行探索性数据分析、数据处理、机器学习任务和可视化分析洞见。

  • 使用数据工程代理构建、修改和管理数据流水线,以在 BigQuery 中加载和处理数据。您可以使用自然语言提示从各种数据源生成数据流水线,或调整现有数据流水线以满足您的数据工程需求。

  • 使用 Gemini CLI,通过自然语言提示在终端中与 BigQuery 数据进行交互。

  • 使用 MCP Toolbox 将您自己的 AI 工具连接到 BigQuery 并与数据互动。

后续步骤