本頁面由 Cloud Translation API 翻譯而成。

批次載入資料

您可以透過批次作業，將資料從 Cloud Storage 或本機檔案載入 BigQuery。來源資料可以是下列任一格式：

Avro
逗號分隔值 (CSV)
JSON (以換行符號分隔)
ORC
Parquet
儲存在 Cloud Storage 中的 Datastore 匯出資料
儲存在 Cloud Storage 中的 Firestore 匯出資料

您也可以使用 BigQuery 資料移轉服務，設定從 Cloud Storage 到 BigQuery 的週期性載入作業。

歡迎試用

如果您未曾使用過 Google Cloud，歡迎建立帳戶，親自體驗實際使用 BigQuery 的成效。新客戶可以獲得價值 $300 美元的免費抵免額，可用於執行、測試及部署工作負載。

免費試用 BigQuery

事前準備

授予身分與存取權管理 (IAM) 角色，讓使用者取得執行本文件中各項工作的必要權限，並建立資料集來儲存資料。

所需權限

如要將資料載入 BigQuery，您必須具備 IAM 權限，才能執行載入工作，並將資料載入 BigQuery 資料表和分區。如要從 Cloud Storage 載入資料，您也需要 IAM 權限存取包含資料的值區。

將資料載入 BigQuery 的權限

如要將資料載入新的 BigQuery 資料表或分區，或是附加或覆寫現有資料表或分區，您需要具備下列 IAM 權限：

bigquery.tables.create
bigquery.tables.updateData
bigquery.tables.update
bigquery.jobs.create

以下每個預先定��的 IAM 角色都包含將資料載入 BigQuery 資料表或分區所需的權限：

roles/bigquery.dataEditor
roles/bigquery.dataOwner
roles/bigquery.admin (包含 bigquery.jobs.create 權限)
bigquery.user (包含 bigquery.jobs.create 權限)
bigquery.jobUser (包含 bigquery.jobs.create 權限)

此外，如果您具備 bigquery.datasets.create 權限，就可以在您建立的資料集中使用載入工作建立及更新資料表。

如要進一步瞭解 BigQuery 中的 IAM 角色和權限，請參閱「預先定義的角色與權限」一文。

從 Cloud Storage 載入資料的權限

如要取得從 Cloud Storage 值區載入資料所需的權限，請要求管理員為您授予該值區的 Storage 管理員 (roles/storage.admin) IAM 角色。如要進一步瞭解如何授予角色，請參閱「管理專案、資料夾和機構的存取權」。

這個預先定義的角色包含從 Cloud Storage 值區載入資料所需的權限。如要查看確切的必要權限，請展開「必要權限」部分：

所需權限

您必須具備下列權限，才能從 Cloud Storage 值區載入資料：

storage.buckets.get
storage.objects.get
storage.objects.list (required if you are using a URI wildcard)

您或許還可透過自訂角色或其他預先定義的角色取得這些權限。

建立資料集

建立 BigQuery 資料集來儲存資料。

載入 Cloud Storage 中的資料

BigQuery 支援從以下任何一種 Cloud Storage 儲存空間級別載入資料：

標準
Nearline
Coldline
封存

如要瞭解如何將資料載入 BigQuery，請參閱資料格式的頁面：

如要瞭解如何設定從 Cloud Storage 定期載入至 BigQuery 的資料，請參閱「Cloud Storage 移轉」。

位置注意事項

資料集建立之後，即無法更改位置，但您可以建立資料集副本或手動移動資料集。如需詳細資訊，請參閱：

擷取 Cloud Storage URI

如要從 Cloud Storage 資料來源載入資料，您必須提供 Cloud Storage URI。

Cloud Storage 資源路徑包含值區名稱和物件 (檔名)。例如，如果 Cloud Storage 值區的名稱為 mybucket，且資料檔案的名稱為 myfile.csv，則資源路徑會是 gs://mybucket/myfile.csv。

BigQuery 不支援 Cloud Storage 資源路徑在初始雙斜線後還有多個連續斜線。Cloud Storage 物件名稱可以包含多個連續的斜線 (「/」) 字元，但 BigQuery 會將多個連續斜線轉換為一個斜線。舉例來說，下列資源路徑在 Cloud Storage 中有效，但在 BigQuery 中則無效：gs://bucket/my//object//name。

如何擷取 Cloud Storage 資源路徑：

開啟 Cloud Storage 主控台。

Cloud Storage 主控台
瀏覽至含有來源資料的物件 (檔案) 位置。
按一下物件的名稱。

「Object details」頁面隨即開啟。
複製「gsutil URI」欄位中提供的值，開頭為 gs://。

Google Datastore 匯出檔案只能指定一個 URI，而且必須以 .backup_info 或 .export_metadata 結尾。

Cloud Storage URI 的萬用字元支援

如果資料分成多個檔案，您可以使用星號 (*) 萬用字元選取多個檔案。使用星號萬用字元時，必須遵��下列規則：

星號可以出現在物件名稱內或物件名稱的末端。
系統不支援使用多個星號。例如，gs://mybucket/fed-*/temp/*.csv 路徑無效。
系統不支援在值區名稱中使用星號。

範例：

以下範例說明如何選取所有開頭為 gs://mybucket/fed-samples/fed-sample 前置字元的資料夾中的所有檔案：
```
gs://mybucket/fed-samples/fed-sample*
```
以下範例說明如何只選取名為 fed-samples 的資料夾和任何 fed-samples 子資料夾中，具有 .csv 副檔名的檔案：
```
gs://mybucket/fed-samples/*.csv
```
以下範例說明如何在名為 fed-samples 的資料夾中，選取命名模式為 fed-sample*.csv 的檔案。這個範例不會選取 fed-samples 子資料夾中的檔案。
```
gs://mybucket/fed-samples/fed-sample*.csv
```

使用 bq 指令列工具時，在某些平台上可能需要逸出星號。

從 Cloud Storage 載入 Datastore 或 Firestore 匯出資料時，您無法使用星號萬用字元。

限制

將資料從 Cloud Storage 值區載入 BigQuery 時有下列限制：

BigQuery 不保證外部資料來源的資料一致性。如果基礎資料在查詢執行期間遭到變更，可能會導致非預期的行為。
BigQuery 不支援 Cloud Storage 物件版本控制。如果在 Cloud Storage URI 中加入世代號碼，載入作業就會失敗。

根據 Cloud Storage 來源資料的格式，可能還有其他的限制。如需詳細資訊，請參閱：

從本機檔案載入資料

您可以使用下列任一方式，從可讀取的資料來源 (例如本機電腦) 載入資料：

Google Cloud 控制台
bq 指令列工具的 bq load 指令
API
用戶端程式庫

當您使用 Google Cloud 主控台或 bq 指令列工具載入資料時，系統會自動建立載入工作。

從本機資料來源載入資料：

主控台

在 Google Cloud 控制台開啟「BigQuery」頁面。

前往「BigQuery」頁面
在「Explorer」面板中展開專案並選取資料集。
展開「動作」選項，然後按一下「開啟」。
在詳細資料面板中，按一下「Create table」(建立資料表) 圖示。
在「Create table」(建立資料表) 頁面的「Source」(來源) 區段中：
- 針對「Create table from」(使用下列資料建立資料表)，選取 [Upload] (上傳)。
- 在「Select file」部分，按一下「Browse」。
- 瀏覽至檔案，然後按一下 [Open] (開啟)。請注意，本機檔案不支援萬用字元和以半形逗號分隔的清單。
- 在「File format」(檔案格式) 部分，選取 [CSV]、[JSON (newline delimited)] (JSON (以換行符號分隔))、[Avro]、[Parquet] 或 [ORC]。
在「Create table」(建立資料表) 頁面的「Destination」(目的地) 區段中：
- 在「Project」(專案) 部分，選擇適當的專案。
- 針對「Dataset」(資料集)，選擇適當的資料集。
- 在「Table」(資料表) 欄位中，輸入您在 BigQuery 中建立資料表時使用的名稱。
- 確認「Table type」(資料表類型) 設為「Native table」(原生資料表)。
在「Schema」(結構定義) 部分輸入結構定義。
- 如為 CSV 及 JSON 檔案，您可以勾選 [Auto-detect] (自動偵測) 選項，以啟用結構定義自動偵測功能。您可以在其他支援檔案類型的來源資料中找到結構定義資訊。
- 您也可以使用下列任一個方式手動輸入結構定義資訊：
  - 按一下 [Edit as text] (以文字形式編輯)，然後以 JSON 陣列的形式輸入資料表結構定義：
    
    注意：輸入下列指令即可查看現有資料表的 JSON 格式結構定義：bq show --format=prettyjson dataset.table。
  - 使用 [Add Field] (新增欄位) 手動輸入結構定義。
在「Advanced options」部分中選取適合的項目。如要瞭解可用的選項，請參閱 CSV 選項和 JSON 選項。
選用：在「Advanced options」(進階選項) 中選擇寫入處置：
- 空白時寫入：僅在資料表空白時寫入資料。
- 附加到資料表：將資料附加至資料表尾端。這是預設設定。
- 覆寫資料表：先清除資料表中的所有現有資料，再寫入新的資料。
點選「建立資料表」。

bq

請使用 bq load 指令來指定 source_format，然後將路徑加入本機檔案中。

(選用) 提供 --location 旗標，並將值設為您的位置。

如果您要在非預設專案中載入資料，請採用下列格式將專案 ID 新增至資料集：PROJECT_ID:DATASET。

bq --location=LOCATION load \
--source_format=FORMAT \
PROJECT_ID:DATASET.TABLE \
PATH_TO_SOURCE \
SCHEMA

更改下列內容：

LOCATION：您的位置。--location 是選用旗標。舉例來說，如果您在東��地區使用 BigQuery，就可將該旗標的值設為 asia-northeast1。您可以使用 .bigqueryrc 檔案設定位置的預設值。
FORMAT：CSV、AVRO、PARQUET、ORC 或 NEWLINE_DELIMITED_JSON。
project_id：您的專案 ID。
dataset：現有資料集。
table：您要載入資料的資料表名稱。
path_to_source：本機檔案的路徑。
schema：有效的結構定義。結構定義可以是本機 JSON 檔案，或以內嵌的方式在指令中輸入。您也可以改用 --autodetect 標記，而非提供結構定義。

此外，您還可以針對選項新增旗標，以控制 BigQuery 剖析資料的方式。舉例來說，您可以使用 --skip_leading_rows 旗標，忽略 CSV 檔案中的標題列。詳情請參閱 CSV 選項與 JSON 選項。

範例：

下列指令會將本機電腦中以換行符號分隔的 JSON 檔案 (mydata.json)，載入預設專案的 mydataset 中名為 mytable 的資料表。結構定義是在名為 myschema.json 的本機結構定義檔中定義。

    bq load \
    --source_format=NEWLINE_DELIMITED_JSON \
    mydataset.mytable \
    ./mydata.json \
    ./myschema.json

下列指令會將本機 CSV 檔案 (mydata.csv) 載入至 myotherproject 的 mydataset 中名為 mytable 的資料表。結構定義是以內嵌的方式定義，格式為 FIELD:DATA_TYPE, FIELD:DATA_TYPE。

    bq load \
    --source_format=CSV \
    myotherproject:mydataset.mytable \
    ./mydata.csv \
    qtr:STRING,sales:FLOAT,year:STRING

下列指令會將本機 CSV 檔案 (mydata.csv) 載入至預設專案 mydataset 中名為 mytable 的資料表。而結構定義是利用結構定義自動偵測功能定義的。

    bq load \
    --autodetect \
    --source_format=CSV \
    mydataset.mytable \
    ./mydata.csv