![]() |
|---|
| 使用 NoSQL 資料 - 速記筆記由 @nitya 提供 |
資料並不限於關聯式資料庫。本課程聚焦於非關聯式資料,並將涵蓋試算表和 NoSQL 的基礎知識。
試算表是一種流行的資料存儲和探索方式,因為它需要較少的設置工作即可開始使用。在本課程中,您將學習試算表的基本組成部分,以及公式和函數。範例將以 Microsoft Excel 為例,但大多數部分和主題在其他試算表軟體中名稱和步驟相似。
試算表是一個檔案,可以在電腦、設備或基於雲端的檔案系統中存取。軟體本身可能是基於瀏覽器的,或者需要安裝在電腦上的應用程式,或下載為應用程式。在 Excel 中,這些檔案也被定義為 工作簿,本課程將使用此術語。
工作簿包含一個或多個 工作表,每個工作表都以標籤命名。在工作表中有稱為 儲存格 的矩形,這些儲存格包含實際的資料。儲存格是行和列的交叉點,其中列以字母標記,行以數字標記。一些試算表會在前幾行中包含標題,以描述儲存格中的資料。
了解了 Excel 工作簿的這些基本元素後,我們將使用 Microsoft Templates 中的範例,專注於庫存管理,來進一步了解試算表的其他部分。
名為 "InventoryExample" 的試算表檔案是一個格式化的庫存項目試算表,包含三個工作表,標籤分別為 "Inventory List"、"Inventory Pick List" 和 "Bin Lookup"。Inventory List 工作表的第 4 行是標題,描述了標題列中每個儲存格的值。
有些情況下,儲存格的值依賴於其他儲存格的值來生成。在此範例中,Inventory List 試算表追蹤庫存中每個項目的成本,但如果我們需要知道整個庫存的價值呢?公式 用於對儲存格資料執行操作,並在此範例中計算庫存的成本。此試算表在 Inventory Value 列中使用公式,通過將 QTY 標題下的數量與 COST 標題下的成本相乘來計算每個項目的價值。雙擊或高亮顯示儲存格即可查看公式。您會注意到公式以等號開頭,後面是計算或操作。
我們可以使用另一個公式將所有 Inventory Value 的值相加,來獲得其總價值。這可以通過逐一相加每個儲存格來計算,但這可能是一項繁瑣的任務。Excel 提供了 函數,即預定義的公式,用於對儲存格值進行計算。函數需要參數,即執行這些計算所需的值。如果函數需要多個參數,則需要按特定順序列出,否則函數可能無法計算正確的值。此範例使用 SUM 函數,並使用 Inventory Value 的值作為參數,生成列於第 3 行、第 B 列(也稱為 B3)的總值。
NoSQL 是一個涵蓋非關聯式資料存儲方式的術語,可以解釋為 "非 SQL"、"非關聯式" 或 "不僅僅是 SQL"。這類型的資料庫系統可以分為四種類型。
鍵值 資料庫將唯一鍵(唯一識別符)與值配對。這些配對使用 哈希表 和適當的哈希函數存儲。
來源:Microsoft
圖形 資料庫描述資料中的關係,並以節點和邊的集合表示。節點表示實體,即現實世界中存在的事物,例如學生或銀行對帳單。邊表示兩個實體之間的關係。每個節點和邊都有屬性,提供有關節點和邊的額外資訊。
列式 資料存儲將資料組織為列和行,類似於關聯式資料結構,但每列被分為稱為列族的群組,其中一列下的所有資料是相關的,可以作為一個單元檢索和更改。
文件 資料存儲基於鍵值資料存儲的概念,由一系列欄位和物件組成。本節將使用 Cosmos DB 模擬器探索文件資料庫。
Cosmos DB 資料庫符合 "不僅僅是 SQL" 的定義,其中 Cosmos DB 的文件資料庫依賴 SQL 來查詢資料。前一課程 涵蓋了 SQL 的基礎知識,我們將能夠在此處將一些相同的查詢應用於文件資料庫。我們將使用 Cosmos DB 模擬器,它允許我們在電腦上本地創建和探索文件資料庫。更多關於模擬器的資訊請參閱此處。
文件是由欄位和物件值組成的集合,其中欄位描述物件值的含義。以下是一個文件範例。
{
"firstname": "Eva",
"age": 44,
"id": "8c74a315-aebf-4a16-bb38-2430a9896ce5",
"_rid": "bHwDAPQz8s0BAAAAAAAAAA==",
"_self": "dbs/bHwDAA==/colls/bHwDAPQz8s0=/docs/bHwDAPQz8s0BAAAAAAAAAA==/",
"_etag": "\"00000000-0000-0000-9f95-010a691e01d7\"",
"_attachments": "attachments/",
"_ts": 1630544034
}此文件中的主要欄位包括:firstname、id 和 age。其餘帶有下劃線的欄位是由 Cosmos DB 自動生成的。
您可以在此處下載並安裝 Windows 版模擬器。如果您使用 macOS 或 Linux,請參閱此文件了解如何運行模擬器。
模擬器啟動後會打開一個瀏覽器窗口,其中的 Explorer 視圖允許您探索文件。
如果您正在跟隨操作,請點擊 "Start with Sample" 生成一個名為 SampleDB 的範例資料庫。展開 SampleDB,您會看到一個名為 Persons 的容器。容器包含一系列項目,即容器內的文件。您可以探索 Items 下的四個單獨文件。
我們還可以通過點擊 "New SQL Query" 按鈕(左側第二個按鈕)來查詢範例資料。
SELECT * FROM c 返回容器中的所有文件。讓我們添加一個 where 子句,查找年齡小於 40 的人。
SELECT * FROM c where c.age < 40
查詢返回了兩個文件,注意每個文件的年齡值都小於 40。
如果您熟悉 JavaScript Object Notation (JSON),您會注意到文件看起來與 JSON 類似。此目錄中有一個 PersonsData.json 檔案,包含更多資料,您可以通過模擬器中的 Upload Item 按鈕上傳到 Persons 容器。
在大多數情況下,返回 JSON 資料的 API 可以直接轉移並存儲到文件資料庫中。以下是另一個文件範例,它表示從 Microsoft Twitter 帳戶檢索的推文,這些推文是通過 Twitter API 獲取後插入到 Cosmos DB 中的。
{
"created_at": "2021-08-31T19:03:01.000Z",
"id": "1432780985872142341",
"text": "Blank slate. Like this tweet if you’ve ever painted in Microsoft Paint before. https://t.co/cFeEs8eOPK",
"_rid": "dhAmAIUsA4oHAAAAAAAAAA==",
"_self": "dbs/dhAmAA==/colls/dhAmAIUsA4o=/docs/dhAmAIUsA4oHAAAAAAAAAA==/",
"_etag": "\"00000000-0000-0000-9f84-a0958ad901d7\"",
"_attachments": "attachments/",
"_ts": 1630537000此文件中的主要欄位包括:created_at、id 和 text。
目錄中有一個 TwitterData.json 檔案,您可以上傳到 SampleDB 資料庫。建議您將其添加到一個單獨的容器中。操作步驟如下:
- 點擊右上角的 "New Container" 按鈕
- 選擇現有資料庫 (SampleDB),為容器創建一個容器 ID
- 將分區鍵設置為
/id - 點擊 OK(可以忽略此視圖中的其他資訊,因為這是一個小型資料集,運行於您的本地機器)
- 打開新容器,使用
Upload Item按鈕上傳 Twitter Data 檔案
嘗試運行一些 SELECT 查詢,查找 text 欄位中包含 Microsoft 的文件。提示:嘗試使用 LIKE 關鍵字。
-
試算表中還有一些額外的格式和功能,本課程未涵蓋。如果您有興趣了解更多,Microsoft 提供了大量的 Excel 文件和影片。
-
此架構文件詳細說明了不同類型非關聯式資料的特徵:非關聯式資料與 NoSQL。
-
Cosmos DB 是一個基於雲端的非關聯式資料庫,也可以存儲本課程中提到的不同 NoSQL 類型。了解更多請參閱此 Cosmos DB Microsoft Learn 模組。
免責聲明:
本文件已使用 AI 翻譯服務 Co-op Translator 進行翻譯。雖然我們致力於提供準確的翻譯,但請注意,自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應被視為權威來源。對於關鍵信息,建議尋求專業人工翻譯。我們對因使用此翻譯而引起的任何誤解或錯誤解釋概不負責。









