SQL Server 2025的新功能之AI篇 ~ UCOM 職能補給站

作者：楊先民
精誠資訊/恆逸教育訓練中心資深講師

※網路引用請註明完整出處

SQL Server 2025 已於今年正式上市。本期將針對新推出的和 AI 相關的一些功能做一些介紹，也大概了解一下新功能對於資料處理相關的一些內容。

在資料庫技術的演進史上，SQL Server 2025 的發佈代表著一個重要的分水嶺。隨著生成式 AI 與大型語言模型（LLM）的爆發，企業對於資料庫的要求已不再僅限於結構化數據的儲存與查詢，而是如何讓「數據」真正轉化為「智慧」。

SQL Server 2025 最受矚目的核心功能，正是原生向量支援（Native Vector Support）。這項功能讓 SQL Server 從一個傳統的關聯式數據庫（RDBMS），進化為能夠支撐現代 AI 應用（如 RAG 架構、語義搜尋、推薦系統）的「AI-Ready」數據平台。

以下將解析這項 AI 核心功能及其相關技術。

為什麼向量搜尋是AI的關鍵？

在傳統 SQL 查詢中，我們習慣使用 WHERE Name LIKE '%關鍵字%' 來尋找資料。這種方式依賴文字的精確匹配，無法理解文字背後的「含義」。例如，搜尋「運動鞋」時，傳統查詢無法找出包含「跑鞋」或「Sneakers」的紀錄，除非預先定義關鍵字索引。

**向量搜尋（Vector Search）**則完全不同。透過 AI 模型（如 OpenAI 的 Embedding 模型），文字、圖片、影音都可以轉化為一串由浮點數組成的數值向量（Embeddings）。在向量空間中，意義相近的內容會處於相鄰的位置。

SQL Server 2025 的突破在於：它不再需要外部的專用向量資料庫（Vector DB），而是直接在引擎內部處理這些高維度資料。

核心組件：VECTOR 資料型別

SQL Server 2025 引入了全新的 VECTOR 數據類型。

半精度浮點數（float16）支援

AI 向量通常包含數百甚至數千個維度。為了兼顧精準度與儲存效率，SQL Server 2025 支援 float16（半精度浮點數）。相比傳統的 float32，float16 僅佔用一半的空間，這對於儲存數百萬筆高維向量的企業級場景來說，能節省巨大的磁碟空間並提升記憶體掃描效率。

儲存與格式

雖然向量在底層以最佳化的二進制格式儲存，但為了開發方便，它與 JSON 具有高度的互操作性。開發者可以直接將 JSON 陣列存入向量欄位，系統會自動進行類型轉換。

性能引擎：DiskANN 索引技術

處理向量數據最大的挑戰在於「維度詛咒」。當資料量達到百萬甚至千萬級時，計算向量間的距離（如歐氏距離或餘弦相似度）會消耗大量的運算資源。

SQL Server 2025 採用了微軟研究院開發的 DiskANN（Disk-based Approximate Nearest Neighbor） 算法。這是目前業界最頂尖的近似最近鄰搜尋算法之一，其核心優勢包括：

低記憶體依賴：傳統向量索引（如 HNSW）通常需要將整個圖結構加載到 RAM。DiskANN 則是專為 SSD 最佳化的圖索引，僅需極少量的記憶體即可在海量資料中快速定位。
高召回率（High Recall）：在保證搜尋速度的同時，DiskANN 能提供約 95% 以上的準確度，遠超傳統的索引方法。
硬體普適性：DiskANN 能夠在普通伺服器硬體上高效執行，不需要昂貴的 GPU 即可支援大規模 AI 檢索。

T-SQL 中的 AI 擴展：新函數解析

為了配合向量功能，SQL Server 2025 擴展了 T-SQL 語法，讓開發者能以熟悉的 SQL 邏輯調用 AI 能力。

VECTOR_DISTANCE

這是計算兩個向量之間相似度的核心函數。支援多種距離指標：

· Euclidean（歐氏距離）：計算空間中的直線距離。

· Cosine（餘弦相似度）：專注於向量的方向而非長度，是語義搜尋的首選。

· Dot Product（內積）：常用於推薦系統模型。

VECTOR_SEARCH

搭配 DiskANN 索引，VECTOR_SEARCH 函數可以實現亞秒級的語義檢索。它能自動利用向量索引尋找與目標向量最接近的 $K$ 個鄰居。

RAG 架構與sp_invoke_external_rest_endpoint

SQL Server 2025 不僅能「儲存」向量，還能「主動」與外部 AI 模型溝通。

檢索增強生成 (RAG)
目前的生成式 AI 面臨「幻覺」問題。RAG 架構的解決方案是：當用戶提問時，先從資料庫（SQL Server）搜尋相關的企業私有資料，再將這些資料作為上下文傳遞給 LLM（如 GPT-4）。

無縫連接 AI 服務

新推出的系統儲存過程 sp_invoke_external_rest_endpoint 允許 SQL Server 直接調用 REST APIs。這意味著：

1. 即時向量化：資料寫入時，SQL Server 可直接調用 Azure OpenAI 接口將文字轉為向量並儲存。

2. 閉環 AI 邏輯：在一個 T-SQL Transaction 中完成「取得數據 -> 調用 AI 摘要 -> 回寫結果」的完整流程。

安全性與隔離：企業級 AI 的護城河

對於企業來說，將敏感資料交給 AI 最大的疑慮是安全。SQL Server 2025 將 AI 功能與其深厚的安全框架完美融合：

SQL Security 集成：所有向量查詢都受到現有的 Row-Level Security (RLS) 和加密技術保護。

模型運行隔離：內部的 AI 模型（如 ONNX 支援）在隔離的進程中運行，確保數據庫引擎的穩定性與安全性。

受控的外部連接：調用外部 REST API 需要明確的權限配置與網路策略，防止數據外洩。

應用實戰場景

場景 A：智慧技術手冊搜尋

某製造業公司有數萬份 PDF 格式的維修文檔。將這些文檔分段後存入 SQL Server 2025 的 VECTOR 欄位。技術員輸入「如何解決變壓器過熱？」，SQL Server 透過向量搜尋即刻找出最相關的維修步驟，即使文檔中寫的是「變壓器溫度過載」。

場景 B：混合搜尋推薦

電子商務平台可以使用 SQL Server 2025 進行「混合搜尋」：

· 過濾條件：Price < 1000 AND Brand = 'Apple'

· 語義搜尋：VECTOR_DISTANCE(User_Preference_Vector, Product_Vector) 這種結合了結構化篩選與非結構化語義搜尋的能力，是純向量資料庫難以企及的優勢。

總結：開啟資料庫的新紀元

SQL Server 2025 的 AI 功能——特別是原生向量搜尋與 DiskANN 索引——並非只是錦上添花的小修小補，而是對數據處理邏輯的重構。

它為企業提供了一個低門檻、高安全、高效能的 AI 基礎設施。對於開發者和 DBA 來說，這意味著他們可以使用現有的 SQL 技能，在不需要遷移到複雜新興工具的情況下，直接在成熟的 SQL Server 環境中構建下一代智慧應用。

隨著 2025 版的正式普及，SQL Server 已經準備好在 AI 時代繼續扮演企業數據核心的角色。

UCOM 職能補給站

提供您專業技能的最佳管道，IT企業主管唯一推薦

2026年3月31日星期二