一、概述
	SQL 引擎主要由三大部分構(gòu)成:解析器、優(yōu)化器和執(zhí)行器。
	解析器的主要作用是將客戶端傳來的命令解析編譯成數(shù)據(jù)庫能識別運行的命令,其主要由詞法解析、語法解析和語義解析三部分構(gòu)成,如下圖所示。 
 ?
本文將重點介紹 KaiwuDB 語義解析部分,其輸入為 AST 語法樹,輸出為可供優(yōu)化器使用的 Expr 表達式。
	KaiwuDB 中的語義解析主要包括:
檢查數(shù)據(jù)庫或表是否存在
檢查語句所需的特定權(quán)限
對語句中的表達式進行語義解析
檢查 DDL 語句所請求的 schema change 的有效性
二、語義解析
	     
 ?
	KaiwuDB 中的語義解析主要包括以下流程:
檢查查詢是否為 SQL 語言中的有效語句
解析名稱,例如表名或變量名的值
消除不必要的中間計算,例如用 1.0 替換 0.6 + 0.4,這也被稱為常數(shù)折疊
確定用于中間結(jié)果的數(shù)據(jù)類型
	其代碼流程介于 parser 和 memo 構(gòu)建之間,將 parser 輸出的 AST 中的對象進行語義解析,語義解析的輸出作為 memo 構(gòu)建的輸入。 
	接下來,將重點介紹查詢語句的語義解析流程: 
Source and target analysis (目標(biāo)解析)
Permission check (權(quán)限校驗)
Semanticdecomposition & validation (表達式拆分及其語義解析)
	 
 ?
1. 目標(biāo)解析及權(quán)限校驗 
1)接口路徑: 
	buildStmt() -> buildSelectStmtWithoutParent() -> buildSelectClause() -> builtFrom() -> buildDataSource() 
2)核心接口為:
	 
 ?
	ResolveDataSource 通過 object name 解析出對象描述符(元數(shù)據(jù)),Privilege check 使用 current username 來校驗當(dāng)前用戶對該對象是否有相應(yīng)權(quán)限。 
	在完成目標(biāo)解析和權(quán)限校驗后,會為 select stmt 中的 from clause 構(gòu)建 memo 表達式。這個行為看似不是語義解析應(yīng)該做的,出現(xiàn)在這里的原因是 KaiwuDB 的語義解析和部分邏輯計劃優(yōu)化是相互融合的。 
2. 表達式拆分及其語義解析 
1)接口路徑:
	 buildStmt() -> buildSelectStmtWithoutParent() -> buildSelectClause() 
	KaiwuDB 將 select stmt 中的各個部分拆分為表達式,并對其進行標(biāo)量表達式的語義解析,從而完成 scalarExpr 的構(gòu)建。例如:
	 
 ?
2)標(biāo)量表達式語義解析: 
ROLE:檢查表達式是否合法,為其做一些初步的優(yōu)化,為其賦予類型。
INTERFACE: 
	in : Expr 
	out : TypedExpr 
	實質(zhì)上是檢查并賦予類型 + 簡化表達式 
	AnalyzeExpr() 
HOW:   
	i. Name Resolution   
	ii. TypeCheck   
	iii. Normalize Expr 
	這些子任務(wù)實現(xiàn)幾乎是純粹的函數(shù),唯一的缺陷是, TypeCheck 將 SQL 占位符($1、$2 等)的類型以一種對順序敏感的方式,輸出到通過遞歸傳遞的語義環(huán)境對象上。 
注意:可以使用 EXPLAIN(EXPRS, TYPES) 來檢查表達式,而不進行解構(gòu)和簡化。 
i. Name Resolution 
 ? 
 ?
	參數(shù) sources 和 IndexedVars,如果都不是 nil,則表示 resolveNames 應(yīng)該被執(zhí)行。IndexedVars map 將被填充并且作為結(jié)果返回。
用 parser.IndexedVar 實例替換列名
用 parser.FuncDef 引用替換函數(shù)名
	ii. TypeCheck 
	parser.TypeCheck() / parser.TypeCheckAndRequire():
常數(shù)折疊
類型推斷
類型檢查
在 ComparisonExpr 節(jié)點上記憶比較器函數(shù)
用其類型來注釋表達式和占位符
	實現(xiàn) Expr 接口的表達式有很多:AndExpr, OrExpr, CastExpr, CaseExpr 等。 
	每個表達式都實現(xiàn)了 TypeCheck 接口,在被調(diào)用時返回結(jié)果表達式的類型,包括bool, string, int 等。 
iii. Normalize  parser.NormalizeExpr(): 
注意:此處的 normalize 有點不太準(zhǔn)確,因為他并沒有進行標(biāo)準(zhǔn)的 normalize,這里只是將除變量名以外的東西都放到比較符號的右側(cè),從而達到簡化的目的。 
	Normalize Example:
(a+1) < 3 is transformed to a < 2
-(a - b) is transformed to (b - a)
a between c and d is transformed to a >= c and a <= d
	 
 ?
	Normalize 的實現(xiàn)主要依靠 WalkExpr 函數(shù)。WalkExpr 會橫穿 Expr,其通過傳入對應(yīng)的 visitor 來定義 WalkExpr 的具體行為,前面講到的 name resolution 也是通過傳入 name resolution visitor 實現(xiàn)的。 
	
	審核編輯:劉清
- 
                                比較器
                                +關(guān)注
關(guān)注
14文章
1878瀏覽量
111175 - 
                                SQL
                                +關(guān)注
關(guān)注
1文章
789瀏覽量
46200 - 
                                DDL
                                +關(guān)注
關(guān)注
0文章
13瀏覽量
6524 - 
                                AST
                                +關(guān)注
關(guān)注
0文章
7瀏覽量
2438 
原文標(biāo)題:一文走進SQL編譯-語義解析
文章出處:【微信號:OSC開源社區(qū),微信公眾號:OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
一文讀懂SQL Server和MySQL的區(qū)別
解析編譯原理
    
一文詳解SQL解析與應(yīng)用
    
一文帶你了解安全測試基礎(chǔ)之SQL注入
嵌入式SQL語句
    
          
        
        
一文走進SQL編譯-語義解析
                
 
    
    
    
           
            
            
                
            
評論