站長(zhǎng)資訊網(wǎng)
        最全最豐富的資訊網(wǎng)站

        詳細(xì)解析java詞法分析器DDL遞歸應(yīng)用

        本篇文章給大家?guī)?lái)了關(guān)于java的相關(guān)知識(shí),主要介紹了java詞法分析器DDL遞歸應(yīng)用詳解,有需要的朋友可以借鑒參考下,下面一起來(lái)看一下,希望對(duì)大家有幫助。

        詳細(xì)解析java詞法分析器DDL遞歸應(yīng)用

        推薦學(xué)習(xí):《java視頻教程》

        intellij plugin

        既然沒(méi)有現(xiàn)成的工具那就自己寫一個(gè)吧

        考慮到我們主要是用PyCharm開發(fā),正好jetbrains也提供了SDK用于開發(fā)插件,所以UI層面可以不用額外考慮了。

        使用流程很簡(jiǎn)單,只需要導(dǎo)入DDL語(yǔ)句就可以生成Python所需要的Model代碼。

        例如導(dǎo)入以下 DDL:

        CREATE TABLE `user` (   `id` int(11) NOT NULL AUTO_INCREMENT,   `userName` varchar(20) DEFAULT NULL COMMENT '用戶名',   `password` varchar(100) DEFAULT NULL COMMENT '密碼',   `roleId` int(11) DEFAULT NULL COMMENT '角色I(xiàn)D',   PRIMARY KEY (`id`),   ) ENGINE=InnoDB AUTO_INCREMENT=7 DEFAULT CHARSET=utf8

        便會(huì)生成對(duì)應(yīng)的 Python 代碼:

        class User(db.Model):     __tablename__ = 'user'     id = db.Column(db.Integer, primary_key=True, autoincrement=True)     userName = db.Column(db.String)  # 用戶名     password = db.Column(db.String)  # 密碼     roleId = db.Column(db.Integer)  # 角色I(xiàn)D

        詞法解析

        仔細(xì)對(duì)比源文件及目標(biāo)代碼會(huì)很容易找出規(guī)律,無(wú)非就是解析出表名、字段、及字段的屬性(是否為主鍵、類型、長(zhǎng)度),最后再轉(zhuǎn)換為Python所需要的模板即可。

        在我動(dòng)手之前我認(rèn)為是非常簡(jiǎn)單的,無(wú)非就是解析字符串,但實(shí)際上手后發(fā)現(xiàn)不是那么回事;主要是有以下幾個(gè)問(wèn)題:

        • 如何識(shí)別出表名稱?
        • 同樣的如何識(shí)別出字段名稱,同時(shí)還得關(guān)聯(lián)上該字段的類型、長(zhǎng)度、注釋。
        • 如何識(shí)別出主鍵?

        總結(jié)一句話,如何通過(guò)一系列規(guī)則識(shí)別出一段字符串中的關(guān)鍵信息,這同樣也是 MySQL Server 所做的事情。

        在開始真正解析 DDL 之前,先來(lái)看下一段簡(jiǎn)單的腳本如何解析:

        x = 20

        按照我們平時(shí)開發(fā)的經(jīng)驗(yàn),這條語(yǔ)句分為以下幾部分:

        • x表示變量
        • =表示賦值符號(hào)
        • 20表示賦值結(jié)果

        所以我們對(duì)這段腳本的解析結(jié)果應(yīng)當(dāng)為:

        VAR x

        GE =

        VAL 100

        這個(gè)解析過(guò)程在編譯原理中稱為”詞法解析“,可能大家聽到編譯原理這幾個(gè)字就頭大(我也是);對(duì)于剛才那段腳本我們可以編寫一個(gè)非常簡(jiǎn)單的詞法解析器生成這樣的結(jié)果。

        狀態(tài)遷移

        再開始之前先捋一下思路,可以看到上文的結(jié)果中通過(guò)VAR表示變量、GE表示賦值符號(hào) ”=“、VAL表示賦值結(jié)果,現(xiàn)在需要重點(diǎn)記住這三個(gè)狀態(tài)。

        在依次讀取字符解析時(shí),程序就是在這幾個(gè)狀態(tài)中來(lái)回切換,如下圖:

        詳細(xì)解析java詞法分析器DDL遞歸應(yīng)用

        • 默認(rèn)為初始狀態(tài)。
        • 當(dāng)字符為字母時(shí)進(jìn)入VAR狀態(tài)。
        • 當(dāng)字符為 ”=“ 符號(hào)時(shí)進(jìn)入GE狀態(tài)。

        詳細(xì)解析java詞法分析器DDL遞歸應(yīng)用

        同理,當(dāng)不滿足這幾個(gè)狀態(tài)時(shí)候又會(huì)回到初始從而再次確認(rèn)新的狀態(tài)。

        光看圖有點(diǎn)抽象,直接來(lái)看核心代碼:

        public class Result{     public TokenType tokenType ;     public StringBuilder text = new StringBuilder(); }

        首先定義了一個(gè)結(jié)果類,收集最終的解析結(jié)果;其中的TokenType就對(duì)應(yīng)了圖中的三種狀態(tài),簡(jiǎn)單的用枚舉值來(lái)表示。

        public enum TokenType {     INIT,     VAR,     GE,     VAL }

        首先對(duì)應(yīng)到第一張圖:初始化狀態(tài)。

        需要對(duì)當(dāng)前解析的字符定義一個(gè)TokenType

        詳細(xì)解析java詞法分析器DDL遞歸應(yīng)用

        和圖中描述的流程一致,判斷當(dāng)前字符給定一個(gè)狀態(tài)即可。

        接著對(duì)應(yīng)到第二張圖:狀態(tài)之間的轉(zhuǎn)換。

        詳細(xì)解析java詞法分析器DDL遞歸應(yīng)用

        會(huì)根據(jù)不同的狀態(tài)進(jìn)入不同的case,在不同的case中判斷是否應(yīng)當(dāng)跳轉(zhuǎn)到其他狀態(tài)(進(jìn)入INIT狀態(tài)后會(huì)重新生成狀態(tài))。

        舉個(gè)例子:x = 20:

        首選會(huì)進(jìn)入VAR狀態(tài),接著下一個(gè)字符為空格,自然在 38 行中重新進(jìn)入初始狀態(tài),導(dǎo)致再次確定下一個(gè)字符=進(jìn)入GE狀態(tài)。

        當(dāng)腳本為ab = 30:
        第一個(gè)字符為 a 也是進(jìn)入VAR狀態(tài),第二個(gè)字符為 b,依然為字母,所以進(jìn)入 36 行,狀態(tài)不會(huì)改變,同時(shí)將 b 這個(gè)字符追加進(jìn)來(lái);后續(xù)步驟就和上一個(gè)例子一致了。

        多說(shuō)無(wú)益,建議大家自己跑一下單測(cè)就會(huì)明白:

        詳細(xì)解析java詞法分析器DDL遞歸應(yīng)用

        詳細(xì)解析java詞法分析器DDL遞歸應(yīng)用

        DDL 解析

        簡(jiǎn)單的解析完成后來(lái)看看DDL這樣的腳本應(yīng)當(dāng)如何解析:

        CREATE TABLE `user` (   `id` int(11) NOT NULL AUTO_INCREMENT,   `userName` varchar(20) DEFAULT NULL COMMENT '用戶名',   `password` varchar(100) DEFAULT NULL COMMENT '密碼',   `roleId` int(11) DEFAULT NULL COMMENT '角色I(xiàn)D',   PRIMARY KEY (`id`),   ) ENGINE=InnoDB AUTO_INCREMENT=7 DEFAULT CHARSET=utf8

        原理類似,首先還是要看出規(guī)律(也就是語(yǔ)法):

        • 表名是第一行語(yǔ)句,同時(shí)以CREATE TABLE開頭。
        • 每一個(gè)字段的信息(名稱、類型、長(zhǎng)度、備注)都是以 “`” 符號(hào)開頭 “,” 結(jié)尾。
        • 主鍵是以 PRIMART 字符串開頭的字段,以)結(jié)尾。

        根據(jù)我們需要解析的數(shù)據(jù)種類,我這里定義了這個(gè)枚舉:

        詳細(xì)解析java詞法分析器DDL遞歸應(yīng)用

        然后在初始化類型時(shí)進(jìn)行判斷賦值:

        詳細(xì)解析java詞法分析器DDL遞歸應(yīng)用

        由于需要解析的數(shù)據(jù)不少,所以這里的判斷條件自然也就多了。

        遞歸解析

        針對(duì)于DDL的語(yǔ)法規(guī)則,我們這里還有需要有特殊處理的地方;比如解析具體字段信息時(shí)如何關(guān)聯(lián)起來(lái)?

        舉個(gè)例子:

        `userName` varchar(20) DEFAULT NULL COMMENT '用戶名', `password` varchar(100) DEFAULT NULL COMMENT '密碼',

        這里我們解析出來(lái)的數(shù)據(jù)得有一個(gè)映射關(guān)系:

        詳細(xì)解析java詞法分析器DDL遞歸應(yīng)用

        所以我們只能一個(gè)字段的全部信息解析完成并且關(guān)聯(lián)好之后才能解析下一個(gè)字段。

        于是這里我采用了遞歸的方式進(jìn)行解析(不一定是最好的,歡迎大家提出更優(yōu)的方案)。

        } else if (value == '`' && pStatus == Status.BASE_INIT) {     result.tokenType = DDLTokenType.FI;     result.text.append(value); }

        當(dāng)當(dāng)前字符為 ”`“ 符號(hào)時(shí),將狀態(tài)置為 “FI”(FieldInfo),同時(shí)當(dāng)解析到為 “,” 符號(hào)時(shí)便進(jìn)入遞歸處理。

        詳細(xì)解析java詞法分析器DDL遞歸應(yīng)用

        可以理解為將這一段字符串單獨(dú)提取出來(lái)處理:

        `userName` varchar(20) DEFAULT NULL COMMENT '用戶名',

        接著再將這段字符遞歸調(diào)用當(dāng)前方法再次進(jìn)行解析,這時(shí)便按照字段名稱、類型、長(zhǎng)度、注釋的規(guī)則解析即可。

        同時(shí)既然存在遞歸,還需要將子遞歸的數(shù)據(jù)關(guān)聯(lián)起來(lái),所以我在返回結(jié)果中新增了一個(gè)pid的字段,這個(gè)也容易理解。

        默認(rèn)值為 0,一旦遞歸后便自增 +1,保證每次遞歸的數(shù)據(jù)都是唯一的。

        用同樣的方法在解析主鍵時(shí)也是先將整個(gè)字符串提取出來(lái):

        PRIMARY KEY (`id`)

        只不過(guò)是 “P” 打頭 “)” 結(jié)尾。

        } else if (value == 'P' && pStatus == Status.BASE_INIT) {     result.tokenType = DDLTokenType.P_K;     result.text.append(value); }

        詳細(xì)解析java詞法分析器DDL遞歸應(yīng)用

        也是將整段字符串遞歸解析,再遞歸的過(guò)程中進(jìn)行狀態(tài)切換P_K ---> P_K_V最終獲取到主鍵。

        詳細(xì)解析java詞法分析器DDL遞歸應(yīng)用

        所以通過(guò)對(duì)剛才那段DDL解析得到的結(jié)果如下:

        詳細(xì)解析java詞法分析器DDL遞歸應(yīng)用

        這樣每個(gè)字段也通過(guò)了pid進(jìn)行了區(qū)分關(guān)聯(lián)。

        所以現(xiàn)在只需要對(duì)這個(gè)詞法解析器進(jìn)行封裝,便可以提供一個(gè)簡(jiǎn)單的API來(lái)獲取表中的數(shù)據(jù)了。

        詳細(xì)解析java詞法分析器DDL遞歸應(yīng)用

        推薦學(xué)習(xí):《java視頻教程》

        贊(0)
        分享到: 更多 (0)
        網(wǎng)站地圖   滬ICP備18035694號(hào)-2    滬公網(wǎng)安備31011702889846號(hào)
        主站蜘蛛池模板: 亚洲无线观看国产精品| 精品国产一区二区三区免费| 2022国内精品免费福利视频 | 国产精品污视频| 亚洲欧美日韩国产精品一区二区| 四虎最新永久在线精品免费| 国产精品视频一区二区三区四| 亚洲国产精品无码久久久蜜芽| 久久成人精品| 国产精品自在在线午夜福利 | 久久国产精品无码网站| mm1313亚洲国产精品无码试看| 欧美精品一本久久男人的天堂| 国产精品久久久久9999| 国产精品人成在线播放新网站 | 国产精品嫩草影院AV| 无码国内精品久久人妻| 亚洲精品无码久久久| 西瓜精品国产自在现线| 无码精品第一页| 亚洲精品第一国产综合精品99| 男女男精品视频网站在线观看| 国产中文在线亚洲精品官网| 国产精品免费大片一区二区| 成人国内精品久久久久影院VR| 午夜精品成年片色多多| 国产精品一区二区不卡| 久久亚洲国产午夜精品理论片 | 国产精品无码无在线观看| 亚洲精品自在在线观看| 无码精品人妻一区二区三区影院| 久久久久国产成人精品亚洲午夜| 国产午夜精品一区二区三区小说 | 97精品国产97久久久久久免费| 青青草国产精品久久| 青青草国产精品| 国产成人精品视频2021| 国产精品免费观看视频| 国产一区二区三精品久久久无广告| 国精品无码A区一区二区| 女人高潮内射99精品|