這里先展示了程序的幫助信息,然后是幾個簡單的四則運算測試,看起來是沒問題了(我可不敢保證,程序沒有bug!)。
這個格式化的 JSON 信息太長了,不利于直接看到。我們將它渲染出來看最后生成的樹形圖(方法見前兩個博客)。保存下面這個 JSON 在一個文件中,這里我叫做 demo.json,然后執(zhí)行如下命令:pytm-cli -d LR -i demo.json -o demo.html
,然后再瀏覽器打開生成的 html 文件。
立即學習“Python免費學習筆記(深入)”;
所有的代碼都在這里了,只需要一個文件 my_eval.py
,想要運行的話,復制、粘貼,然后按照演示的步驟執(zhí)行即可。
Node、BinOp、Constan 是用來表示節(jié)點的類.
Calculator 中 lexizer 方法是進行分詞的,本來我是打算使用正則的,如果你看過我前面的博客的話,可以發(fā)現(xiàn)我是用的正則來分詞的(因為 Python 的官方文檔正則表達式中有一個簡易的分詞程序)。不過我看其他人都是手寫的分詞,所以我也這樣做了,不過感覺并不是很好,很繁瑣,而且容易出錯。
parse 方法是進行解析的,主要是解析表達式的結構,判斷是否符合四則運算的文法,最終生成表達式樹(它的 AST)。
""" Grammar G -> E E -> T E' E' -> '+' T E' | '-' T E' | ? T -> F T' T' -> '*' F T' | '/' F T' | ? F -> '(' E ')' | num | name """ import json import argparse class Node: """ 簡單的抽象語法樹節(jié)點,定義一些需要使用到的具有層次結構的節(jié)點 """ def eval(self) -> float: ... # 節(jié)點的計算方法 def visit(self): ... # 節(jié)點的訪問方法 class BinOp(Node): """ BinOp Node """ def __init__(self, left, op, right) -> None: self.left = left self.op = op self.right = right def eval(self) -> float: if self.op == "+": return self.left.eval() + self.right.eval() if self.op == "-": return self.left.eval() - self.right.eval() if self.op == "*": return self.left.eval() * self.right.eval() if self.op == "/": return self.left.eval() / self.right.eval() return 0 def visit(self): """ 遍歷樹的各個節(jié)點,并生成 JSON 表示 """ return { "name": "BinOp", "children": [ self.left.visit(), { "name": "OP", "children": [ { "name": self.op } ] }, self.right.visit() ] } class Constant(Node): """ Constant Node """ def __init__(self, value) -> None: self.value = value def eval(self) -> float: return self.value def visit(self): return { "name": "NUMBER", "children": [ { "name": str(self.value) # 轉成字符是因為渲染成圖像時,需要該字段為 str } ] } class Calculator: """ Simple Expression Parser """ def __init__(self, expr) -> None: self.expr = expr # 輸入的表達式 self.parse_end = False # 解析是否結束,默認未結束 self.toks = [] # 解析的 tokens self.index = 0 # 解析的下標 def lexizer(self): """ 分詞 """ index = 0 while index < len(self.expr): ch = self.expr[index] if ch in [" ", "\r", "\n"]: index += 1 continue if '0' <= ch <= '9': num_str = ch index += 1 while index < len(self.expr): n = self.expr[index] if '0' <= n <= '9': if ch == '0': raise Exception("Invalid number!") num_str = n index += 1 continue break self.toks.append({ "kind": "INT", "value": int(num_str) }) elif ch in ['+', '-', '*', '/', '(', ')']: self.toks.append({ "kind": ch, "value": ch }) index += 1 else: raise Exception("Unkonwn character!") def get_token(self): """ 獲取當前位置的 token """ if 0 <= self.index < len(self.toks): tok = self.toks[self.index] return tok if self.index == len(self.toks): # token解析結束 return { "kind": "EOF", "value": "EOF" } raise Exception("Encounter Error, invalid index = ", self.index) def move_token(self): """ 下標向后移動一位 """ self.index += 1 def parse(self) -> Node: """ G -> E """ # 分詞 self.lexizer() # 解析 expr_tree = self.parse_expr() if self.parse_end: return expr_tree else: raise Exception("Invalid expression!") def parse_expr(self): """ E -> T E' E' -> + T E' | - T E' | ? """ # E -> E E' left = self.parse_term() # E' -> + T E' | - T E' | ? while True: tok = self.get_token() kind = tok["kind"] value = tok["value"] if tok["kind"] == "EOF": # 解析結束的標志 self.parse_end = True break if kind in ["+", "-"]: self.move_token() left = BinOp(left, value, self.parse_term()) else: break return left def parse_term(self): """ T -> F T' T' -> * F T' | / F T' | ? """ # T -> F T' left = self.parse_factor() # T' -> * F T' | / F T' | ? while True: tok = self.get_token() kind = tok["kind"] value = tok["value"] if kind in ["*", "/"]: self.move_token() right = self.parse_factor() left = BinOp(left, value, right) else: break return left def parse_factor(self): """ F -> '(' E ')' | num | name """ tok = self.get_token() kind = tok["kind"] value = tok["value"] if kind == '(': self.move_token() expr_node = self.parse_expr() if self.get_token()["kind"] != ")": raise Exception("Encounter Error, expected )!") self.move_token() return expr_node if kind == "INT": self.move_token() return Constant(value=value) raise Exception("Encounter Error, unknown factor: ", kind) if __name__ == "__main__": # 添加命令行參數(shù)解析器 cmd_parser = argparse.ArgumentParser( description="Simple Expression Interpreter!") group = cmd_parser.add_mutually_exclusive_group() group.add_argument("--tokens", help="print tokens", action="store_true") group.add_argument("--ast", help="print ast in JSON", action="store_true") cmd_parser.add_argument( "expr", help="expression, contains ['+', '-', '*', '/', '(', ')', 'num']") args = cmd_parser.parse_args() calculator = Calculator(expr=args.expr) tree = calculator.parse() if args.tokens: # 輸出 tokens for t in calculator.toks: print(f"{t['kind']:3s} ==> {t['value']}") elif args.ast: # 輸出 JSON 表示的 AST print(json.dumps(tree.visit(), indent=4)) else: # 計算結果 print(tree.eval())
本來想在前面說一下為什么叫 my_eval.py
,但是感覺看到后面的人不多,那就在這里說好了。如果寫了一個復雜的表達式,那么怎么驗證是否正確的。這里我們直接利用 Python 這個最完美的解釋器就好了,哈哈。這里用 Python 的 eval 函數(shù),你當然是不需要調用這個函數(shù),直接復制計算的表達式即可。我用 eval 函數(shù),只是想表達為什么我的程序會叫 my_eval
這個名字。
這樣實現(xiàn)下來,也算是完成了一個簡單的四則運算解釋器了。不過,如果你也做一遍的話,也估計會和我一樣感覺到整個過程很繁瑣。因為分詞和語法解析都有現(xiàn)成的工具可以來完成,而且不容易出錯,可以大大減少工作量。不過,自己來一遍也是很有必要的,在使用工具之前,至少也要了解工具的作用。
以上就是使用Python實現(xiàn)一個簡單的四則運算解釋器的詳細內容,更多請關注php中文網(wǎng)其它相關文章!
python怎么學習?python怎么入門?python在哪學?python怎么學才快?不用擔心,這里為大家提供了python速學教程(入門到精通),有需要的小伙伴保存下載就能學習啦!
Copyright 2014-2025 http://ipnx.cn/ All Rights Reserved | php.cn | 湘ICP備2023035733號