手把手教你实现一门运行在 JVM 上的语言 Enkel, 系列 9
/ / 点击 / 阅读耗时 7 分钟本文系 Creating JVM language 翻译的第 9 篇。
原文中的代码和原文有不一致的地方均在新的代码仓库中更正过,建议参考新的代码仓库。
源码
1. 语法规则改动
我们新建一个规则 “returnStatement”。
那为什么不叫 “returnExpression” 呢?毕竟表达式总是返回值的,语句没有返回值么?
这听起来有点绕口,但是返回值并不总是返回一个值。在 Java 中,代码 int x = return 5;
没有意义, 在 Enkel 中也是如此。换句话说,表达式总可以给一个变量赋值。这就是为什么返回是语句,而不是表达式。
1 | statement : variableDeclaration |
返回语句有两种形式:
- RETURNVOID - 用在没有返回值的方法中。return 关键字是必须的,后面不需要表达式
- RETURNWITHVALUE - 用在有返回值的方法中。return 关键字不是必须的,但是需要一个表达式
因此,方法可以显示或者隐士的返回一个值:
1 | SomeClass { |
上述代码经过解析后,AST 图形展示如下:
我们可以看到,AST 中并没有处理 fun2 中的隐士返回值。这是因为方法是空的语句块,匹配空的语句块作为返回值并不是一个好的想法。因此,确实的返回语句会在字节码生成阶段手动添加。
2. 匹配 Antlr 上下文对象
经过解析后,返回语句从 antlr 的上下文对象转换成 POJO 类 ReturnStatement
。这一步的目的是仅匹配字节码生成需要的数据,而不是直接从 antlr 生成的对象中取数据,这样会让代码看起来很丑陋。
1 | public class StatementVisitor extends EnkelBaseVisitor<Statement> { |
3. 检测隐士空返回
假设方法中包含有隐士返回,在解析阶段是不会生成返回语句的,这就是为什么我们需要检测这种情景,并且在字节码生成阶段手动添加返回语句。
1 | public class MethodGenerator { |
上述方法检测方法最后的语句是不是返回语句,如果不是就添加返回指令。
4. 生成字节码
1 | public class StatementGenerator { |
因此,return 5
会经过如下阶段:
- 从返回语句中获得表达式(这里是5,类型是值)
- 生成 5 对应的字节码。(expression.accept(expressionGenerator) 调用 ExpressionGenerator.generate(Value value))
- 字节码生成阶段,会生成一个新的值 5 并压入操作数栈
- IRETURN 指令将操作数栈栈顶数据出栈,并返回
字节码表示:1
2bipush 5
ireturn
5. 示例
假设我们又如下 Enkel 代码:1
2
3
4
5
6
7
8
9
10SumCalculator {
void main(string[] args) {
print sum(5,2)
}
int sum (int x ,int y) {
x+y
}
}
生成的字节码如下:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18$ javap -c SumCalculator
public class SumCalculator {
public static void main(java.lang.String[]);
Code:
0: getstatic #12 //get static field java/lang/System.out:Ljava/io/PrintStream;
3: bipush 5
5: bipush 2
7: invokestatic #16 // call method sum (with the values on operand stack 5,2)
10: invokevirtual #21 // call method println (with the value on stack - the result of method sum)
13: return //return
public static int sum(int, int);
Code:
0: iload_0
1: iload_1
2: iadd
3: ireturn //return the value from operand stack (result of iadd)
}