本文系 Creating JVM language 翻译的第 9 篇。
原文中的代码和原文有不一致的地方均在新的代码仓库中更正过,建议参考新的代码仓库。

源码

Github

1. 语法规则改动

我们新建一个规则 “returnStatement”。
那为什么不叫 “returnExpression” 呢?毕竟表达式总是返回值的,语句没有返回值么?
这听起来有点绕口,但是返回值并不总是返回一个值。在 Java 中,代码 int x = return 5; 没有意义, 在 Enkel 中也是如此。换句话说,表达式总可以给一个变量赋值。这就是为什么返回是语句,而不是表达式。

1
2
3
4
5
6
7
8
statement : variableDeclaration
//other statements rules
| returnStatement ;

variableDeclaration : VARIABLE name EQUALS expression;
printStatement : PRINT expression ;
returnStatement : 'return' #RETURNVOID
| ('return')? expression #RETURNWITHVALUE;

返回语句有两种形式:

  • RETURNVOID - 用在没有返回值的方法中。return 关键字是必须的,后面不需要表达式
  • RETURNWITHVALUE - 用在有返回值的方法中。return 关键字不是必须的,但是需要一个表达式

因此,方法可以显示或者隐士的返回一个值:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
SomeClass {
fun1 {
return //explicitly return from void method
}

fun2 {
//implicitly return from void method
}

int fun2 {
return 1 //explicitly return "1" from int method
}

int fun3 {
1 //implicitly return "1" from int method
}
}

上述代码经过解析后,AST 图形展示如下:

我们可以看到,AST 中并没有处理 fun2 中的隐士返回值。这是因为方法是空的语句块,匹配空的语句块作为返回值并不是一个好的想法。因此,确实的返回语句会在字节码生成阶段手动添加。

2. 匹配 Antlr 上下文对象

经过解析后,返回语句从 antlr 的上下文对象转换成 POJO 类 ReturnStatement 。这一步的目的是仅匹配字节码生成需要的数据,而不是直接从 antlr 生成的对象中取数据,这样会让代码看起来很丑陋。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
public class StatementVisitor extends EnkelBaseVisitor<Statement> {

//other stuff

@Override
public Statement visitRETURNVOID(@NotNull EnkelParser.RETURNVOIDContext ctx) {
return new ReturnStatement(new EmptyExpression(BultInType.VOID));
}

@Override
public Statement visitRETURNWITHVALUE(@NotNull EnkelParser.RETURNWITHVALUEContext ctx) {
Expression expression = ctx.expression().accept(expressionVisitor);
return new ReturnStatement(expression);
}
}

3. 检测隐士空返回

假设方法中包含有隐士返回,在解析阶段是不会生成返回语句的,这就是为什么我们需要检测这种情景,并且在字节码生成阶段手动添加返回语句。

1
2
3
4
5
6
7
8
9
10
11
12
public class MethodGenerator {
//other stuff
private void appendReturnIfNotExists(Function function, Block block,StatementGenerator statementScopeGenrator) {
Statement lastStatement = block.getStatements().get(block.getStatements().size() - 1);
boolean isLastStatementReturn = lastStatement instanceof ReturnStatement;
if(!isLastStatementReturn) {
EmptyExpression emptyExpression = new EmptyExpression(function.getReturnType());
ReturnStatement returnStatement = new ReturnStatement(emptyExpression);
returnStatement.accept(statementScopeGenrator);
}
}
}

上述方法检测方法最后的语句是不是返回语句,如果不是就添加返回指令。

4. 生成字节码

1
2
3
4
5
6
7
8
9
10
11
12
13
public class StatementGenerator {
//oher stuff
public void generate(ReturnStatement returnStatement) {
Expression expression = returnStatement.getExpression();
Type type = expression.getType();
expression.accept(expressionGenrator); //generate bytecode for expression itself (puts the value of expression onto the stack)
if(type == BultInType.VOID) {
methodVisitor.visitInsn(Opcodes.RETURN);
} else if (type == BultInType.INT) {
methodVisitor.visitInsn(Opcodes.IRETURN);
}
}
}

因此,return 5 会经过如下阶段:

  • 从返回语句中获得表达式(这里是5,类型是值)
  • 生成 5 对应的字节码。(expression.accept(expressionGenerator) 调用 ExpressionGenerator.generate(Value value))
  • 字节码生成阶段,会生成一个新的值 5 并压入操作数栈
  • IRETURN 指令将操作数栈栈顶数据出栈,并返回

字节码表示:

1
2
bipush        5
ireturn

5. 示例

假设我们又如下 Enkel 代码:

1
2
3
4
5
6
7
8
9
10
SumCalculator {

void main(string[] args) {
print sum(5,2)
}

int sum (int x ,int y) {
x+y
}
}

生成的字节码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
$ javap -c  SumCalculator
public class SumCalculator {
public static void main(java.lang.String[]);
Code:
0: getstatic #12 //get static field java/lang/System.out:Ljava/io/PrintStream;
3: bipush 5
5: bipush 2
7: invokestatic #16 // call method sum (with the values on operand stack 5,2)
10: invokevirtual #21 // call method println (with the value on stack - the result of method sum)
13: return //return

public static int sum(int, int);
Code:
0: iload_0
1: iload_1
2: iadd
3: ireturn //return the value from operand stack (result of iadd)
}