本文系 Creating JVM language 翻译的第 18 篇。
原文中的代码和原文有不一致的地方均在新的代码仓库中更正过,建议参考新的代码仓库。

源码

Github

语法

语法规则和 Java 非常类似,但是更加简单,没有复杂的修饰符(比如 static, volatile, transient)。

1
2
3
4
5
6
7
8
9
Fields {

int field

start {
field = 5
print field
}
}

语法规则更改

在本篇之前我们只能在类中定义方法,现在我们开启定义字段的大门吧:

1
2
classBody :  field* function* ;
field : type name;

赋值语句:

1
assignment : name EQUALS expression;

为何这么久都没实现赋值语句

字段用来赋值,但是这么久以来我们一直没有实现赋值语句来给声明的变量赋值,我这么做是因为有以下考量。

我希望变量是不可变的,赋值意味着改变状态,这会导致许多问题,比如同步,副作用,还有内存泄漏。

比如有如下的 Java 代码:

1
2
3
4
5
Stuff trustMeIWontModifyYourArg(SomeObject arg) {
... 999 lines of code
arg = null; //or some other nasty hidden stuff
...another 999 lines of code
}

通过方法签名,我们可能理所当然的想,方法会修改参数吗,他没有 final 修饰,但是大多数 Java 程序员会忽略。仅仅通过名字判断出来方法不会修改变量,那我们就用他吧。

过了两个小时后,出现了 NullPointerException,方法还是修改了参数。

如果方法没有副作用,那么可以很方便的实现并发而不用担心同步的问题,这种方法没有状态,也没有副作用,实现避免副作用方法最简单的办法就是尽可能的使用常量。

生成字节码

声明字段

使用 ASM 的 visitField 来声明字段。它添加字段到 fields[],fields_count 会自动增加计数器。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
public class FieldGenerator {

private final ClassWriter classWriter;

public FieldGenerator(ClassWriter classWriter) {
this.classWriter = classWriter;
}

public void generate(Field field) {
String name = field.getName();
String descriptor = field.getType().getDescriptor();
FieldVisitor fieldVisitor = classWriter.visitField(Opcodes.ACC_PUBLIC, name,descriptor, null, null);
fieldVisitor.visitEnd();
}
}

读取字段

读取字段,你需要:

  • 字段名
  • 字段类型修饰符
  • 持有者的全限定名
1
2
3
4
5
6
7
8
9
10
11
12
13
public class ReferenceExpressionGenerator {

//constructor and fields

public void generate(FieldReference fieldReference) {
String varName = fieldReference.geName();
Type type = fieldReference.getType();
String ownerInternalName = fieldReference.getOwnerInternalName();
String descriptor = type.getDescriptor();
methodVisitor.visitVarInsn(Opcodes.ALOAD,0);
methodVisitor.visitFieldInsn(Opcodes.GETFIELD, ownerInternalName,varName,descriptor);
}
}
  • ALOAD, 0 获得 this ,也就是局部变量索引值为 0 的值。在 非 static 语境中,this 默认都会在索引为 0 的位置。
  • GETFIELD 读取变量的指令

赋值

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
public class AssignmentStatementGenerator {

//constructor and fields

public void generate(Assignment assignment) {
String varName = assignment.getVarName();
Expression expression = assignment.getExpression();
Type type = expression.getType();
if(scope.isLocalVariableExists(varName)) {
int index = scope.getLocalVariableIndex(varName);
methodVisitor.visitVarInsn(type.getStoreVariableOpcode(), index);
return;
}
Field field = scope.getField(varName);
String descriptor = field.getType().getDescriptor();
methodVisitor.visitVarInsn(Opcodes.ALOAD,0);
expression.accept(expressionGenerator);
methodVisitor.visitFieldInsn(Opcodes.PUTFIELD,field.getOwnerInternalName(),field.getName(),descriptor);
}

如果局部变量和字段名字冲突了,那么局部变量有更高的优先级。

PUTFIELD 和 GETFIELD 相似,但是会出栈顶数据,表达式的值会被赋值到变量

示例

如下 Enkel 文件

1
2
3
4
5
6
7
8
9
Fields {

int field

start {
field = 5
print field
}
}

生成字节码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
public class Fields {
public int field;

public void start();
Code:
0: aload_0 //get "this"
1: ldc #9 // load constant "5" from constant pool
3: putfield #11 // Field field:I - pop 5 off the stack and write to field
6: getstatic #17 // Field java/lang/System.out:Ljava/io/PrintStream;
9: aload_0 //get "this" reference
10: getfield #11 // Field field:I
13: invokevirtual #22 // Method "Ljava/io/PrintStream;".println:(I)V
16: return

//autogenerated constructor and main method
}