WEB开发网
开发学院WEB开发Jsp Java虚拟机的研究与实现 阅读

Java虚拟机的研究与实现

 2008-01-05 09:27:19 来源:WEB开发网   
核心提示:摘 要 本文在研究kaffe的基础上,吸收kaffe虚拟机的主要思想,Java虚拟机的研究与实现,用C语言作为开发语言,采用了及时编译器作为执行引擎,然后把结果压回操作数栈,而操作数栈区,实现了一种Windows平台下的java虚拟机,然后对实现过程中的一些要害技术如class文件验证、及时编译器、垃圾收集器、线程同步
摘 要 本文在研究kaffe的基础上,吸收kaffe虚拟机的主要思想,用C语言作为开发语言,采用了及时编译器作为执行引擎,实现了一种Windows平台下的java虚拟机。然后对实现过程中的一些要害技术如class文件验证、及时编译器、垃圾收集器、线程同步和线程调度等做了分析。

  要害词 kaffe; C语言; 及时编译器;Java虚拟机

  引言

  Java虚拟机本质是就是一个程序,当它在命令行上启动的时候,就开始执行保存在某字节码文件中的指令。Java语言的可移植性正是建立在Java虚拟机的基础上。任何平台只要装有针对于该平台的Java虚拟机,字节码文件(.class)就可以在该平台上运行。这就是“一次编译,多次运行”。

  kaffe虚拟机的简要分析

  kaffe虚拟机采用了模块化的程序设计思想,它由多个独立的子系统组成。从功能模块上来分它主要分为:虚拟机总体驱动模块,类装载器模块,类执行模块, 数据区治理模块,内存治理模块,本地支持模块等等。kaffe虚拟机简要的程序流程图如图1所示。

  Java虚拟机的研究与实现(图一)
  图1 kaffe虚拟机简要的程序流程图

  Java虚拟机的实现

  Java 源程序的执行过程为: Java源程序(.java)经过Java编译器编译生成字节码文件(.class),然后由类装载器将字节码文件装载到方法区中,然后进行连接验证,由Java虚拟机读取字节码,转换为特定平台的指令,并且在对应的CPU中执行。

  本实现中采用的流程框架如下图所示:

  Java虚拟机的研究与实现(图二)
  图2 本实现的主要框架

  1、类装载、连接及初始化

  类文件包括:魔数(magic),次、主版本号,常量池,类或接口访问修饰符,常量池索引(this_class和super_class),接口表,域表,方法表,类或接口的属性信息。其中最复杂的内容是常量池,它类似于传统语言编译过程中用到的符号表。

  从原始的class文件到可以被Java虚拟机执行的内部数据格式,需要经过装载、连接和初始化这3个阶段。

  装载是将class文件通过类装载器装载到在逻辑上被称为方法区的内存单元中的过程。

  连接又分为三个步骤:验证,预备和解析。验证是对字节码的验证,可根据具体情况来确定被装载的类是否符合Java虚拟机规范中规定的class文件格式,并确保它不会破坏Java虚拟机的完整性。包括(1)类装载过程中的验证; (2) 检查class文件内部的连贯性,一旦发现class文件格式存在一处错误,则抛出VerifyError异常或ClassFormatError异常。确保每个final类不含有子类,final方法不能被覆盖,以及常量池中所有的域引用和方法引用有有效的名字和类型描述符号;(3) 对字节码流使用一个数据流分析器进行验证。预备步骤的任务是创建域表,并设置域初值。解析步骤是将类中的常量池中的类、接口、字段和方法的符号引用替换成直接引用,以达到更快地访问数据的目的。

  在初始化阶段,Java虚拟机设计者需要将类变量赋予正确的初始值。

  class文件经过上述三个阶段的处理,虚拟机就获得了该类的所有信息并且表示成能够轻易操作的内部数据格式,从而为方法的运行作好了充分的预备。
  2、及时编译器

  任何Java虚拟机实现的核心都是它的执行引擎。在由软件实现的虚拟机中,执行引擎主要有一次性解释字节码、及时编译器、自适应优化编译器三种方式。本实现采用了及时编译的方式,它的特点是第一次被执行的机器码会被编译成本地机器码。及时编译器将引入的字节码翻译成本地机器码,然后直接执行机器码指令而不是解释字节码。机器码指令保存在内存中,由于在运行过程中编译的结果不被保存, 所以程序下一次运行时,字节码将再一次被翻译成机器码。

  假如一装载完字节码文件中的Java方法后,就对其进行编译,则有点处理不恰当,因为还不清楚是否需要执行该方法。编译一个不需要执行的方法,将带来不必要的空间和时间上的损失。 因此虚拟机设计者需要采用一种优化方案,即只有需要被执行的方法才能被JIT编译,这个问题可以参照kaffe虚拟机中的trampoline来解决。

  JIT实现步骤:(1)对字节码进行验证并且划分基本块;(2)产生四元式;(3)根据四元式生成本地机器码;(4)操作数地址回填。

  Java虚拟机的研究与实现(图三)
  图3及时编译器的流程图

  在字节码指令模拟操作的时候,按其语义动作生成指令属性四元式序列,指令属性四元式的结构为: (目的操作数, 源操作数1,源操作数2,语义动作),四元式数据结构如下:

typedef strUCt Sequence{
 void (*func)(struct Sequence*); //语义动作
 union{
  jvalue value;
  struct _label_ *labconst; //标号类型操作数
  Method *methconst; //方法地址操作数
  struct slotData **smask;
  struct slotData *slot; //槽操作数
 }u[3];
 uint8 type; //Sequence类型
 uint8 refered; //该四元式的引用
 struct Sequence *next; //下一个四元式
}Sequence;
  其中目的操作数为Sequence.u[0],源操作数1为Sequence.u[1],源操作数2为Sequence.u[2]。 Sequence.func则代表语义动作,它主要用于生成该Sequence语义的本地机器码。

  指令属性四元组建立后就进入代码生成阶段,属性四元组在形式上已经非常接近本地机器指令,只需要遍历该属性序列,执行相应的语义动作函数,即可生成机器指令。语义动作函数的功能包括操作数寻址、寄存器分配、建立指令连接以及本地机器码生成等。

  在及时编译过程中要经常使用到操作数栈,虚拟机把操作数栈作为它的工作区。大多数指令都要从这里弹出数据,执行运算,然后把结果压回操作数栈。而操作数栈区,局部变量区和帧数据区被包含在方法帧中。方法帧的数据结构如下:


Tags:Java 虚拟 研究

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接