初識JVM byte code
來源:易賢網(wǎng) 閱讀:1119 次 日期:2015-04-03 11:26:59
溫馨提示:易賢網(wǎng)小編為您整理了“初識JVM byte code”,方便廣大網(wǎng)友查閱!

關(guān)于JVM和其上的byte code,網(wǎng)上其實(shí)有足夠多的資料了,我這里就簡單做個(gè)提綱和介紹,權(quán)當(dāng)記錄吧。

stack-based VM

Java byte code運(yùn)行在JVM上,就像機(jī)器指令運(yùn)行在物理機(jī)上,是需要遵循這個(gè)機(jī)器的指令規(guī)范的。所以認(rèn)識JVM byte code,是需要稍微了解下JVM的。JVM是一個(gè)基于棧(stack-based)的虛擬機(jī)。很久以前我還寫過類似簡單的虛擬機(jī)。

基于棧的虛擬機(jī)其操作數(shù)和指令運(yùn)算的中間結(jié)果全部都在一個(gè)虛擬棧中,與之對應(yīng)的是基于寄存器(register-based)的虛擬機(jī),其操作數(shù)和指令運(yùn)算結(jié)果會存放在若干個(gè)寄存器(也就是存儲單元)里。x86機(jī)器就可以理解為基于寄存器的機(jī)器。

byte code其實(shí)和x86匯編代碼本質(zhì)一樣,無非是對應(yīng)機(jī)器制定的一堆指令,這里可以舉例說明下兩類虛擬機(jī)的不同:

# stack-based

push 1 # 壓立即數(shù)1到棧頂

push 2 # 壓立即數(shù)2到棧頂

add # 彈出棧頂2個(gè)數(shù)相加,將結(jié)果3壓到棧頂

# register-based

mov ax, 1 # 寫立即數(shù)到寄存器ax

add ax, 2 # 取ax中的值1與立即數(shù)2進(jìn)行相加,存放結(jié)果到ax

關(guān)于兩類實(shí)現(xiàn)的比較,網(wǎng)上也有不少資料,例如Dalvik 虛擬機(jī)和 Sun JVM 在架構(gòu)和執(zhí)行方面有什么本質(zhì)區(qū)別?。

至于有人說基于棧的虛擬機(jī)更利于移植,我不是很理解,因?yàn)榧词故腔诩拇嫫鞯膶?shí)現(xiàn),也不一定真的必須把這些寄存器映射到物理機(jī)CPU上的寄存器,使用內(nèi)存來模擬性能上跟基于棧的方式不是八九不離十嗎?

了解了JVM的這個(gè)特點(diǎn),JVM上的各種指令就可以更好地理解,如果要理解JVM如何運(yùn)行byte code的,那還需要了解JVM內(nèi)部的各種結(jié)構(gòu),例如符號解析、class loader、內(nèi)存分配甚至垃圾回收等。這個(gè)以后再談。

byte-code

*.class文件就已經(jīng)是編譯好的byte code文件,就像C/C++編譯出來的目標(biāo)文件一樣,已經(jīng)是各種二進(jìn)制指令了。這個(gè)時(shí)候可以通過JDK中帶的javap工具來反匯編,以查看對應(yīng)的byte code。

// Test.java

public class Test {

public static void main(String[] args) {

int a = 0xae;

int b = 0x10;

int c = a + b;

int d = c + 1;

String s;

s = "hello";

}

}

編譯該文件:javac Test.java得到Test.class,然后javap -c Test即得到:

Compiled from "Test.java"

public class Test {

public Test();

Code:

0: aload_0

1: invokespecial #1 // Method java/lang/Object."<init>":()V

4: return

public static void main(java.lang.String[]);

Code:

0: sipush 174 # push a short onto the stack 0xae=174

3: istore_1 # store int value into variable 1: a = 0xae

4: bipush 16 # push a byte onto the stack 0x10=16

6: istore_2 # store int value into variable 2: b = 0x10

7: iload_1 # load value from variable 1 and push onto the stack

8: iload_2

9: iadd # add two ints: a + b

10: istore_3 # c = a + b

11: iload_3

12: iconst_1 # 1

13: iadd # c + 1

14: istore 4 # d = c + 1

16: ldc #2 // String hello

18: astore 5

20: return

}

這個(gè)時(shí)候?qū)φ罩鳭VM指令表看上面的代碼,比起x86匯編淺顯易懂多了,秒懂,參考Java bytecode instruction listings。JVM中每個(gè)指令只占一個(gè)字節(jié),操作數(shù)是變長的,所以其一條完整的指令(操作碼+操作數(shù))也是變長的。上面每條指令前都有一個(gè)偏移,實(shí)際是按字節(jié)來偏移的。想起Lua VM的指令竟然是以bit來干的

從上面的byte code中,以x86匯編的角度來看會發(fā)現(xiàn)一些不同的東西:

局部變量竟是以索引來區(qū)分:istore_1 寫第一個(gè)局部變量,istore_2寫第二個(gè)局部變量,第4個(gè)局部變量則需要用操作數(shù)來指定了:istore 4

函數(shù)調(diào)用invokespecial #1竟然也是類似的索引,這里調(diào)用的是Object基類構(gòu)造函數(shù)

常量字符串也是類似的索引:ldc #2

*.class中是不是也分了常量數(shù)據(jù)段和代碼段呢

以上需要我們進(jìn)一步了解*.class文件的格式。

class file format

class 文件格式網(wǎng)上也有講得很詳細(xì)的了,例如這篇Java Class文件詳解。整個(gè)class文件完全可以用以下結(jié)構(gòu)來描述:

ClassFile {

u4 magic; //魔數(shù)

u2 minor_version; //次版本號

u2 major_version; //主版本號

u2 constant_pool_count; //常量池大小

cp_info constant_pool[constant_pool_count-1]; //常量池

u2 access_flags; //類和接口層次的訪問標(biāo)志(通過|運(yùn)算得到)

u2 this_class; //類索引(指向常量池中的類常量)

u2 super_class; //父類索引(指向常量池中的類常量)

u2 interfaces_count; //接口索引計(jì)數(shù)器

u2 interfaces[interfaces_count]; //接口索引集合

u2 fields_count; //字段數(shù)量計(jì)數(shù)器

field_info fields[fields_count]; //字段表集合

u2 methods_count; //方法數(shù)量計(jì)數(shù)器

method_info methods[methods_count]; //方法表集合

u2 attributes_count; //屬性個(gè)數(shù)

attribute_info attributes[attributes_count]; //屬性表

}

這明顯已經(jīng)不是以區(qū)段來分的格式了,上面提到的函數(shù)索引、常量字符串索引,都是保存在constant_pool常量池中。常量池中存儲了很多信息,包括:

各種字面常量,例如字符串

類、數(shù)據(jù)成員、接口引用

常量池的索引從1開始。對于上面例子Test.java,可以使用javap -v Test來查看其中的常量池,例如:

Constant pool:

#1 = Methodref #4.#13 // java/lang/Object."<init>":()V

#2 = String #14 // hello

#3 = Class #15 // Test

#4 = Class #16 // java/lang/Object

#5 = Utf8 <init>

#6 = Utf8 ()V

#7 = Utf8 Code

#8 = Utf8 LineNumberTable

#9 = Utf8 main

#10 = Utf8 ([Ljava/lang/String;)V

#11 = Utf8 SourceFile

#12 = Utf8 Test.java

#13 = NameAndType #5:#6 // "<init>":()V

#14 = Utf8 hello

#15 = Utf8 Test

#16 = Utf8 java/lang/Object

每一個(gè)類都會有一個(gè)常量池。

summary

要想了解JVM運(yùn)行byte code,還需要了解更多JVM本身的東西,例如符號解析,內(nèi)存管理等,可參考:

JVM Internals

Understanding JVM Internals

更多信息請查看IT技術(shù)專欄

更多信息請查看技術(shù)文章
易賢網(wǎng)手機(jī)網(wǎng)站地址:初識JVM byte code
由于各方面情況的不斷調(diào)整與變化,易賢網(wǎng)提供的所有考試信息和咨詢回復(fù)僅供參考,敬請考生以權(quán)威部門公布的正式信息和咨詢?yōu)闇?zhǔn)!

2025國考·省考課程試聽報(bào)名

  • 報(bào)班類型
  • 姓名
  • 手機(jī)號
  • 驗(yàn)證碼
關(guān)于我們 | 聯(lián)系我們 | 人才招聘 | 網(wǎng)站聲明 | 網(wǎng)站幫助 | 非正式的簡要咨詢 | 簡要咨詢須知 | 加入群交流 | 手機(jī)站點(diǎn) | 投訴建議
工業(yè)和信息化部備案號:滇ICP備2023014141號-1 云南省教育廳備案號:云教ICP備0901021 滇公網(wǎng)安備53010202001879號 人力資源服務(wù)許可證:(云)人服證字(2023)第0102001523號
云南網(wǎng)警備案專用圖標(biāo)
聯(lián)系電話:0871-65099533/13759567129 獲取招聘考試信息及咨詢關(guān)注公眾號:hfpxwx
咨詢QQ:526150442(9:00—18:00)版權(quán)所有:易賢網(wǎng)
云南網(wǎng)警報(bào)警專用圖標(biāo)