以Python为例讨论高级编程语言程序的wire format与校验
2010-09-22 11:26:23 来源:WEB开发网 闂傚倸鍊搁崐鎼佸磹閹间礁纾归柟闂寸绾惧綊鏌熼梻瀵割槮缁炬儳缍婇弻鐔兼⒒鐎靛壊妲紒鐐劤缂嶅﹪寮婚悢鍏尖拻閻庨潧澹婂Σ顔剧磼閻愵剙鍔ょ紓宥咃躬瀵鎮㈤崗灏栨嫽闁诲酣娼ф竟濠偽i鍓х<闁诡垎鍐f寖闂佺娅曢幑鍥灳閺冨牆绀冩い蹇庣娴滈箖鏌ㄥ┑鍡欏嚬缂併劎绮妵鍕箳鐎n亞浠鹃梺闈涙搐鐎氫即鐛崶顒夋晬婵絾瀵ч幑鍥蓟閻斿摜鐟归柛顭戝枛椤牆顪冮妶搴′簼缂侇喗鎸搁悾鐑藉础閻愬秵妫冮崺鈧い鎺戝瀹撲礁鈹戦悩鎻掝伀缁惧彞绮欓弻娑氫沪閹规劕顥濋梺閫炲苯澧伴柟铏崌閿濈偛鈹戠€n€晠鏌嶆潪鎷屽厡闁汇倕鎳愮槐鎾存媴閸撴彃鍓卞銈嗗灦閻熲晛鐣烽妷褉鍋撻敐搴℃灍闁绘挻娲橀妵鍕箛闂堟稐绨肩紓浣藉煐濮樸劎妲愰幘璇茬闁冲搫鍊婚ˇ鏉库攽椤旂》宸ユい顓炲槻閻g兘骞掗幋鏃€鐎婚梺瑙勬儗閸樺€熲叺婵犵數濮烽弫鍛婃叏椤撱垹纾婚柟鍓х帛閳锋垶銇勯幒鍡椾壕缂備礁顦遍弫濠氱嵁閸℃稒鍊烽柛婵嗗椤旀劕鈹戦悜鍥╃У闁告挻鐟︽穱濠囨嚃閳哄啰锛滈梺褰掑亰閸欏骸鈻撳⿰鍫熺厸閻忕偟纭堕崑鎾诲箛娴e憡鍊梺纭呭亹鐞涖儵鍩€椤掑啫鐨洪柡浣圭墪閳规垿鎮欓弶鎴犱桓闂佸湱枪閹芥粎鍒掗弮鍫熷仺缂佸顕抽敃鍌涚厱闁哄洢鍔岄悘鐘绘煕閹般劌浜惧┑锛勫亼閸婃牠宕濋敃鈧…鍧楀焵椤掍胶绠剧€光偓婵犱線鍋楀┑顔硷龚濞咃絿妲愰幒鎳崇喓鎷犻懠鑸垫毐闂傚倷鑳舵灙婵炲鍏樺顐ゆ嫚瀹割喖娈ㄦ繝鐢靛У绾板秹寮查幓鎺濈唵閻犺櫣灏ㄥ銉р偓瑙勬尭濡繂顫忛搹鍦<婵☆垰鎼~宥囩磽娴i鍔嶉柟绋垮暱閻g兘骞嬮敃鈧粻濠氭偣閸パ冪骇鐎规挸绉撮—鍐Χ閸℃ê闉嶇紓浣割儐閸ㄥ墎绮嬪澶嬪€锋い鎺嶇瀵灝鈹戦埥鍡楃仯闁告鍕洸濡わ絽鍟崐鍨叏濡厧浜鹃悗姘炬嫹

Java的JVM、.NET的CLI、Android的Dalvik、ActionScript 3的AVM2等主流虚拟机,都在规范中要求实现必须在执行中间代码前有“校验”(verification)阶段。显然,不可能有程序能把所有“应该能行”的程序都找出来,这是停机问题的一个变种。因此“校验”并不以找出所有正确的程序为目标,而是根据精心设计的规则找出其子集——“肯定能行”的程序。不在该子集内的程序就被认为是不合法的。
如何校验,校验些什么呢?既然校验在执行之前,校验就是对程序的静态分析。通过代码发现,校验器可以模拟出程序在任意时间点的一些特性。上一段所举的几种虚拟机都采用基于栈的架构,对它们来说可校验的特性包括:求值栈平衡;求值栈的实际深度没有超过其声称的最大值;局部跳转目标是有效指令的起始位置;经过不同路径到达控制流的汇集点时,求值栈的状态统一;存储区访问没有越界;存储单元类型匹配,类型的声明与定义一致……等等。之前我的一帖,一个通不过Java字节码校验的例子,就是上述校验过程的一例。
对中间代码的校验,其实是对源码校验的延续。如果中间代码不是由受信任的编译器生成的,那么本应由编译器贯彻的一些约束在中间代码是否得到了体现?如果封装中间代码为wire format,这个问题就值得关注了。
与封装本地代码相比,封装中间代码的wire format与执行环境的校验步骤结合,可以让用户更放心的执行“不受信任”的代码。
同时允许源码和中间代码为wire format
前文提到了,以源码为wire format时,为实现语义,解释器必须对源码进行解析。解析源码就包含了对wire format的校验。以中间代码为wire format时,为安全起见也应该对中间代码做校验。同时允许两者为wire format,一般意味着源码解析后会被转换成同为wire format的中间代码,然后虚拟机只要执行中间代码即可。
更多精彩
赞助商链接