nanopass之八--通用中间语言

2015-03-11

作业8

内容

  1. 背景
  2. UIL
  3. 语义
  4. 要做的事
  5. 样板和运行时代码
  6. 测试

1. 背景

在这次作业中我们将完成我们的"universal intermediate language"(UIL),这是一个独立于源语言的中间语言,因此可以适用于多种源语言的目标语言。

为了完成UIL,我们需要添加分配存储空间,将数据存储到分配的空间中,和从分配的存储空间中取出数据的primitive。

2. UIL

通用中间语言的语法如下所示。相对于我们之前的中间语言,添加了alloc,mref,和mset!的原语。

Program ->  (letrec ([label (lambda (uvar*) Body)]*) Body)
Body    ->  (locals (uvar*) Tail)
Tail    ->  Triv
        |   (alloc Value)
        |   (mref Value Value)
        |   (binop Value Value)
        |   (Value Value*)
        |   (if Pred Tail Tail)
        |   (begin Effect* Tail)
Pred    ->  (true)
        |   (false)
        |   (relop Value Value)
        |   (if Pred Pred Pred)
        |   (begin Effect* Pred)
Effect  ->  (nop)
        |   (set! uvar Value)
        |   (mset! Value Value Value)
        |   (Value Value*)
        |   (if Pred Effect Effect)
        |   (begin Effect* Effect)
Value   ->  Triv
        |   (alloc Value)
        |   (mref Value Value)
        |   (binop Value Value)
        |   (Value Value*)
        |   (if Pred Value Value)
        |   (begin Effect* Value)
Triv    ->  uvar | int | label

唯一变量(uvar),标签(label),整数(int),二元操作(binop)和关系操作(relop)跟前面作业中描述的中间语言相比没有变化。关于整数的机器限制也跟之前子集一样依然存在。

3. 语义

(alloc expr)执行expr生成一个值n,通过将allocation指针寄存器上推保留n字节的存储,并返回存储地基地址。n应该是目标机器字节大小的倍数,allocation指针寄存器由helpers.ss中的变量allocation-pointer-register决定。

(mset! base-expr offset-expr expr)执行base-expr,offset-expr和expr生成变量base,offset和val。它将val存储在base+offset位置。

(mref base-expr offset-expr)执行base-expr和offset-expr生成base和offset。它返回存储的base+offset位置的值。

4. 要做的事

需要写一个新的步骤verify-uil,它会永久的成为我们编译器的一个部分,即使在我们创建独立于语言的编译器之后。它的作用是确定语言不独立的部分会生成一个满足规则的UIL代码。这个步骤只需要直接修改上个星期的检验器。

这次作业主要的挑战是,决定为了支持新添加的三个primitive要做哪些修改,除了添加verify-uil以外。讲课的时候我们会讨论所有可能的策略。你也可能会用一些其它你找到的资料,包括来自这门课程现在或者之前的学生的。像往常一样,你必须注明哪些是合作的部分,并且对代码的修改部分必须主要是你自己做的。当你试着执行你的方案的过程中,遇到了问题的时候,指导员会帮助你。但是他们除了课堂上一些适度的讨论外,并不会给你一些策略上的引导。

这个星期的文档非常重要,并且需要很细致地描述你的策略。我们鼓励你尽早做一份草案并且在你实现编译器过程中保持更新。这会帮助你完善思考过程。

5. 样板和运行时代码

运行时代码不变,但是样板代码必须将allocation指针寄存器初始化到堆的基地址。在helpers.ss中的emit-program现在生成的样板代码会做这件事。

6. 测试

这次作业的一个包含正反用例的小的测试集将在下周发出来,在tests8.ss中,并且可能包含课堂上同学们提交的测试用例。你需要确保你的编译器至少能够通过这系列的测试。

nanopass翻译scheme