![]() |
|
||||||||||||||
| . 网站首页 . 新闻 . 新品 . 方案 . 专访 . 活动 . DSP . EDA . 评测室 . 技术文库 . 会员区 . 商城 . 服务导航 . 邮购 . 资源 . | ||
|
||
|
|||||
| PowerPC 的仿真和交叉开发 | |||||
作者:61IC录入 文章来源:本站原创 点击数: 更新时间:2006-10-5 ![]() |
|||||
|
避免新硬件成本 级别: 中级 Hollis Blanchard (hollisb@us.ibm.com) 软件开发人员, IBM 2005 年 2 月 本文为那些无法与 PowerPC 的真实硬件亲密接触的开发人员介绍 PowerPC 的仿真(emulation)和交叉编译(cross-compiling)。本文适合那些熟悉计算机体系结构、拥有基于 x86 的工作站并且有兴趣对 PowerPC 进行实验的开发人员。 有些开发人员可能没有机会亲手操作 PowerPC® Linux™ 系统(不过,您可以买一个这样的系统,在我撰写这篇文章的时候,它的价格不超过 200 美元)。对于有好奇心的 x86 Linux 用户,仿真是一种方便而又廉价的选择。现在至少有三种开源 PowerPC 仿真器,其中有两种还相当新。 精确度 有些仿真器,尤其是专业开发人员使用的那些仿真器,都是周期精确(cycle-accurate)的,也就是说,对于一个给定上下文环境下的特定指令,它在仿真器中花费的周期与它在真实硬件上运行所需的周期完全一致。这些仿真器不仅可以仿真指令集,而且还可以仿真内部的管道和处理器的缓存。在拥有实际芯片之前的开发过程中,这些仿真器特别有用。与硬件性能计数器收集到的信息相比,仿真器让开发人员可以更深入地洞悉性能瓶颈。然而,这些仿真器也有一些严重的局限性。由于它们在编制文档时对知识产权和硬件技巧有太多的要求,因此想免费查看或修改其内部结构几乎是不可能的。相反,处理器设计人员会提供一些可用的二进制文件,有时候它们是免费的,但通常只适用于非常严格的范围内的主机。对于更高级的软件开发人员来说,另一个问题是,由于他们要仿真大量的处理器内部结构,所以速度会非常慢。最后,这些仿真器可能不如真实硬件那样精确。由于速度或复杂性的原因,即使是周期精确的仿真器,也可能忽略了缓存或 IO 的仿真,从而导致有偏差的结果。在大多数情况下,这些仿真器都很接近,但也存在这样的事实,即一个仿真器在某个时候只仿真硬件,因而其行为可能会有所偏差。 这里讨论的仿真器都不是周期精确的。实际上,它们甚至还不完全是行为精确(behavior-accurate)的。(如果出现行为不精确的现象,则称之为一个 bug,这种 bug 通常最终都会得以解决。) 仿真的用户模式 对于好奇的开发人员来说,一个非常方便的特性就是用户模式仿真。如果一个仿真器只仿真处理器和 IO(例如一个网络设备),那么首先需要启动(和仿真)一个 Linux 内核,然后在此基础上启动一个仿真的应用程序。对于更重大的工作而言,这当然很重要,但是对于简单的实验,这样做要方便得多,可以避免完全处理内核。如果仿真器不仅能够仿真处理器,而且还可以仿真操作系统内核,那么对于那些不依赖很多内核服务的小程序,例如只需要使用 write 和 exit 系统调用的小程序,运行起来就要容易得多。 当仿真器正常地碰到一个 PowerPC 系统调用指令时,它便将指令地址存入到 SRR0 寄存器,设置 SRR1 中某些体系结构定义的位,并将控制权转交给物理地址 0xC00,从而仿真这个异常(有些 PowerPC 的变种允许对这种行为有更多的控制,但是这里的这种是传统的 PowerPC 模型)。就像在硬件上一样,仿真的内核在 0xC00 处有它自己的系统调用异常处理程序,因此内核可获得对处理器的控制。 另一方面,当一个支持用户模式仿真的仿真器碰到一个系统调用指令时,它并不是把控制转交给仿真的异常处理程序,相反,它会自己解释该系统调用。最简单的例子是像 read 和 write 这样的系统调用:这两种系统调用几乎可以立即转换为仿真器作出的实际的系统调用。用于在仿真的应用程序作出的仿真系统调用与仿真器作出的实际系统调用之间进行转换的 glue 层可能还有其他的功能,例如记录仿真的应用程序作出的所有系统调用。 除了绕开构建一个用于仿真的内核和一个用于启动到其中的文件系统镜像,以及为 IO 配置虚拟网络设备的复杂性之外,这条捷径还加快了仿真的速度,因为绕开了从异常处理程序到 VFS 再到设备驱动程序的很多内核指令,而这些内核指令本来就是用来处理系统调用的。不过,很显然,不在仿真器里运行内核就意味着总体行为可能会有很大的偏差。在最坏的情况下,仿真器系统调用 glue 中出现一个 bug 就会使仿真的应用程序看上去像是充满了 bug,即使它在实际的内核上能够运行得很好也无济于事。 即时编译 通过即时编译(Just In Time,JIT)这种方法,可以动态地将解释的字节码(例如,一个仿真的指令流)翻译成本地指令。这种方法不是简单地依次解释和仿真每条指令,而是将整个指令序列转换成本地对应的指令序列,并将它们缓存起来,这样,在随后执行指令序列时,就不需要再进行翻译了。相应地,已解释代码的严格 CPU 限制循环应该可以以接近本地的速度执行,因为本地代码被保存在缓存中。另一方面,带有很少循环的代码的性能则得不到太多的改善。JIT 编译器对于 Java™ 虚拟机来说非常常见,这种编译器也可以用于提高仿真虚拟机的效率。 Qemu Qemu 是非常新的一种仿真器,它使用动态翻译(例如 Java Just In Time (JIT) 编译器),以便获得良好的性能。在这种情况下,良好的性能大约要比本地硬件慢 4 到 10 倍,这取决于基准的不同。Qemu 支持一些不同的主机和目标,但我们只需考虑 x86 主机和 PowerPC 目标,这正好是受支持的配置。Qemu 还支持远程 GDB (GNU Debugger)连接,这对于调试非常有价值。不幸的是,qemu 不支持用户模式仿真中的 GDB 连接,只支持全系统模式中的 GDB 连接。Qemu 不支持 AltiVec™ 向量处理指令。 PearPC PearPC 是另一种新的仿真器,它可以使用 JIT 动态翻译,但只能和 PowerPC 目标一起在 x86 主机上使用 —— 不过,本文使用的正好是这种环境。它的性能不如 qemu 好,大约要比主机系统慢 15 倍。不幸的是,PearPC 不支持用户环境,因此还需要一个内核和一个基本文件系统(Linux、Darwin 和 Mac OS X 目前都受支持)。 PearPC 不支持 GDB 连接,也不支持 AltiVec 向量处理指令(不过开发人员打算在未来版本中添加对它们的支持)。 PSIM PSIM (PowerPC 仿真器)是 PowerPC 仿真的祖宗:它编写于 1994 年,对于当时还算新的 PowerPC 体系结构,它在 Linux 和 NetBSD 的初始端口中起辅助作用。PSIM 与 GDB 代码集成在一起,令人惊奇的是,虽然自 1996 年以后就没有人对它作进一步开发,但它至今仍被使用。通过与 GDB 集成,PSIM 还支持 GDB 连接,包括用户模式。因为早于 AltiVec 出现,所以 PSIM 不支持 AltiVec 向量处理指令。 选择仿真器 由于上述原因,本文将使用 qemu。一些常见的基本问题也适用于其他仿真器,但就本文来说,qemu 是最易于构建的。请下载和解压 qemu tarball (请参阅 参考资料),然后: 清单 1: 构建 qemu $ ./configure --target-list=ppc-user $ make 这将产生 ./ppc-user/qemu-ppc,以后还要使用这个文件执行 PowerPC 二进制文件。 交叉编译 在交叉开发中,第二个关键组成部分是交叉编译器(cross-compiler)。交叉编译器运行在一种体系结构上,但是却产生用于另一种体系结构的二进制文件。如果像大多数嵌入式系统开发那样,部署系统相对于开发系统来说存在明显的不足,那么交叉编译可能带来很大的方便。交叉编译器不会覆盖系统的本地编译器,也不会通过任何方式与本地编译器交互。 Crosstool 构建 GNU 交叉编译器可能非常容易,取决于牵涉到的体系结构,但有时候也会出现构建中断(build break)的情况。有时可能还要求完成几个阶段的构建,以便让所有组件以正确的方式为彼此进行构建。为了消除猜测,并自动化这个过程,Dan Kegel 开发了一个非常有用的构建脚本,即 crosstool。 请下载和解压最新版本的 crosstool (请参阅 参考资料)。然后: 清单 2:构建 crosstool $ sudo mkdir /opt/cross $ sudo chown $USER /opt/cross $ sh demo-ppc750.sh 这要运行一段时间,在完成时,用于交叉编译的 binutils、GCC 和 glibc 将安装在 /opt/crosstool。请查看一下那里的目录结构,并考虑将它添加到 PATH 环境变量中,这样以后便可以不用输入目录。 Hello, world 至此,我们已经构建好了一个仿真器和一个交叉编译器,现在可以将它们汇总,测试一下这个新的环境。将下面的代码放到 hello.c 中: 清单 3: 一个既熟悉又陌生的程序 #include <stdio.h> int main(int argc, char *argv[]) { printf("Hello, world.\n"); return 0; } 现在,使用静态链接,以免担心如何将 PowerPC 共享库安装到 x86 主机系统上。要产生一个名为 "hello" 的 32-位 PowerPC ELF 可执行文件,则需要运行以下命令: 清单 4: 使用 GCC 进行交叉编译 $ powerpc-750-unknown-gnu-gcc -static hello.c -o hello 为了检验它是否是预期的格式,可以使用以下命令: 清单 5: 检查文件类型 $ file hello hello: ELF 32-bit MSB executable, PowerPC or cisco 4500, version 1 (SYSV), for GNU/Linux 最后,在 qemu 下运行这个可执行文件: 清单 5: 在 qemu 下运行可执行文件 $ ./ppc-user/qemu-ppc hello "Hello, world." 应该输出到终端。 现在打算做什么呢? 现在您可以将 C 代码构建到 PowerPC 可执行文件中,并运行它们。而且还可以用 "Introduction to PowerPC Assembly" 这篇文章中给出的示例汇编例子做实验,这篇文章列在 参考资料 一节中。(注意,您可以直接使用交叉汇编器,不过继续使用该编译器要容易得多)。如果您对这种实验已经感到满足,那么可以将目光转移到更大、更有趣的也许还包括共享库的例子上(请参阅 qemu 文档以寻求帮助,这个文档也列在 参考资料 一节中)。 64-位 PowerPC 虽然 crosstool 可以容易地产生 ppc64 toolchains,但还没有用于 64-位 PowerPC 的开源仿真器,因此您需要使用真正的硬件来做实验。当然,ppc32 可执行文件在 ppc64 硬件上同样运行得很好(但反之则不然)。 结束语 仿真器不可能与本地硬件一样快。在硬件中实现这项功能的最大原因就是为了获得速度。仿真器不可能像真实硬件一样精确,尤其是当硬件本身包含由内部组件之间细微的定时交互所触发的勘误表(errata)时,仿真器更难像真实硬件那样精确。然而,仿真器对于开发乃至通常的计算都十分有价值。作为一种商业仿真器,虚拟 PC 被大量 Macintosh,® 所有者用于运行 Windows® 应用程序。它可能不如硬件那么快,但是它更便宜,更易于维护。在开发底层操作系统代码时,仿真器让开发人员可以洞察系统的状态,从而揭露对硬件有害的 bug。实际上,在硬件开发过程中,仿真器可能是惟一可用的开发平台! 上述仿真器曾经被用于、并且目前还被用于操作系统的开发,这证明了健壮性的一些度量标准。但是,请不要停止您尝试 32 位通用寄存器的脚步,或者停止尝试让您所编写的软件支持 PowerPC 用户。有这样得天独厚的价格和方便的环境,还有什么不放心的呢? 参考资料 您可以参阅本文在 developerWorks 全球站点上的 英文原文。 PearPC 是在 SourceForge 上维护的。另外,还请参阅 PearPC 文档。 您可以从 qemu 主页 获得 qemu。另外,还请参阅 QEMU CPU Emulator User document.tion。 PSIM 型的 PowerPC 体系结构是用扩展的 ANSI-C 编写的,存在于 Red Hat 中。它也包含大量文档。 用于 crosstool 的下载链接和文档可以在该项目的主页找到。 准备好后,您可以使用 Introduction to assembly on the PowerPC(developerWorks, 2002 年 7 月)中的一些代码做试验。 您知道吗,您只需 200 美元就可以获得一个 PowerPC Linux kit。当然,我们说的是 Kuro (后面会有相关内容)。另外,还请参阅来自 Penguin PPC 的 Kuro 回顾。 对于 64 位是不是有点急不可待了?完全没必要,这里就有一些可用于入门的关于 64-位 PowerPC 的信息(developerWorks, 2004 年 10 月)。 如果要仿真整个系统,那么这些 性能工具 将帮助您如愿以偿(developerWorks, 2004 年 6 月)。 您可以从 Wikipedia 了解更多关于 Just-in-time 编译 的信息。 另外,还请参阅 关于 Linux 模拟器及其如何工作的开发指南(developerWorks, 2004 年 12 月)和 服务器诊所: 在 Linux 上仿真老式操作系统(developerWorks, 2003 年 6 月)。 您是否有意与 Power Architecture 专区的读者分享自己的看法?不管是 IBM 内部的,还是外部的作者,都会欢迎您在这里发表关于 Power Architecture 技术各个方面的文章。请阅读 Power Architecture author FAQ,以便了解更多信息。 您对本文或 Power Architecture 技术有疑问或意见吗?如果有的话,请将自己的疑问或意见发表在 Power Architecture 技术论坛 上,或者写在 发给作者的信 中。 所有关于 Power 的事件都记录在 developerWorks Power Architecture editors' blog 中,这只是众多 developerWorks blog 中的一个。 在 developerWorks Power Architecture technology content area 可以找到更多关于 Power Architecture 技术的文章和参考资料,以及很多相关信息。 下载一个 Power Architecture Pack,以便在一个仿真的环境中演示 SoC,或者探索完全许可版本的 Power Architecture 技术。这与其他一些好的有关 Power Architecture 的下载链接都列在 developerWorks Power Architecture technology content area 的 下载区域 中。 关于作者 Hollis Blanchard 从事 PowerPC 汇编的程序设计大约已有 6 个月的时间了。他于 2001 年毕业于卡内基-梅隆大学,之后,就致力于作为 IBM Linux 技术中心一部分的 Linux 和其他 PowerPC 项目。您可以通过 hollis@austin.ibm.com 与他联系。他从 1998 年开始学习 PowerPC 体系结构和 Linux 内核。现在,他在 IBM Linux 技术中心工作,在这里,他参与了嵌入式 PowerPC、pSeries 服务器和 x86 系统的开发。而且他还是 penguinppc.org 的核心贡献者之一。 |
|||||
| 欢迎点击进入:TI德州中文网 (国内唯一针对TI应用的中文技术网站) 文章录入:admin 责任编辑:admin | |||||
| 【发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口】 | |||||
| 最新热点 | 最新推荐 | 相关文章 | ||
| 基于PowerPC的嵌人式系统设计 用PowerPC实现高带宽 TCP/IP… 嵌入式处理器MPC8250与CF卡的… 基于嵌入式Linux的MPC850 US… PowerPC上ELF可执行文件的符… PowerPC上ELF可执行文件的符… |
| 网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!) |
| | 设为首页 | 加入收藏 | 联系站长 | 友情链接 | 版权申明 | 网站公告 | 管理登录 | | |||
|
|