python 的模块一旦加载就会常驻内存,直到程序结束。再碰到 import 语句式只是修改名字空间,而不需要重新加载。这种机制是出于运行时的效率考虑,每遇到 import 的时候重新加载显然很低效。它也不会检查源文件的修改时间以确定是否重新加载,Python 有那么多的模块,每次调用时都检查一遍时间也是不行的。
这种机制下,开发长时间运行的守护程序就会很麻烦,修改源代码后要重新启动程序才能让新的代码生效。比如用 mod_python 做 WEB 开发,Apache 会启动多个守护进程来应答客户请求,里面有 python 的解释引擎和加载的模块,若要让修改后的代码生效只能重起 apache,这会影响到其它服务的正常运行,非常不方便。mod_python 有一个PythonAutoReload 参数,它只是针对 PythonHandler 而言的,能够对设定的 PythonHandler 实现自动重新加载,而该 Handler 中所用到的模块却不能自动 reload。
这种修改源代码然后重起 apache 的调试方式实在让我无法忍受了,决定实现一种自动重新加载机制。基本的思路就是每个用户请求到来时,检查我所关心的那些模块源文件的修改时间,如果比加载时的修改时间新,则重新加载。
编写一个检测时间和重新加载的函数,让它在每个请求到来时执行:
- def autoreload():
- mod_names = ['Entry','Index','SideBar']
- for mod_name in mod_names:
- try :
- module = sys .modules[ mod_name ]
- except :
- continue
- mtime = os .path.getmtime( module.__file__ )
- try :
- if mtime > module.loadtime:
- reload ( module )
- except :
- pass
- module.loadtime = mtime
这段代码不长,但是改了好多个版本,最开始用 has_key() 的方式来检测是否存在某个模块,检测该模块是否有 loadtime 属性( 用 module.__dict__ ),现在这种方式应该效率高一些,曾经在一个 blog 上看到过对比测试数据。起初还在每个关心的模块里面加上一句loadtime = os.path.getmtime( __file__ ),这是不必要的,因为 Python 用的是动态类型,可以在运行时追加属性,第一次检测时设置初始状态即可。
有了这段代码,开发 BlogXP 方便多了,改了源码之后立马就能生效,而且它在正常运行时的消耗也很小。另外,由于mod_python 能够实现指定的 Handler 的自动重新加载,将这段代码放在该 Handler 中,可以方便地改变所关心的模块列表,也不需重起 apache。
0