python运行过程解析

https://m.toutiao.com/is/JtXTSjN/

使用python一段时间,如果问下面这些问题你能明确回答吗?

  • 包与模块是什么?
  • __init__.py、__main__.py是做什么用的?import语句背后做了什么?
  • python程序是怎么加载的?
  • 都说python是脚本语言,那脚本程序如何运行?
  • python -m 运行程序,有没有-m有什么区别?
  • __name__准确含义?

如果有疑问,那就跟随笔者,通过实验来搞明白这些。


*在开始前,先明确两个概念:包、模块:

模块,等同于一个.py文件(不包括扩展名)。

包,是一个目录,此目录中的.py文件是相互关联,一般此目录中常会有__init__.py和__main__.py文件。

*本环境使用的python版本为3.6.5,运行代码都是在D:\workpython\zaglib目录下

*运行环境为启动当前venv下虚拟环境


一、python程序如何运行

python程序运行流程

上图是python程序的运行流程:

源代码.py被编译成字节码(内存中PyCodeObject),然后由PVM虚拟机运行;

生成的字节码,会被保存到当前目录下的__pycache__中,命名为*.pyc(需要满足条件);

下次再执行时,会检查当前源文件与对应pyc文件时间,如果源文件被修改过,则重新生成pyc,否则直接加载字节码运行。

'''run1.py、run2.py、package1/__main__.py三个文件都是此代码'''import sysprint(__file__) #当前文件名print(__name__) #当前命名空间引用名 #sys.path为搜索模块的路径列表paths=sorted(sys.path) for p in paths: print(p)
'''import_run1.py'''import run1print(__name__)

运行python run1.py,当面目录下没有生成__pycache__目录。

运行python import_run1.py 当面目录下生成__pycache__目录,其中生成文件run1.cpython-36.pyc(36表示python为3.6版本),此即为保存的字节码文件。

import_run1.py中只有一行代码: import run1。这就是要满足的条件,run1被import,run1.py被当做公共模块,才保存其字节码文件


二、python -m的作用

run1.py、run2.py、package1/__main__.py三个文件代码相同(参考上文)

'''run3.py'''import sysprint(__file__)print(__name__)if __name__=='__main__': paths=sorted(sys.path) for p in paths: print(p)
'''__init__.py'''print(__file__)print(__name__)

a、python -m 模块名

是在python模块搜索路径(sys.path)中查找指定模块,并作为脚本程序执行。代码执行的作用域名字__name__为__main__。

实验:在zaglib/下,运行run1.py

python -m run1

输出第一行:D:\workpython\zaglib\run1.py 为print(__file__)的输出(绝对路径)

第二行为:__main__ 为print(__name__)输出

sys.path搜索路径第一行为空行,即为当前路径。

python run1.py

运行结果第一行:run1.py,为print(__file__)的输出(相对路径)

第二行为:__main__ 为print(__name__)输出

结论:运行当前位置下py文件,有无-m,效果基本一致。


实验:在zaglib/下,运行zaglib/venv/run2.py

python -m run2

输出第一行:D:\workpython\zaglib\venv\run2.py 为print(__file__)的输出(绝对路径)

第二行为:__main__ 为print(__name__)输出,使用-m时,能成功找到并运行。

python run2找不到文件

结论:运行在其他位置的模块,-m可以在sys.path中搜索。如果没有-m,则不会查找。

b、python -m 包名

会运行 包名.__main__.py。

python -m package1

输出第一行:D:\workpython\zaglib\package1\__init__.py 为print(__file__)的输出(绝对路径);

第二行为:package1 为__init__.py中print(__name__)输出;

输出第三行:D:\workpython\zaglib\package1\__main__.py 为print(__file__)的输出(绝对路径);

第四行为:__main__ 为__main__.py中print(__name__)输出;

从输出看出,python -m package1,先运行了package1/__init__.py,再运行了__main__.py;

而__init__.py中__name__则对应包名package1,__main__.py 的命名空间称为__main__

python -m package1.__main__输出与上图相同

结论:除非程序在当前位置运行,否则一律加 -m。-m 会搜索sys.path路径,查找模块。

三、import的背后

'''callpackage.py'''import package1.run3 as r3print(__name__)r3.show_msg()
'''__init__.py'''print(__file__)print(__name__)
'''run3.py'''import sysprint(__file__)print(__name__)paths=sorted(sys.path)for p in paths: print(p)def show_msg(): print('show_msg')

import package1.run3 内部运行了package1中的__init__.py种的程序,然后运行了run3.py中的程序;

而__name__,为包名.模块名。

import语句,会顺序级联方式运行引用包的__.init__.py及其后模块。__name__是一种模块引用的命名方式。


本文设计的概念很琐碎,只有把代码实际运行过,才能真正搞清楚python中隐藏的这些知识点。如果想自己制作一个pip安装的包,这些概念是基础。

(0)

相关推荐