Python中的作用域与名字空间实例分析(python,开发技术)

时间:2024-05-03 01:13:35 作者 : 石家庄SEO 分类 : 开发技术
  • TAG :

    Python%E4%B8%AD%E7%9A%84%E4%BD%9C%E7%94%A8%E5%9F%9F%E4%B8%8E%E5%90%8D%E5%AD%97%E7%A9%BA%E9%97%B4%E5%AE%9E%E4%BE%8B%E5%88%86%E6%9E%90

从解释器的角度来看,变量只是一个泛型指针 PyObject *;而从 Python 的角度来看,变量只是一个用来和对象进行绑定的名字、或者说符号。

变量的定义本质上就是建立名字和对象之间的约束关系,所以a = 1这个赋值语句本质上就是将 a1绑定起来,让我们通过 a 这个符号可以找到对应的 PyLongObject。

除了变量赋值,创建函数、类也相当于定义变量,或者说完成名字和对象之间的绑定。

创建一个函数也相当于定义一个变量,会先根据函数体创建一个函数对象,然后将符号foo和函数对象绑定起来。所以函数名和函数体之间是分离的,同理类也是如此。

导入一个模块,也是在定义一个变量。import os相当于将名字 os 和模块对象绑定起来,通过 os 可以找到指定的模块对象。

再比如import numpy as np当中的 as 语句同样是在定义变量,将名字 np 和对应的模块对象绑定起来,以后就可以通过 np 这个名字去获取指定的模块了。

另外,当我们导入一个模块的时候,解释器是这么做的,比如 import os

它等价于 os = __import__("os"),可以看到本质上还是一个变量赋值语句。

我们知道赋值语句、函数定义、类定义、模块导入,本质上只是完成了名字和对象之间的绑定。而从概念上讲,我们实际上就是得到了一个 name 和 obj 之间的映射关系,通过 name 可以获取对应的 obj,而它们的容身之所就是名字空间。

那么要实现名字空间,应该选择哪一种数据结构呢?毫无疑问,肯定是字典。而在前面介绍字典的时候,我们说字典是被高度优化的,原因就是虚拟机本身也在大量使用字典,从这里的名字空间即可得到体现。

但是一个模块内部,名字(变量)还存在可见性的问题,比如:

我们看到同一个变量名,打印的确是不同的值,说明指向了不同的对象,换句话说这两个变量是在不同的名字空间中被创建的。

因为名字空间是一个字典,如果两者是在同一个名字空间,那么由于字典的 key 的不重复性,当执行 number = 456 的时候,会把字典里面 key 为 "number"的 value 给更新成 456。但外面还是打印 123,这说明两者所在的不是同一个名字空间,打印的也就自然不是同一个 number。

因此对于一个模块而言,内部是可能存在多个名字空间的,每一个名字空间都与一个作用域相对应。作用域可以理解为一段程序的正文区域,在这个区域里面定义的变量是有意义的,然而一旦出了这个区域,就无效了。

对于作用域这个概念,至关重要的是要记住:它仅仅是由程序的文本所决定的。在 Python 中,一个变量在某个位置是否起作用,是由它的文本位置决定的。

因此 Python 具有静态词法作用域,而名字空间则是作用域的动态体现,一个由程序文本定义的作用域在 Python 运行时会转化为一个名字空间(字典)。比如进入一个函数,显然进入了一个新的作用域,因此函数在执行时,会创建一个名字空间。

Python 在对源代码进行编译的时候,对于代码中的每一个 block,都会创建一个PyCodeObject 与之对应。而当进入一个新的名字空间、或者说作用域时,我们就算是进入一个新的 block 了。

而根据我们使用 Python 的经验,显然函数、类都是一个新的 block,当 Python 运行的时候会为它们创建各自的名字空间。

所以名字空间是名字(变量)的上下文环境,名字的含义取决于名字空间。更具体的说,一个变量绑定的对象是不确定的,需要由名字空间来决定。

位于同一个作用域的代码可以直接访问作用域中出现的名字,即所谓的直接访问;但不同作用域,则需要通过访问修饰符.进行属性访问。

如果想在 B 里面访问 A 里面的内容,要通过A.属性的方式,表示通过 A 来获取 A 里面的属性。但是访问 B 的内容就不需要了,因为都是在同一个作用域,所以直接访问即可。

访问名字这样的行为被称为名字引用,名字引用的规则决定了 Python 程序的行为。

还是上面的代码,如果把函数里面的赋值语句给删掉,那么再执行程序会有什么后果呢?从 Python 层面来看,由于函数的作用域里面没有 number这个变量,显然会寻找外部的 number。因此我们可以得到如下结论:

作用域是层层嵌套的;

内层作用域可以访问外层作用域;

外层作用域无法访问内层作用域,尽管我们没有试,但是想都不用想。如果是把外层的 number = 123 给去掉,那么最后面的 print(number) 铁定报错;

查找元素会依次从当前作用域向外查找,也就是查找元素时,对应的作用域是按照从小往大、从里往外的方向前进的;

我们说函数、类有自己的作用域,但是模块对应的源文件本身也有相应的作用域。比如:

由于文件本身也有自己的作用域,显然是 global 作用域,所以解释器在运行这个文件的时候,也会为其创建一个名字空间,而这个名字空间就是 global 名字空间。它里面的变量是全局的,或者说是模块级别的,在当前文件的任意位置都可以直接访问。

而函数也有作用域,这个作用域称为 local 作用域,对应 local 名字空间;同时 Python 自身还定义了一个最顶层的作用域,也就是 builtin 作用域,像内置函数、内建对象都在 builtin 里面。

这三个作用域在Python2.2之前就存在了,所以那时候Python的作用域规则被称之为LGB规则:名字引用动作沿着local作用域(local名字空间)、global作用域(global名字空间)、builtin作用域(builtin名字空间)来查找对应的变量。

而获取名字空间,Python也提供了相应的内置函数:

locals 函数:获取当前作用域的 local 名字空间,local 名字空间也称为局部名字空间;

globals 函数:获取当前作用域的 global 名字空间,global 名字空间也称为全局名字空间;

__builtins__函数:或者 import builtins,获取当前作用域的 builtin 名字空间,builtint 名字空间也称为内置名字空间;

每个函数都有自己 local 名字空间,因为不同的函数对应不同的作用域,但是 global 名字空间则是全局唯一。

但是注意,我们说 foo 也是一个独立的 block,因此它会对应一个 PyCodeObject。但是在解释到def foo的时候,会根据这个 PyCodeObject 对象创建一个 PyFunctionObject对象,然后将字符串 foo 和这个函数对象绑定起来。

当调用 foo 的时候,再根据 PyFunctionObject 对象创建 PyFrameObject 对象、然后执行,这些留在介绍函数的时候再细说。但是我们看到 foo 也是一个全局变量,全局变量都在 global 名字空间中。

总之,global名字空间全局唯一,它是程序运行时的全局变量和与之绑定的对象的容身之所,你在任何一个地方都可以访问到 global 名字空间。正如,你在任何一个地方都可以访问相应的全局变量一样。

此外,我们说名字空间是一个字典,变量和对象会以键值对的形式存在里面。那么换句话说,如果我手动地往这个 global 名字空间里面添加一个键值对,是不是也等价于定义一个全局变量呢?

我们看到确实如此,通过往 global 名字空间里面插入一个键值对完全等价于定义一个全局变量。并且 global 名字空间是唯一的,你在任何地方调用 globals() 得到的都是 global 名字空间,正如你在任何地方都可以访问到全局变量一样。

所以即使是在函数中向 global 名字空间中插入一个键值对,也等价于定义一个全局变量、并和对象绑定起来。

name="xxx" 等价于 globals["name"]="xxx";

print(name) 等价于 print(globals["name"]);

对于local 名字空间来说,它也对应一个字典,显然这个字典就不是全局唯一的了,每一个局部作用域都会对应自身的 local 名字空间。

显然对于模块来讲,它的local名字空间和global名字空间是一样的,也就是说,模块对应的 PyFrameObject 对象里面的 f_locals 和 f_globals 指向的是同一个 PyDictObject 对象。

但是对于函数而言,局部名字空间和全局名字空间就不一样了。调用 locals 是获取自身的局部名字空间,而不同函数的 local 名字空间是不同的。但是 globals 函数的调用结果是一样的,获取的都是 global 名字空间,这也符合函数内找不到某个变量的时候会去找全局变量这一结论。

所以我们说在函数里面查找一个变量,查找不到的话会找全局变量,全局变量再没有会查找内置变量。本质上就是按照自身的 local 空间、外层的 global 空间、内置的 builtin 空间的顺序进行查找。

因此 local 空间会有很多个,因为每一个函数或者类都有自己的局部作用域,这个局部作用域就可以称之为该函数的 local 空间;但是 global 空间则全局唯一,因为该字典存储的是全局变量。无论你在什么地方,通过调用 globals 函数拿到的永远是全局名字空间,向该空间中添加键值对,等价于创建全局变量。

对于 builtin 名字空间,它也是一个字典。当 local 空间、global 空间都没有的时候,会去 builtin 空间查找。那么 builtin 名字空间如何获取呢?答案是使用 builtins 模块,通过 builtins.__dict__ 即可拿到 builtin 名字空间。

这里提一下Python2当中,while 1比while True要快,为什么?

因为 True 在 Python2 中不是关键字,所以它是可以作为变量名的。那么 Python 在执行的时候就要先看 local 空间和 global 空间里有没有 True 这个变量,有的话使用我们定义的,没有的话再使用内置的 True。

而 1 是一个常量,直接加载就可以,所以 while True 多了符号查找这一过程。但是在 Python3 中两者就等价了,因为 True 在 Python3 中是一个关键字,也会直接作为一个常量来加载。

我们往 global 空间添加一个键值对相当于定义一个全局变量,那么如果往函数的 local 空间里面添加一个键值对,是不是也等价于创建了一个局部变量呢?

对于全局变量来讲,变量的创建是通过向字典添加键值对的方式实现的。因为全局变量会一直在变,需要使用字典来动态维护。

但对于函数来讲,内部的变量是通过静态方式存储和访问的,因为局部作用域中存在哪些变量在编译的时候就已经确定了,我们通过 PyCodeObject 的 co_varnames 即可获取内部都有哪些变量。

所以,虽然我们说遍历查找是按照 LGB 的方式,但是访问函数内部的变量其实是静态访问的,不过完全可以按照 LGB 的方式理解。关于这方面的细节,后续还会细说。

因此名字空间是 Python 的灵魂,它规定了 Python 变量的作用域,使得 Python 对变量的查找变得非常清晰。

前面说的 LGB 是针对 Python2.2 之前的,而从 Python2.2 开始,由于引入了嵌套函数,所以最好的方式应该是内层函数找不到某个变量时先去外层函数找,而不是直接就跑到 global 空间里面找。那么此时的规则就是LEGB:

调用 f,实际上调用的是函数 bar,最终输出的结果是 2。如果按照 LGB 的规则来查找的话,由于函数 bar 的作用域没有 a,那么应该到全局里面找,打印的结果是 1 才对。

但我们之前说了,作用域仅仅是由文本决定的,函数 bar 位于函数 foo 之内,所以函数 bar 定义的作用域内嵌于函数 foo 的作用域之内。换句话说,函数 foo 的作用域是函数 bar 的直接外围作用域。

所以应该先从 foo 的作用域里面找,如果没有那么再去全局里面找。而作用域和名字空间是对应的,名字空间是作用域的动态体现,所以最终打印了 2。

另外在执行f = foo()的时候,会执行函数 foo 中的def bar():语句,这个时候解释器会将a=2与函数 bar捆绑在一起,然后返回,这个捆绑起来的整体就叫做闭包。

所以:闭包 = 内层函数 + 引用的外层作用域的变量

这里显示的规则就是 LEGB,其中 E 表示 enclosing,代表直接外围作用域。

有一个很奇怪的问题,最开始学习 Python 的时候,估计很多人都为此感到困惑,下面来看一下。

首先这段代码打印 1,这显然是没有问题的,不过下面问题来了。

仅仅是在 print 语句后面新建了一个变量 a,结果就报错了,提示局部变量 a 在赋值之前就被引用了,这是怎么一回事,相信肯定有人为此困惑。而想弄明白这个错误的原因,需要深刻理解两点:

一个赋值语句所定义的变量,在这个赋值语句所在的整个作用域内都是可见的;

函数中的变量是静态存储、静态访问的, 内部有哪些变量在编译的时候就已经确定;

在编译的时候,因为存在a = 2这条语句,所以知道函数中存在一个局部变量 a,那么查找的时候就会在当前作用域中查找。但是还没来得及赋值,就 print(a) 了,所以报错:局部变量a在赋值之前就被引用了。但如果没有a = 2这条语句则不会报错,因为知道局部作用域中不存在 a 这个变量,所以会找全局变量 a,从而打印 1。

更有趣的东西隐藏在字节码当中,我们可以通过反汇编来查看一下:

中间的序号代表字节码的偏移量,我们看第二条,g 的字节码是 LOAD_GLOBAL,意思是在 global 名字空间中查找;而 f 的字节码是LOAD_FAST,表示静态查找。因此结果说明 Python 采用了静态作用域策略,在编译的时候就已经知道了名字藏身于何处。

而且上面的例子也表明,一旦函数内有了对某个名字的赋值操作,这个名字就会在作用域内可见,就会出现在 local 名字空间中。换句话说,会遮蔽外层作用域中相同的名字。

当然 Python 也为我们精心准备了 global 关键字,让我们在函数内部修改全局变量。比如函数内部出现了global a,就表示我后面的 a 是全局的,直接到 global 名字空间里面去找,不要在 local 空间里面找了。

但如果外层函数里面也出现了变量 a,而我们想修改的也是外层函数的 a、不是全局的 a,这时该怎么办呢?Python 同样为我们准备了关键字 nonlocal,但是使用 nonlocal 的时候,必须是在内层函数里面。

我们知道,自定义的类里面如果没有 __slots__,那么这个类的实例对象都会有一个属性字典。

当然模块也有属性字典,本质上和普通的类的实例对象是一致的。

另外这个__builtins__位于global 名字空间里面,然后获取 global 名字空间的globals又是一个内置函数,于是一个神奇的事情就出现了。

所以 global 名字空间和 builtin 名字空间,都保存了指向彼此的指针,不管套娃多少次,都是可以的。

本文:Python中的作用域与名字空间实例分析的详细内容,希望对您有所帮助,信息来源于网络。
上一篇:cv2.imread和cv2.imdecode怎么使用下一篇:

11 人围观 / 0 条评论 ↓快速评论↓

(必须)

(必须,保密)

阿狸1 阿狸2 阿狸3 阿狸4 阿狸5 阿狸6 阿狸7 阿狸8 阿狸9 阿狸10 阿狸11 阿狸12 阿狸13 阿狸14 阿狸15 阿狸16 阿狸17 阿狸18