python如何使用生成器(python,开发技术)

python如何使用生成器

导读：本文共6000字符，通常情况下阅读需要20分钟。同时您也可以点击右侧朗读，来听本文内容。按键盘←（左） →（右）方向键可以翻页。

摘要：生成器如果在一个方法内，包含了 yield 关键字，那么这个函数就是一个「生成器」。生成器其实就是一个特殊的迭代器，它可以像迭代器那样，迭代输出方法内的每个元素。我们来看一个包含 yield 关键字的方法：#coding:utf8#生成器defgen(n):foriinrange(n):yieldig=gen(5)#创建一个生成器print(g)... ...

音频解说

我们看到，当执行 g.__next__()时，代码就会执行到 yield 处，然后返回 yield 后面的值，如果继续调用 g.__next__()，注意，你会发现，这次执行的开始位置，是上次 yield 结束的地方，并且它还保留了上一次执行的上下文，继续向后迭代。

这就是使用 yield 的作用，在迭代生成器时，每一次执行都可以保留上一次的状态，而不是像普通方法那样，遇到 return 就返回结果，下一次执行只能再次重复上一次的流程。

生成器除了能保存状态之外，我们还可以通过其他方式，改变其内部的状态，这就是下面要讲的 send 和 throw 方法。

上面的例子中，我们只展示了在 yield 后有值的情况，其实还可以使用 j = yield i 这种语法，我们看下面的代码：

此时如果我们执行下面的代码：

输出结果会是 1 2 4 8 16 32 64 ... 一直循环下去，直到我们杀死这个进程才能停止。

这段代码一直循环的原因在于，它无法执行到 j == -1 这个分支里 break 出来，如果我们想让代码执行到这个地方，如何做呢？

这里就要用到生成器的 send 方法了，send 方法可以把外部的值传入生成器内部，从而改变生成器的状态。

代码可以像下面这样写：

当我们执行 g.send(-1) 时，相当于把 -1 传入到了生成器内部，然后赋值给了 yield 前面的 j，此时 j = -1，然后这个方法就会 break 出来，不会继续迭代下去。

外部除了可以向生成器内部传入一个值外，还可以传入一个异常，也就是调用 throw 方法：

这个例子创建好生成器后，使用 g.throw(ValueError) 的方式，向生成器内部传入了一个异常，走到了生成器异常处理的分支逻辑。

生成器的 close 方法也比较简单，就是手动关闭这个生成器，关闭后的生成器无法再进行操作。

了解了 yield 和生成器的使用方式，那么 yield 和生成器一般用在哪些业务场景中呢？

下面我介绍几个例子，分别是大集合的生成、简化代码结构、协程与并发，你可以参考这些使用场景来使用 yield。

如果你想生成一个非常大的集合，如果使用 list 创建一个集合，这会导致在内存中申请一个很大的存储空间，例如想下面这样：

这种场景，我们使用生成器就能很好地解决这个问题。

因为生成器只有在执行到 yield 时才会迭代数据，这时只会申请需要返回元素的内存空间，代码可以这样写：

我们在开发时还经常遇到这样一种场景，如果一个方法要返回一个 list，但这个 list 是多个逻辑块组合后才能产生的，这就会导致我们的代码结构变得很复杂：

这种情况下，我们只能在每个逻辑块内使用 append 向 list 中追加元素，代码写起来比较啰嗦。

此时如果使用 yield 来生成这个 list，代码就简洁很多：

使用 yield 后，就不再需要定义 list 类型的变量，只需在每个逻辑块直接 yield 返回元素即可，可以达到和前面例子一样的功能。

我们看到，使用 yield 的代码更加简洁，结构也更清晰，另外的好处是只有在迭代元素时才申请内存空间，降低了内存资源的消耗。

还有一种场景是 yield 使用非常多的，那就是「协程与并发」。

如果我们想提高程序的执行效率，通常会使用多进程、多线程的方式编写程序代码，最常用的编程模型就是「生产者-消费者」模型，即一个进程 / 线程生产数据，其他进程 / 线程消费数据。

在开发多进程、多线程程序时，为了防止共享资源被篡改，我们通常还需要加锁进行保护，这样就增加了编程的复杂度。

在 Python 中，除了使用进程和线程之外，我们还可以使用「协程」来提高代码的运行效率。

什么是协程？

简单来说，由多个程序块组合协作执行的程序，称之为「协程」。

而在 Python 中使用「协程」，就需要用到 yield 关键字来配合。

可能这么说还是太好理解，我们用 yield 实现一个协程生产者、消费者的例子：

这个程序的执行流程如下：

c = consumer() 创建一个生成器对象

producer(c) 开始执行，c.__next()__ 会启动生成器 consumer 直到代码运行到 j = yield i 处，此时 consumer 第一次执行完毕，返回

producer 函数继续向下执行，直到 c.send(i) 处，这里利用生成器的 send 方法，向 consumer 发送数据

consumer 函数被唤醒，从 j = yield i 处继续开始执行，并且接收到 producer 传来的数据赋值给 j，然后打印输出，直到再次执行到 yield 处，返回

producer 继续循环执行上面的过程，依次发送数据给 cosnumer，直到循环结束

最终 c.close() 关闭 consumer 生成器，程序退出

在这个例子中我们发现，程序在 producer 和 consumer 这 2 个函数之间来回切换执行，相互协作，完成了生产任务、消费任务的业务场景，最重要的是，整个程序是在单进程单线程下完成的。

这个例子用到了上面讲到的 yield、生成器的 __next__、send、close 方法。如果不好理解，你可以多看几遍这个例子，最好自己测试一下。

我们使用协程编写生产者、消费者的程序时，它的好处是：

整个程序运行过程中无锁，不用考虑共享变量的保护问题，降低了编程复杂度
程序在函数之间来回切换，这个过程是用户态下进行的，不像进程 / 线程那样，会陷入到内核态，这就减少了内核态上下文切换的消耗，执行效率更高
所以，Python 的 yield 和生成器实现了协程的编程方式，为程序的并发执行提供了编程基础。

Python 中的很多第三方库，都是基于这一特性进行封装的，例如 gevent、tornado，它们都大大提高了程序的运行效率。

本文：python如何使用生成器的详细内容，希望对您有所帮助，信息来源于网络。

python如何使用生成器(python,开发技术)

目录

5 人围观 / 0 条评论 ↓快速评论↓

搜索

最新文章

猜你喜欢

特价优惠

标签

流量统计