Node.js中stream模块怎么用(node.js,stream,web开发)

Node.js中stream模块怎么用

导读：本文共6755.5字符，通常情况下阅读需要23分钟。同时您也可以点击右侧朗读，来听本文内容。按键盘←（左） →（右）方向键可以翻页。

摘要： Node.js 流的类型Node.js stream 提供了四种类型的流可读流（Readable Streams）可写流（Writable Streams）双工流（Duplex Streams）转换流（Transform Streams）更多详情请查看 Node.js 官方文档https://nodejs.org/api/stream.html#stream_t... ...

音频解说

highWaterMark 属性作为一个选项传递给 fs.createReadStream，用于决定该流中有多少数据缓冲。然后数据被冲到读取机制（在这个案例中，是我们的 data 处理程序）。默认情况下，可读 fs 流的 highWaterMark 值是 64kb。我们刻意重写该值为 20 字节用于触发多个 data 事件。

如果你运行上述程序，它会在五个迭代内从 myfile 中读取 85 个字节。你会在 console 看到以下输出：

从可读流中读取数据的另一种方法是使用异步迭代器：

如果你运行这个程序，你会得到和前面例子一样的输出。

当一个监听器监听到可读流的 data 事件时，流的状态会切换成”流动”状态（除非该流被显式的暂停了）。你可以通过流对象的 readableFlowing 属性检查流的”流动”状态

我们可以稍微修改下前面的例子，通过 data 处理器来示范：

在这个例子中，我们从一个可读流中读取 myfile，但在读取 60 个字节后，我们临时暂停了数据流 1 秒。我们也在不同的时间打印了 readableFlowing 属性的值去理解他是如何变化的。

如果你运行上述程序，你会得到以下输出：

我们可以用以下来解释输出：

当我们的程序开始时，readableFlowing 的值是 null，因为我们没有提供任何消耗流的机制。

在连接到 data 处理器后，可读流变为“流动”模式，readableFlowing 变为 true。

一旦读取 60 个字节，通过调用 pause()来暂停流，readableFlowing 也转变为 false。

在等待 1 秒后，通过调用 resume()，流再次切换为“流动”模式，readableFlowing 改为 `true'。然后剩下的文件内容在流中流动。

因为有流，应用不需要在内存中保留大型的二进制对象：小型的数据块可以接收到就进行处理。

在这部分，让我们组合不同的流来构建一个可以处理大量数据的真实应用。我们会使用一个小型的工具程序来生成一个给定文件的 SHA-256。

但首先，我们需要创建一个大型的 4GB 的假文件来测试。你可以通过一个简单的 shell 命令来完成：

On macOS: mkfile -n 4g 4gb_file

On Linux: xfs_mkfile 4096m 4gb_file

在我们创建了假文件 4gb_file 后，让我们在不使用 stream 模块的情况下来生成来文件的 SHA-256 hash。

如果你运行以上代码，你可能会得到以下错误：

以上报错之所以发生是因为 JavaScript 运行时无法处理随机的大型缓冲。运行时可以处理的最大尺寸的缓冲取决于你的操作系统结构。你可以通过使用内建的 buffer 模块里的 buffer.constants.MAX_LENGTH 变量来查看你操作系统缓存的最大尺寸。

即使上述报错没有发生，在内存中保留大型文件也是有问题的。我们所拥有的可用的物理内存会限制我们应用能使用的内存量。高内存使用率也会造成应用在 CPU 使用方面性能低下，因为垃圾回收会变得昂贵。

现在，让我们看看如何修改应用去使用流且避免遇到这个报错：

在这个例子中，我们使用 crypto.createHash 函数提供的流式方法。它返回一个“转换”流对象 hashStream，为随机的大型文件生成 hash。

为了将文件内容传输到这个转换流中，我们使用 fs.createReadStream 为 4gb_file 创建了一个可读流 inputStream。我们将 hashStream 转换流的输出传递到可写流 outputStream 中，而 checksum.txt 通过 fs.createWriteStream 创建的。

如果你运行以上程序，你将看见在 checksum.txt 文件中看见 4GB 文件的 SHA-256 hash。

在前面的案例中，我们使用 pipeline 函数来连接多个流。另一种常见的方法是使用 .pipe() 函数，如下所示：

但这里有几个原因，所以并不推荐在生产应用中使用 .pipe()。如果其中一个流被关闭或者出现报错，pipe() 不会自动销毁连接的流，这会导致应用内存泄露。同样的，pipe() 不会自动跨流转发错误到一个地方处理。

因为这些问题，所以就有了 pipeline()，所以推荐你使用 pipeline() 而不是 pipe() 来连接不同的流。我们可以重写上述的 pipe() 例子来使用 pipeline() 函数，如下：

pipeline() 接受一个回调函数作为最后一个参数。任何来自被连接的流的报错都将触发该回调函数，所以可以很轻松的在一个地方处理报错。

在 Node.js 中使用流有助于我们构建可以处理大型数据的高性能应用。

在这篇文章中，我们覆盖了：

四种类型的 Node.js 流（可读流、可写流、双工流以及转换流）。

如何通过监听 data 事件或者使用异步迭代器来从可读流中读取数据。

通过使用 pipeline 连接多个流来减少内存占用。

一个简短的警告：你很可能不会遇到太多必须使用流的场景，而基于流的方案会提高你的应用的复杂性。务必确保使用流的好处胜于它所带来的复杂性。

本文：Node.js中stream模块怎么用的详细内容，希望对您有所帮助，信息来源于网络。

Node.js中stream模块怎么用(node.js,stream,web开发)

目录

7 人围观 / 0 条评论 ↓快速评论↓

搜索

最新文章

猜你喜欢

特价优惠

标签

流量统计