Linux文件系统之缓冲区介绍_F11 - 专业站长和开发者的学习网站

分享到

Linux文件系统之缓冲区介绍

linux 来源：互联网作者：佚名发布时间：2024-02-26 22:00:48 人浏览

摘要

一、先看现象 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 #include stdio.h #include string.h #include unistd.h int main() { const char* fstr = Hello fwrite\n; const char* str = Hello write\n; printf(Hello printf\n); fprintf(stdout, Hello fprint

一、先看现象

#include <stdio.h>

#include <string.h>

#include <unistd.h>

int main()

{

const char* fstr = "Hello fwrite\n";

const char* str = "Hello write\n";

printf("Hello printf\n");

fprintf(stdout, "Hello fprintf\n");

fwrite(fstr, strlen(fstr), 1, stdout); // 返回值是写入成功的快数

write(1, str, strlen(str)); // 返回值是写入成功的字节数

// fork();

return 0;

}

在这里插入图片描述

结构分析：带 fork 的输出重定向最终把有一些内容向 log.txt 文件中写入了多次，并且打印顺序也有所不同。

int main()

{

const char* fstr = "Hello fwrite";

const char* str = "Hello write";

printf("Hello printf");

fprintf(stdout, "Hello fprintf");

fwrite(fstr, strlen(fstr), 1, stdout); // 返回值是写入成功的快数

close(1);

// write(1, str, strlen(str)); // 返回值是写入成功的字节数

// fork();

return 0;

}

在这里插入图片描述

结果分析：代码中只使用了库函数向显示器中进行写入，并且在字符串的结尾没有加 \n，在最后面将标准输出对应的文件描述符进行了关闭，最终显示器上什么也没有。上一段代码在字符串的结尾加上了 \n 最终字符串被成功的打印到了屏幕上。

int main()

{

const char* str = "Hello write";

write(1, str, strlen(str)); // 返回值是写入成功的字节数

close(1);

return 0;

}

在这里插入图片描述

结果分析：字符串的结尾依然不加 \n，但是这一次采用系统调用接口，最后仍然将标准输出对应的文件描述符进行关闭，这一次字符串被成功的打印了出来。

二、用户缓冲区的引入

write 为什么能将不带 \n 的字符串写入到显示器文件中。首先我们需要明确一点进程打开的每一个文件都有一个属于自己的操作系统级别的文件缓冲区，该缓冲区的存在，可以减少对外设的读写操作以提高计算机的效率。举个栗子，在一个进程中向磁盘里的同一个文件进多次行写入，文件缓冲区的存在，可以将每次写入的内容先存储在文件缓冲区中，最后在程序退出或者调用 close 的时候，一次性将文件缓冲区中的所有内容刷新到磁盘。如果没有该文件缓冲区，那在进程里对文件进行 n 次写操做，就要对应 n 次向磁盘的写操作，CPU 和外设之间是存在非常大的速度差的，这样效率会非常低。

write 作为系统调用接口，它就是直接向文件缓冲区中写入，最后在调用 close 接口或者程序退出的时候，会将文件缓冲区的内容刷新到对应的外设中。

printf、fprintf、fwrite 底层一定是封装了 write 系统调用接口，那为什么使用 write 系统调用接口就可以将字符串写入到显示器，使用 C 库函数没能把字符串写入到显示器文件？原因在进度条的那篇文章中讲过，我们使用的这些 C 库函数，是把字符串写入到了缓冲区中，这个缓冲区和上面的文件缓冲区有所不同，这里说的缓冲区是 C 语言给我们提供的语言层面的缓冲区，也叫做用户级缓冲区，\n 具有刷新用户级缓冲区的作用，因此不加 \n 并且在程序结束前将显示器对应的文件描述符进行了关闭，最终就导致字符串在用户级缓冲区中，没有被刷新到文件缓冲区，所以屏幕上就什么也没有。这里我们可以肯定，在这些 C 库函数中，并不是立即调用 write 接口，而是在遇到 \n 后才去调用 write 接口将用户缓冲区的内容刷新到文件缓冲区中。

在这里插入图片描述

总结：使用 C 系统调用接口向文件中写入，写入的内容先被存储在用户缓冲区中，在合适的时候（遇到 \n）才会进行刷新，这里刷新的本质是调用 write 将数据从用户缓冲区写入内核。

之前说的 exit 会刷新缓冲区，其实就是刷新用户缓冲区，因为 exit 作为 C 库函数，可以看见用户缓冲区，而 _exit 作为系统调用接口，无法看到语言层面的用户缓冲区，因此也就无法刷新用户缓冲区。

三、用户缓冲区的刷新策略

无缓冲：直接刷新，数据不在用户缓冲区中停留。
行缓冲：不刷新，直到碰到 \n。
全缓冲：缓冲区满了才刷新。

所谓刷新就是调用 write 接口将数据写入操作系统中的文件缓冲区。显示器文件对应采用的就是行缓冲，向磁盘文件中写入采用的是全缓冲。进程在退出的时候也会刷新用户缓冲区，还可以调用 fflush 进行刷新。

四、为什么要有用户缓冲区

解决效率问题，缓冲区就像菜鸟驿站，不需要我们自己坐火车坐飞机去送东西，而是直接交给菜鸟驿站，然后就可以干自己的事情了，菜鸟驿站可以选择攒上一大批快递然后统一寄送出去。用户缓冲区的存在本质上提高了 C 语言的效率，也就是提高了用户的效率，因为 C 语言是程序员在使用，在使用 C 库函数进行文件写入时，大部分情况只需要把数据交给缓冲区，然后就可以快速的返回，不需要每一次都亲力亲为的去和操作系统打交道。
配合格式化，有些和文件写入相关的 C 库函数是格式化输出函数，在我们看来，它可以写入整形、符点型，但是最终都是以字符串的形式进行写入。格式化就是将类型全都转化成字符串，先写入到用户缓冲区，用户缓冲区中存的一定都是字符串。

用户缓冲区，有进也有出，将数据写入到用户缓冲区中就就叫做进，将用户缓冲区中的数据刷新到内核中的文件缓冲区中，被刷新的数据就可以从用户缓冲区中删掉，这就叫做出。用户缓冲就像就像水流一样源源不断，流的概念就是因此而来。

小Tips：FILE 里面就有对应打开文件的缓冲区字段和维护信息。每个被进程打开文件都有自己对应的文件缓冲区。FILE 对象属于用户，用户缓冲区可以看作是在堆上申请的一块空间。

五、现象解释

这下再来解释上面代码中有 fork 然后重定向，写入了多次的原因。首先重定向后，将本来向显示器文件写入的内容，写到了磁盘文件，显示器文件的缓冲区采用行缓冲，即遇到 \n 就会刷新，而磁盘文件采用的是全缓冲，当缓冲区满了才刷新。因此在重定向后，会把三条 C 库函数写入的内容全部保存到缓冲区中，然后调用 fork 创建子进程，此时父子进程代码共享，数据写时拷贝，在程序退出的时候回去刷新用户缓冲区，上面说过，刷新就是将用户缓冲区中的数据写入到内核，然后将用户缓冲区中的内容清空，上面还说过，缓冲区就是在堆上申请的一段空间，可以看作数据部分，因为要删除数据，所以就会进行写时拷贝，此时之前父进程用户缓冲区中的内容就会给子进程拷贝一份，然后父子进程都执行刷新动作，各自刷新自己的缓冲区数据，这就是为什么最终出现多份的原因。没有重定向，只向显示器打印四条消息，是因为显示器采用的是行刷新策略，在调用 fork 前，对应的字符串就已经被刷新出去了。在 fork 的时候，父进程的用户缓冲区中是空的，什么也没有。

磁盘文件全缓冲验证：

int main()

{

const char* fstr = "Hello fwrite\n";

const char* str = "Hello write\n";

printf("Hello printf\n");

sleep(2);

fprintf(stdout, "Hello fprintf\n");

sleep(2);

fwrite(fstr, strlen(fstr), 1, stdout); // 返回值是写入成功的快数

sleep(2);

write(1, str, strlen(str)); // 返回值是写入成功的字节数

sleep(5);

fork();

return 0;

}

在这里插入图片描述

分析：最先将 write 内容写入到文件中，因为它是直接写入到文件缓冲区，而剩下的 C 库函数对应的内容是统一一次全部刷新到内核，即使每个字符串后面都有 \n，但最后还是统一全部刷新，这就证明了磁盘文件采用的是全刷新策略。

您可能感兴趣的文章 :

原文链接 :

Tag : Linux(73)

Linux杀死指定端口的进程的教程

Linux杀死指定端口的进程 1.查看端口终端输入：lsof -i tcp:port 将port换成被占用的端口(如：8080) 将会出现占用端口的进程信息。 2.kill进程找
Linux文件系统之缓冲区介绍

一、先看现象 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 #include stdio.h #include string.h #include unistd.h int main() { const char* fstr = Hello fwrite\n; const char* str
linux网络知识之iptables的规则介绍

iptables规则下图为数据包到达linux主机网卡后，内核如何处理数据包的大致流程什么是规则规则是管理员对数据包制定的一种触发机制，即
Linux包管理工具yum、apt的区别介绍

一般来说著名的 Linux 系统基本上分两大类：RedHat 系列：Redhat、Centos、Fedora 等；Debian 系列：Debian、Ubuntu 等。 yum（ Yellow dog Updater, Modified）是
linux命令:echo使用介绍

Shell中的echo命令类似于php中的echo命令，都是用于输出。Shell中另有一个输出命令为printf命令，大家可以在Shell printf 命令中查阅学习。本文中
红帽RHEL8和7的区别对比介绍(Centos8与7参照redhat)

红帽RHEL8与RHEL7的区别 1. 红帽RHEL8和RHEL7功能区别对比 1.1 默认的文件系统 RHEL8与RHEL7都是采用XFS 1.2 RHEL8与RHEL7的内核版本分别是多少关于内核
apache-zookeeper-3.7.1的安装部署教程

apache-zookeeper-3.7.1 安装部署下载地址：https://mirrors.bfsu.edu.cn/apache/zookeeper/ apache-zookeeper-3.7.1 1.下载直接解压，进入../conf/目录下复制一份zoo
Linux版本中Nginx平滑升级与回退介绍

一、平滑升级概述 1.平滑升级的定义在进行服务版本升级的时候，对于用户访问体验无感知，不会造成服务中断。 2.平滑升级的思路（1）
微服务之注册中心和配置中心Consul介绍

注册中心注册中心选型你有没有思考过这样一个问题，为什么会有这么多的注册中心(etcd/ZooKeeper/Consul)，选用那个最适合自己,是不是在选用
Linux查看端口占用情况介绍

一、查看已知端口占用情况比如，我们想知道8080端口的使用情况，或者说被谁占用了，命令如下： 1 netstat -anp | grep 8080 结果如下：也可以

Linux文件系统之缓冲区介绍

一、先看现象

二、用户缓冲区的引入

三、用户缓冲区的刷新策略

四、为什么要有用户缓冲区

五、现象解释

您可能感兴趣的文章 :

Linux杀死指定端口的进程的教程

Linux文件系统之缓冲区介绍

linux网络知识之iptables的规则介绍

Linux包管理工具yum、apt的区别介绍

linux命令:echo使用介绍

红帽RHEL8和7的区别对比介绍(Centos8与7参照redhat)

apache-zookeeper-3.7.1的安装部署教程

Linux版本中Nginx平滑升级与回退介绍

微服务之注册中心和配置中心Consul介绍

Linux查看端口占用情况介绍

Linux文件系统之缓冲区介绍

Linux命令之mkdir，cat，touch，vi/vim的介

xshell5使用ssh连接阿里云服务器的教程

实时计算框架Flink集群搭建与运行机制

Apache安装配置避坑指南介绍