6.5 标准I/O编程
本章前面几节所述的文件及I/O读写都是基于文件描述符的。这些都是基本的I/O控制,是不带缓存的。而本节所要讨论的I/O操作都是基于流缓冲的,它是符合ANSI C的标准I/O处理,这里有很多函数读者已经非常熟悉了(如printf()、scantf()函数等),因此本节中仅简要介绍最主要的函数。
前面讲述的系统调用是操作系统直接提供的函数接口。因为运行系统调用时,Linux必须从用户态切换到内核态,执行相应的请求,然后再返回到用户态,所以应该尽量减少系统调用的次数,从而提高程序的效率。
标准I/O提供流缓冲的目的是尽可能减少使用read()和write()等系统调用的数量。标准I/O提供了3种类型的缓冲存储。
n 全缓冲:在这种情况下,当填满标准I/O缓存后才进行实际I/O操作。存放在磁盘上的文件通常是由标准I/O库实施全缓冲的。在一个流上执行第一次I/O操作时,通常调用malloc()就是使用全缓冲。
n 行缓冲:在这种情况下,当在输入和输出中遇到行结束符时,标准I/O库执行I/O操作。这允许我们一次输出一个字符(如fputc()函数),但只有写了一行之后才进行实际I/O操作。标准输入和标准输出就是使用行缓冲的典型例子。
n 不带缓冲:标准I/O库不对字符进行缓冲。如果用标准I/O函数写若干字符到不带缓冲的流中,则相当于用系统调用write()函数将这些字符全写到被打开的文件上。标准出错stderr通常是不带缓存的,这就使得出错信息可以尽快显示出来,而不管它们是否含有一个行结束符。
在下面讨论具体函数时,请读者注意区分以上的三种不同情况。
6.5.1 基本操作
1.打开文件
(1)函数说明。
打开文件有三个标准函数,分别为:fopen()、fdopen()和freopen()。它们可以以不同的模式打开,但都返回一个指向FILE的指针,该指针指向对应的I/O流。此后,对文件的读写都是通过这个FILE指针来进行。其中fopen()可以指定打开文件的路径和模式,fdopen()可以指定打开的文件描述符和模式,而freopen()除可指定打开的文件、模式外,还可指定特定的I/O流。
(2)函数格式定义。
fopen()函数格式如表6.14所示。
表6.14 fopen()函数语法要点
所需头文件 |
#include <stdio.h> |
函数原型 |
FILE * fopen(const char * path, const char * mode) |
函数传入值 |
Path:包含要打开的文件路径及文件名 |
mode:文件打开状态(后面会具体说明) |
|
函数返回值 |
成功:指向FILE的指针 |
其中,mode类似于open()函数中的flag,可以定义打开文件的访问权限等,表6.15说明了fopen()中mode的各种取值。
表6.15 mode取值说明
r或rb |
打开只读文件,该文件必须存在 |
r+或r+b |
打开可读写的文件,该文件必须存在 |
W或wb |
打开只写文件,若文件存在则文件长度清为0,即会擦写文件以前的内容。若文件不存在则建立该文件 |
w+或w+b |
打开可读写文件,若文件存在则文件长度清为0,即会擦写文件以前的内容。若文件不存在则建立该文件 |
a或ab |
以附加的方式打开只写文件。若文件不存在,则会建立该文件;如果文件存在,写入的数据会被加到文件尾,即文件原先的内容会被保留 |
a+或a+b |
以附加方式打开可读写的文件。若文件不存在,则会建立该文件;如果文件存在,写入的数据会被加到文件尾后,即文件原先的内容会被保留 |
注意在每个选项中加入b字符用来告诉函数库打开的文件为二进制文件,而非纯文本文件。不过在Linux系统中会自动识别不同类型的文件而将此符号忽略。
fdopen()函数格式如表6.16所示。
表6.16 fdopen()函数语法要点
所需头文件 |
#include <stdio.h> |
函数原型 |
FILE * fdopen(int fd, const char * mode) |
函数传入值 |
fd:要打开的文件描述符 |
mode:文件打开状态(后面会具体说明) |
|
函数返回值 |
成功:指向FILE的指针 |
freopen()函数格式如表6.17所示。
表6.17 freopen()函数语法要点
所需头文件 |
#include <stdio.h> |
函数原型 |
FILE * freopen(const char *path, const char * mode, FILE * stream) |
函数传入值 |
path:包含要打开的文件路径及文件名 |
mode:文件打开状态(后面会具体说明) |
|
stream:已打开的文件指针 |
|
函数返回值 |
成功:指向FILE的指针 |
2.关闭文件
(1)函数说明。
关闭标准流文件的函数为fclose(),该函数将缓冲区内的数据全部写入到文件中,并释放系统所提供的文件资源。
(2)函数格式说明。
fclose()函数格式如表6.18所示。
表6.18 fclose()函数语法要点
所需头文件 |
#include <stdio.h> |
函数原型 |
int fclose(FILE * stream) |
函数传入值 |
stream:已打开的文件指针 |
函数返回值 |
成功:0 |
3.读文件
(1)fread()函数说明。
在文件流被打开之后,可对文件流进行读写等操作,其中读操作的函数为fread()。
(2)fread()函数格式。
fread()函数格式如表6.19所示。
表6.19 fread()函数语法要点
所需头文件 |
#include <stdio.h> |
函数原型 |
size_t fread(void * ptr,size_t size,size_t nmemb,FILE * stream) |
函数传入值 |
ptr:存放读入记录的缓冲区 |
size:读取的记录大小 |
|
nmemb:读取的记录数 |
|
stream:要读取的文件流 |
|
函数返回值 |
成功:返回实际读取到的nmemb数目 |
4.写文件
(1)fwrite()函数说明。
fwrite()函数用于对指定的文件流进行写操作。
(2)fwrite()函数格式。
fwrite()函数格式如表6.20所示。
表6.20 fwrite()函数语法要点
所需头文件 |
#include <stdio.h> |
函数原型 |
size_t fwrite(const void * ptr,size_t size, size_t nmemb, FILE * stream) |
续表
函数传入值 |
ptr:存放写入记录的缓冲区 |
size:写入的记录大小 |
|
nmemb:写入的记录数 |
|
stream:要写入的文件流 |
|
函数返回值 |
成功:返回实际写入的记录数目 |
5.使用实例
下面实例的功能跟底层I/O操作的实例基本相同,运行结果也相同(请参考6.3.1节的实例),只是用标准I/O库的文件操作来替代原先的底层文件系统调用而已。
读者可以观察哪种方法的效率更高,其原因又是什么。
#include <stdlib.h>
#include <stdio.h>
#define BUFFER_SIZE 1024 /* 每次读写缓存大小 */
#define SRC_FILE_NAME "src_file" /* 源文件名 */
#define DEST_FILE_NAME "dest_file" /* 目标文件名文件名 */
#define OFFSET 10240 /* 复制的数据大小 */
int main()
{
FILE *src_file, *dest_file;
unsigned char buff[BUFFER_SIZE];
int real_read_len;
/* 以只读方式打开源文件 */
src_file = fopen(SRC_FILE_NAME, "r");
/* 以写方式打开目标文件,若此文件不存在则创建 */
dest_file = fopen(DEST_FILE_NAME, "w");
if (!src_file || !dest_file)
{
printf("Open file error\n");
exit(1);
}
/* 将源文件的读写指针移到最后10KB的起始位置*/
fseek(src_file, -OFFSET, SEEK_END);
/* 读取源文件的最后10KB数据并写到目标文件中,每次读写1KB */
while ((real_read_len = fread(buff, 1, sizeof(buff), src_file)) > 0)
{
fwrite(buff, 1, real_read_len, dest_file);
}
fclose(dest_file);
fclose(src_file);
return 0;
}
读者可以尝试用其他文件打开函数进行练习。
6.5.2 其他操作
文件打开之后,根据一次读写文件中字符的数目可分为字符输入输出、行输入输出和格式化输入输出,下面分别对这3种不同的方式进行讲解。
1.字符输入输出
字符输入输出函数一次仅读写一个字符。其中字符输入输出函数如表6.21和表6.22所示。
表6.21 字符输出函数语法要点
所需头文件 |
#include <stdio.h> |
函数原型 |
int getc(FILE * stream) |
函数传入值 |
stream:要输入的文件流 |
函数返回值 |
成功:下一个字符 |
表6.22 字符输入函数语法要点
所需头文件 |
#include <stdio.h> |
函数原型 |
int putc(int c, FILE * stream) |
函数返回值 |
成功:字符c |
这几个函数功能类似,其区别仅在于getc()和putc()通常被实现为宏,而fgetc()和fputc()不能实现为宏,因此,函数的实现时间会有所差别。
下面这个实例结合fputc()和fgetc()将标准输入复制到标准输出中去。
/*fput.c*/
#include<stdio.h>
main()
{
int c;
/*把fgetc()的结果作为fputc()的输入*/
fputc(fgetc(stdin), stdout);
}
运行结果如下所示:
$ ./fput
w(用户输入)
w(屏幕输出)
2.行输入输出
行输入输出函数一次操作一行。其中行输入输出函数如表6.23和表6.24所示。
表6.23 行输出函数语法要点
所需头文件 |
#include <stdio.h> |
函数原型 |
char * gets(char *s) |
函数传入值 |
s:要输入的字符串 |
函数返回值 |
成功:s |
表6.24 行输入函数语法要点
所需头文件 |
#include <stdio.h> |
函数原型 |
int puts(const char *s) |
函数传入值 |
s:要输出的字符串 |
函数返回值 |
成功:s |
这里以gets()和puts()为例进行说明,本实例将标准输入复制到标准输出,如下所示:
/*gets.c*/
#include<stdio.h>
main()
{
char s[80];
/*同上例,把fgets()的结果作为fputs()的输入*/
fputs(fgets(s, 80, stdin), stdout);
}
运行该程序,结果如下所示:
$ ./gets
This is stdin(用户输入)
This is stdin(屏幕输出)
3.格式化输入输出
格式化输入输出函数可以指定输入输出的具体格式,这里有读者已经非常熟悉的printf()、scanf()等函数,这里就简要介绍一下它们的格式,如表6.25~表6.27所示。
表6.25 格式化输出函数1
所需头文件 |
#include <stdio.h> |
函数原型 |
int printf(const char *format,…) |
函数传入值 |
format:记录输出格式 |
函数返回值 |
成功:输出字符数(sprintf返回存入数组中的字符数) |
表6.26 格式化输出函数2
所需头文件 |
#include <stdarg.h> |
函数原型 |
int vprintf(const char *format, va_list arg) |
函数传入值 |
format:记录输出格式 |
函数返回值 |
成功:存入数组的字符数 |
表6.27 格式化输入函数
所需头文件 |
#include <stdio.h> |
函数原型 |
int scanf(const char *format,…) |
函数传入值 |
format:记录输出格式 |
函数返回值 |
成功:输出字符数(sprintf返回存入数组中的字符数) |
由于本节的函数用法比较简单,并且比较常用,因此就不再举例了,请读者需要用到时自行查找其用法。