1. 什么是 C 语言的隐式函数声明

在 C 语言中,函数在调用前不一定非要声明。如果没有声明,那么编译器会自动按照一种隐式声明的规则,为调用函数的 C 代码产生汇编代码。下面是一个例子:

int main(int argc, char *argv[])
{
    double x = any_name_function();

	return 0;
}

单纯的编译上述源代码,并没有任何报错,只是在链接阶段因为找不到名为 any_name_function 的函数体而报错。

$ gcc -c main.c 
main.c: In function ‘main’:
main.c:3:16: warning: implicit declaration of function ‘any_name_function’ [-Wimplicit-function-declaration]
    3 |     double x = any_name_function();
      |                ^~~~~~~~~~~~~~~~~
$ gcc main.o
/usr/bin/ld: main.o: in function `main':
main.c:(.text+0x19): undefined reference to `any_name_function'
collect2: error: ld returned 1 exit status

之所以编译不会报错,是因为 C 语言规定,对于没有声明的函数,自动使用隐式声明。相当于变成了如下代码:

int any_name_function();
int main(int argc, char *argv[])
{
    double x = any_name_function();

	return 0;
}

2. 带来的问题

2.1 隐式声明函数名称恰好在链接库中存在,但返回非 int 类型

前面给出的例子,并不会造成太大影响,因为在链接阶段很容易发现存在的问题。然而下面这个例子则会造成莫名的运行时错误。

#include <stdio.h>

int main(int argc, char *argv[])
{
    double x = sqrt(5);

    printf("x = %lf\n", x);
    
	return 0;
}

gcc 编译链接

$ gcc -c main.c
main.c: In function ‘main’:
main.c:5:16: warning: implicit declaration of function ‘sqrt’ [-Wimplicit-function-declaration]
    5 |     double x = sqrt(5);
      |                ^~~~
main.c:5:16: warning: incompatible implicit declaration of built-in function ‘sqrt’
main.c:2:1: note: include ‘<math.h>’ or provide a declaration of ‘sqrt’
    1 | #include <stdio.h>
  +++ |+#include <math.h>
    2 | 
$ gcc main.o

运行结果

$ ./a.out 
x = 2.236068

编译时会给出警告,提示隐式声明与内建函数 sqrt() 不兼容。gcc 编译器在编译时能够自动在常用库头文件(内建函数)中查找与隐式声明同名的函数,如果发现两者并不相同,则会按照内建函数的声明原型去生成调用代码。这往往也是程序员预期的想法。

上面的例子中隐式声明的函数原型为:

int sqrt(int);

而对应的同名内建函数原型为:

double sqrt(double);

最终编译器按照内建函数原型进行了编译,达到了预期效果。然而 gcc 编译器的这种行为并不是 C 语言的规范,并不是所有的编译器实现都有这样的功能。同样的源码在 VC++2015 下编译运行的结果却是:

2884223.000000

显然,VC++ 编译器没有所谓的“内建函数”,只是简单的按照隐式声明的原型,生成调用 sqrt() 函数的代码。由于返回类型和参数类型的不同,导致错误的函数调用方式,产生莫名奇妙的运行时错误。

对这种情况,由于返回类型的不同,两种编译器都可以给出警告信息,至少能引起程序员的注意。而下面这种情况,则更加隐蔽。

2.2 隐式声明函数名称恰好在链接库中存在,且返回 int 类型

#include <stdio.h>

int main(int argc, char *argv[])
{
    int x = abs(5);

    printf("x = %d\n", x);
    
	return 0;
}

由于编译器版本较高,依然报了警告。但是,隐式声明的函数原型与库函数完全相同,所以链接、运行都是没有问题的。

$ gcc -c 2.c
2.c: In function ‘main’:
2.c:5:13: warning: implicit declaration of function ‘abs’ [-Wimplicit-function-declaration]
    5 |     int x = abs(5);
$ gcc 2.o
$ ./a.out 
x = 5

下面,稍微改动一下代码:

#include <stdio.h>

int main(int argc, char *argv[])
{
    int x = abs(5, -1, 3, 2);

    printf("x = %d\n", x);
    
	return 0;
}

编译、链接、执行都没有任何报错。可见,gcc 的内建函数机制并不关心函数的参数,只是关心函数的返回值。

$ gcc -c 2.c
2.c: In function ‘main’:
2.c:5:13: warning: implicit declaration of function ‘abs’ [-Wimplicit-function-declaration]
    5 |     int x = abs(5, -1, 3, 2);
      |             ^~~
2.c:5:13: warning: too many arguments to built-in function ‘abs’ expecting 1 [-Wbuiltin-declaration-mismatch]
$ gcc 2.o
$ ./a.out 
x = 5

虽然这个例子的运行结果是正确的,但是这种正确是“碰巧”的,因为额外的函数参数并没有影响到结果。这种偶然正确是程序中要避免的。

3. 编程中注意事项

C 语言的隐式函数声明,给程序员带来了各种困惑,给程序的稳定性带来了非常坏的影响。不知道当初 C 语言设计者是如何考虑这个问题的?

为了避免这种影响,强烈建议程序员重视编译器给出的关于隐式声明的警告,以及通过包含必要的头文件来消除这种警告。

为了避免这种问题,在 C99 版本中,无论如何都会给出警告。

而 C++ 则更加严格,直接抛弃了隐式函数声明,对于未声明函数的调用,直接报错。

$ g++ 2.c
2.c: In function ‘int main(int, char**)’:
2.c:5:13: error: ‘abs’ was not declared in this scope
    5 |     int x = abs(5, -1, 3, 2);
      |             ^~~

在函数强类型这一点上,C++ 确实比 C 更严格、更谨慎。