C++的内部链接(Internal Linkage)和外部链接(External Linkage)

在C++中,外部链接和内部链接是链接时的概念,主要用于处理不同编译单元(如.cpp文件)之间的符号引用。

外部链接(External Linkage):当一个符号在多个编译单元中使用时保持相同的身份。具有外部链接的符号可以在多个编译单元中定义一次,并在程序链接时合并。通常,全局变量和非内联函数具有外部链接。

内部链接(Internal Linkage):当一个符号只在单个编译单元中有效时,该符号具有内部链接。内部链接可以防止命名冲突,因为其他编译单元不能访问这些符号。通常,使用static关键字定义的全局变量和函数具有内部链接。  

一、简述

1.声明

一个声明将一个名称引入一个作用域;
在c++中,在一个作用域中重复一个声明是合法的
  
以下都是声明:

   int foo(int,int); //函数前置声明 
   typedef int Int; //typedef 声明 
   class bar; //类前置声明 
   extern int g_var; //外部引用声明 
   class bar; //类前置声明 
   typedef int Int; //typedef 声明 
   extern int g_var; //外部引用声明 
   friend test; //友员声明 
   using std::cout; //名字空间引用声明
   friend test; //友员声明 
   using std::cout; //名字空间引用声明
   int foo(int,int); //函数前置声明 

在同一个作用域中你可以多次重复这些声明。
有两种声明不能重复,那就是类成员函数及静态数据成员的声明

   class foo 
   { 
    static int i; 
    static int i;//不可以 
   public: 
    int foo(); 
    int foo();//不可以 
   };

2.定义

一个定义提供一个实体(类型、实例、函数)在一个作用域的唯一描述。
在同一作用域中不可重复定义一个实体。
以下都是定义。

   int y;
   class foo {...};
   struct bar {...};
   foo* p;
   static int i;
   enum Color{RED,GREEN,BLUE};
   const double PI = 3.1415;
   union Rep{...};
   void test(int p) {};
   foo a;
   bar b;

3.编译单元

当一个c或cpp文件在编译时,预处理器首先递归包含头文件,形成一个含有所有 必要信息的单个源文件,这个源文件就是一个编译单元。这个编译单元会被编译成为一个与cpp文件名同名的目标文件(.o或是.obj)。链接程序把不同编译单元中产生的符号联系起来,构成一个可执行程序。

4.自由函数

如果一个函数是自由函数,那么这个函数不是类的成员函数,也不是友元函数。
  

二、下面来看内部链接和外部链接

内部链接:如果一个名称对于它的编译单元来说是局部的,并且在链接时不会与其它编译单元中的同样的名称相冲突,那么这个名称有内部链接(注:有时也将声明看作是无链接的,这里我们统一看成是内部链接的)。

以下情况有内部链接:
   a)所有的声明
   b)名字空间(包括全局名字空间)中的静态自由函数、静态友元函数、静态变量的定义,const常量定义
   c)enum定义
   d)inline函数定义(包括自由函数和非自由函数)
   e)类的定义
   f)union的定义
  
外部链接: 在一个多文件程序中,如果一个名称在链接时可以和其它编译单元交互,那么这个名称就有外部链接。
以下情况有外部链接:
   a)类非inline函数总有外部链接。包括类成员函数和类静态成员函数
   b)类静态成员变量总有外部链接。
   c)名字空间(包括全局名字空间)中非静态自由函数、非静态友元函数及非静态变量

下面举例说明:

a)声明、enum定义、union定义有内部链接

所有的声明、enum定义及union定义在编译后不会产生链接符号,也就是在不同编译单元中有相同名称的声明及enum、union定义并不会在链接时发生发现多个符号的错误。

   // main.cpp
   typedef int Int; //typedef 声明,内部链接
   enum Color{red}; //enum定义,内部链接
   union X //union定义,内部链接
   {
   long a;
   char b[10];
   };
   int main(void)
   {
   Int i = red;
   return i;
   }
   
   // a.cpp
   typedef int Int; //在a.cpp中重声明一个int类型别名,在链接时不会发生错误
   enum Color{blue}; //在a.cpp中重定义了一个enum Color,在链接时不会发生错误
   const Int i =blue; //const常量定义,内部链接
   union X //union定义,内部链接
   {
   long a;
   char b[10];
   };

b)名字空间中静态自由函数、静态友元函数、静态变量、const常量定义有内部链接  

    // main.cpp
   namespace test
   {
   int foo(); //函数声明,内部链接
   static int i = 0; //名字空间静态变量定义,内部链接
   static int foo() { return 0;} //名字空间静态函数定义,内部链接
   }
   static int i = 0; //全局静态变量定义,内部链接
   static int foo() {return 1;} //全局静态函数定义,内部链接
   const int k = 0; //全局const常量定义,内部链接
   int main(void)
   {
   return 0;
   }
   
   //a.cpp
   namespace test
   {
   int i = 0; //名字空间变量定义,外部链接
   int foo() {return 0;} //名字空间函数定义,外部链接
   }
   int i = 0; //全局变量定义,外部链接
   int k = 0; //全局变量定义,外部链接
   int foo() { return 2;} //全局函数定义,外部链接

在全局名字空间中,main.cpp中定义了静态变量i,常量k,及静态自由函数foo等,这些都有内部链接。如果你将这些变量或函数的static或是const修饰符去掉,在链接时就会现multiply defined symbols错误,它们与a.cpp中的全局变量、全局函数发生冲突。

c)类定义总有内部链接,而非inline类成员函数定义总有外部链接,类静态数据成员定义总有外部链接。

1)类的定义有内部链接。如果不是,想象一下你在4个cpp文件中include定义了类Base的头文件,在4个编译单元中的类Base都有外部链接,在链接的时候就会出错。

看下面的例子:

   //main.cpp
   class B //类定义,内部链接
   {
   static int s_i; //静态类成员声明,内部链接 
   public:
   void foo() { ++s_i;} //类inline函数,内部链接
   };
   struct D 
   {
   void foo(); //类成员函数声明,内部链接
   };
   int B::s_i = 0; //类静态数据成员定义,外部链接
   void D::foo() //类成员函数定义,外部链接
   { 
   cout << "D::foo in main.cpp" <<endl;
   }
   int main() //main函数,全局自由函数,外部链接
   {
   B b;
   D d;
   return 0;
   }
   
   //a.cpp
   class B
   {
   int k;
   };
   
   struct D
   {
   int d;
   };

在这个例子中,main.cpp与a.cpp中都有class B和class D的定义,但在编译这两个cpp文件时并不发生link错误。

2)类的非inline成员函数(一般,静态,虚拟都是)总有外部链接。

这样当你include了某个类的头文件,使用这个类的函数时,就能链接到正确的类成员函数上,继续以上面为例子,如果把a.cpp中的struct D改为

   struct D //类定义
   {
   int d;
   void foo(); //类成员函数声明
   };
   void D::foo() //类成员函数定义,外部链接
   {
   cout << " D::foo in a.cpp" <<endl;
   }

这时main.cpp与a.cpp中的D::foo都有外部链接,在链接就会出现multiply defined symbols错。

3)类的静态数据成员有外部链接,如上例的B::s_i,这样当你在main.cpp中定义了类静态数据成员,其它编译单元若使用了B::s_i,就会链接到main.cpp对应编译单元的s_i。

d)inline函数总有内部链接,不论这个函数是什么函数

   // main.cpp
   inline int foo() { return 1;} //inline全局函数,内部链接
   class Bar //类定义,内部链接
   {
   public:
   static int f() { return 2;} //inline 类静态函数,内部链接
   int g(int i) { return i;} //inline 类成员函数,内部链接
   };
   class Base
   {
   public:
   inline int k(); //类成员函数声明,内部链接
   };
   inline int Base::k(){return 5;} //inline 类成员函数,内部链接
   
   int main(void)
   {
   return 0;
   }

如果你的Base类是定义在Base.h中,而Base的inline 函数是在Base.cpp中定义的,那么在main.cpp中include "Base.h"编译不会出现问题,但在链接时会找不到函数k,所以类的inline函数最好放到头文件中,让每一个包含头文件的cpp都能找到inline函数。
  
现在对c++中的链接有了一个认识,能清楚的知道是什么原因产生链接时错误。当你在链接时产生链接不到的错误,这说明所有的编译单元都没有这个实体的外部链接;当你在链接时发现有多个链接实体,这说明有多个编译单元提供了同名的有外部链接的实体。同时,在进行程序设计时,也要注意不要使只有本编译单元用到的函数、类、变量等有外部链接,减少与其它编译单元的链接冲突。

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

Contents
滚动至顶部