菜鸟笔记
提升您的技术认知

C++中的多态——理解虚函数表及多态实现原理

多态及其实现原理

  • 一、多态的概念
    • 概念
    • 构成条件
  • 二、虚函数的重写
    • 重写的定义
    • 重写的特殊情况
    • override和final关键字
    • 区分重写、重载、重定义
    • 抽象类的概念
  • 三、多态的实现原理
    • 父类对象模型
    • 补充:生成默认构造方法的场景
    • 子类对象模型
    • 多态的调用原理
    • 多继承的虚函数表
  • 四、继承与多态中的常见问题


注:编译环境为VS 2022,指针大小为4字节

一、多态的概念

概念

多态,指完成某个行为,不同的对象去完成时会产生出不同的状态。如:定一个一Animal类,类中包含动物的叫声这种方法,分别定义Dog和Cat类继承自动物类,那么Dog和Cat类中也会包含叫声这种方法,但是他们具体实现是不同的,因为每种动物的声音都不相同,这便是一种多态。

多态的分类

  • 静态多态,也称为静态绑定或者早绑定,是指函数在编译期间就已经确定了函数的行为。函数重载、函数模板等都属于静态多态。
  • 动态多态,即动态绑定或者晚绑定,指程序在运行时才可以确定函数的行为。本文主要分析的是动态多态。

构成条件

  • 在继承体系下,父类中包含虚函数
  • 子类中对父类的虚函数进行重写
  • 通过父类的指针或者引用调用虚函数

多态的体现:不同的类对象调用同一函数,会产生不同的行为

二、虚函数的重写

重写的定义

虚函数:virtual关键字修饰的函数

子类中有一个跟父类完全相同的虚函数,即返回值类型函数名形参列表都完全相同,则可以说子类重写了父类的虚函数。
Student类中重写了BuyTicket方法:

注意:只要父类中函数用virtual修饰即可,子类可以不加,且虚函数的重写与权限无关。

重写的特殊情况

  • 协变——返回值类型不同
    父类的虚函数返回父类对象的指针或者引用,子类虚函数返回子类对象的指针或者引用。
  • 析构函数重写——父类与子类析构函数名字不同
    如果父类的析构函数为虚函数,子类的析构函数只要定义了,都能与父类的析构函数构成重写。可以理解为编译器对析构函数的名字做了特殊处理,编译后析构函数的名字统一处理成destructor。

override和final关键字

这两个关键字的主要作用都是帮助用户检测是否构成重写

  • final
    修饰虚函数,表示虚函数不可被重写;另外final也可以修饰类,表示该类不能被继承
  • override
    修饰虚函数,检查子类虚函数是否重写了父类的虚函数,如果没有构成重写则会报错

区分重写、重载、重定义

抽象类的概念

在虚函数的后面写上=0,则这个函数为纯虚函数。包含纯虚函数的类叫做抽象类(也称接口类),抽象类不能实例化对象。抽象类被集成以后如果没有对虚函数进行重写,则继承的类也是抽象类。一般情况下,抽象类必须被继承,且必须对虚函数进行重写,否则定义为抽象类则没有实际意义。
Shape类:

class Shape
{
  
public:
	// 纯虚函数
	virtual double GetArea() = 0;
	virtual double GetCircumference() = 0;
};

三、多态的实现原理

父类对象模型

给出一个Base类,一个Derived类继承Base类

class Base
{
  
public:
	virtual void Func1()
	{
  
		cout << "Base::Fun1c()" << endl;
	}
	virtual void Func2()
	{
  
		cout << "Base::Func2()" << endl;
	}
	virtual void Func3()
	{
  
		cout << "Base::Func3()" << endl;
	}
public:
	int  _a;
};
class Derived:public Base
{
  
public:
	int _b;
};

父类对象模型:

总结:

  • 类中定义了虚函数以后,定义对象时,编译器会为对象创建一张虚表,并将一个指向这张虚表的指针保存在对象的前四个字节,无论定义几个虚函数,对象都只比多四个字节大小。这个指针称为函数虚表指针
  • 虚表地址是在构造对象时进行填充的构造函数如果显式实现,编译器会对用户实现的函数进行修改,增加给对象前四个字节存放虚表地址的语句。
  • 虚表本质就是一个函数指针数组,按照声明顺序依次存放虚函数的地址

补充:生成默认构造方法的场景

在学习类与对象时我们知道构造函数是是类的默认成员函数,如果用户没有显式定义,编译器会默认生成,但是实际上并不是在所有情况下编译器都会生成默认的构造函数,编译器只会在需要的时候生成构造函数
四种生成默认构造方法的场景

  • B类中包含有A类的对象,B类没有显式定义构造函数,A类定义了无参或者全缺省的构造方法,则编译器会给B类生成默认的构造方法。
    分析:因为A类有无参或者全缺省的构造方法,需要在B类中调用A类的构造方法对A类成员进行初始化,所以需要生成B类的构造方法,在其初始化列表中调用A类构造方法。
    如果A类没有显式定义构造函数,则不会生成B类构造方法,默认赋随机值;如果A类定义的构造方法不是无参或者全缺省的,则需要在初始化列表中对A类对象初始化:

  • 继承中,B继承A,A中定义了无参或者全缺省的构造方法,B未显式定义,则编译器会给B类生成默认的构造方法。将B中继承自A的部分初始化。

  • 虚拟继承中,B类虚拟继承子A类,B类未显式定义构造方法,编译器会给B类生成默认的构造方法,目的是:给B类对象的前4个字节填充虚基表地址

  • 类中包含虚函数,未显示定义构造方法,则编译器会自动生成构造方法,为对象的前4个字节填充虚表地址

子类对象模型

子类虚表构建规则

  1. 将父类虚表内容拷贝一份放到子类虚表中,注意父类和子类用的不是同一张虚表,仍以上面的Base和Derived类为例

    可以看出,两个虚表指针的地址不同,但虚表中保存的虚函数的地址都相同
  2. 如果子类中将父类的虚函数进行了重写,则用子类的虚函数地址替换虚函数表中相同偏移量的虚函数的地址。
  3. 子类中增加的虚函数按照其在类当中的声明次序放在虚表的最后
    子类中增加了两个虚函数:

    但是由于VS监视窗口中无法显式新增加的子类,而内存窗口只能显式虚函数的地址,无法确认是哪个函数,所以这里通过打印的方式进行验证。

通过上图中程序的方式打印出了子类对象中虚函数的分布情况,在这里VFP是一个函数指针类型,前面加typedef表示为函数指针类型,如果不加,则是函数指针变量。
所以是用VFP*接收指向第一个虚函数指针的指针,p与*p的类型:

所以最终的结论是:子类新增的虚函数按照其在类中的声明次序放在虚函数表的最后。

子类对象的构造过程
构造子类对象时,在初始化列表中先调用父类的构造函数,此时对象的前4个字节保存的虚表指针指向父类的虚表,之后构造子类自己的虚表,虚表再指针指向子类的虚表。

总结

  1. 虚表的本质是函数指针数组,在编译时生成
  2. 虚函数的重写也叫覆盖,指的是虚表中虚函数的覆盖,重写是语法层的叫法,覆盖是原理层的叫法
  3. 对象中保存的是虚表指针,虚表中保存的是虚函数指针,虚函数和普通函数一样保存在代码段,在VS中虚表也保存在代码区
  4. 同一个类的对象共用同一张虚表,父类和子类各自拥有各自的虚表。

多态的调用原理

父类对象,函数调用时的汇编代码:

普通函数调用时直接传递函数的地址,这个地址在编译期间就确定了,虚函数则要经过虚表指针寻址等步骤。从上面的汇编代码也可以看出动态多态的晚绑定的特点,在编译期间普通函数的调用已经确定了要调用的具体函数,虚函数则无法确定,只有等程序运行起来,形参b是具体哪个对象确定了以后,才能确定要调用的函数的地址
上面是传递父类对象时的调用情况,子类对象调用时的汇编代码与父类对象相同,区别就是子类对象有自己的虚表,最终调用的是子类需表中的函数。
总结多态的原理:
创建对象时,编译器会给包含虚函数的类对象创建一张虚表,并将虚表地址填充在对象的前4个字节,子类对象会拷贝父类对象的虚表,然后再对自己重写的虚函数进行替换,并在虚表中添加子类新增的虚函数;函数调用时,编译器会先从对象的前4个字节获取该对象虚表的地址,然后在虚表中获取虚函数地址进行函数调用;由于每个类对象都有属于该类的一张虚表,且虚函数一般都进行了重写,即函数名与父类相同,但函数执行的内容不同,最终产生的结果就是,不同类的对象调用同一函数产生不同的结果,由此形成了多态。

多继承的虚函数表

给出两个父类Base1和Base2,Derived子类继承自两个父类

通多监视窗口查看子类对象的模型:

多态中多继承的子类对象模型与多继承的模型原理相同,但是VS的监视窗口无法查看子类新增的虚函数在需表中的位置,按照之前但继承中打印虚表中函数的原理进行打印:

最终得到的结果:

可以看出,子类中增加的虚函数保存在上面的虚表中。
多继承子类对象模型及对象虚表:

四、继承与多态中的常见问题

  1. 析构函数可以设置为虚函数吗?
    可以,在继承体系中,最好将父类的析构函数设置为虚函数;如果子类中涉及到资源管理,则必须将父类的析构函数设置为虚函数,这样父类和子类中的析构函数便会构成重写(重写的特殊情况),形成多态,通过父类指针指向子类对象时,delete父类对象的指针也会调用子类的析构函数
    子类中涉及资源管理,调用父类析构函数析构子类对象,则会有内存泄漏,如图:

  2. 构造函数可以设置为虚函数吗?
    不能,虚函数是放在虚表中的,虚表指针是在构造方法的初始化列表中进行填充的,通过虚表指针才能找到虚函数,但是不调用构造方法就没有虚表指针,二者矛盾。即如果构造方法是虚函数,那么调用构造方法就要通过虚表指针,但是虚表指针是要通过调用构造方法才能填充的。拷贝构造与构造函数原理相同。

  3. 赋值运算符重载函数可以设置为虚函数吗?
    可以,但是没有意义,因为赋值运算符重载函数参数和返回值都是本类类型对象的引用,设置程序函数无法进行重写,无法构成多态。

  4. 静态函数可以设置为虚函数吗 ?
    虚函数必须在创建对象后,通过对象的前4个字节的虚表指针调用。而静态成员函数可以通过 类名::成员函数 的方式进行调用,不用通过象,这样就无法找到虚表,也无法访问虚函数。

  5. 内联函数可以是虚函数吗?
    可以设置,但是没有意义,因为虚函数关键字virtual和inline是矛盾的,inline属性会被忽略,函数不会展开,而是放到虚函数表中。

  6. 友元函数可以是虚函数吗?
    不可以,因为virtual只能修饰类的成员函数。

7.为什么多态必须通过指针或者引用实现?
因为当我们用一个父类指针或者引用指向子类对象时,会发生内存切割,用子类中属于父类的部分给父类赋值:

	Animal& animal1 = dog;
 	Animal* animal2 = new Dog();

而下面的语句则不会产生内存切割:

Ainmal animal3 = dog;

为什么会这样呢?

“一个pointer或一个reference之所以支持多态,是因为它们并不引发内存任何“与类型有关的内存委托操作; 会受到改变的。只有它们所指向内存的大小和解释方式 而已”。 ——《深度探索C++对象模型》

▲此处仍有需要探索的地方,可以参考《深度探索C++对象模型》一书了解更多深层次的原理。