FAIRYFAR-INTERNAL
 
  FAIRYFAR-INTERNAL  |  SITEMAP  |  ABOUT-ME  |  HOME  
详解C的异常处理机制

转自:https://blog.csdn.net/yucan1001/article/details/7014277

来自希赛网,作者王胜祥。

1. C语言中的异常处理机制

在这之前的所有文章中,都是阐述关于C++的异常处理机制。的确,在C++语言中,它提供的异常处理的模型是非常完善的,主人公阿愚因此才和“异常处理”结下了不解之缘,才有了这一系列文章的基本素材,同时主人公阿愚在自己的编程开发过程中,也才更离不开她,喜欢并依赖于她。   另外,C++语言中完善的异常处理的模型,也更激发了主人公阿愚更多其它的思考。难道异常处理机制只有在C++语言中才有吗?不是的,绝对不是这样的。实际上,异常处理的机制是无处不在的,它与软件的编程思想的发展,与编程语言的发展是同步的。异常处理机制自身的发展和完善过程,也是并记录了我们在编程思想上和编程方法上的改变、进步和发展的过程和重要的足迹。

在前面的文章中,早就讲到过,异常处理的核心思想是,把功能模块代码与系统中可能出现错误的处理代码分离开来,以此来达到使我们的代码组织起来更美观、逻辑上更清晰,并且同时从根本上来提高我们软件系统长时间稳定运行的可靠性。那么,现在回过头来看,实际上在计算机系统的硬件设计中,操作系统的总体设计中,早期的许多面向结构化程序设计语言中(例如C语言),都有异常处理的机制和方法的广泛运用。只不过是到了像C++这样面向对象的程序设计语言中,才把异常处理的模型设计到了一个相当理想和完善的程度。下面来看看主人公阿愚对在C语言中,异常处理机制的如何被运用?

goto语句,实现异常处理编程,最初也最原始的支持手段。

1、goto语句,程序员朋友们对它太熟悉了,它是C语言中使用最为灵活的一条语句,由它也充分体现出了C语言的许多特点或者说是优点。它虽然是一条高级语言中提供的语句,但是它一般却直接对应一条“无条件直接跳转的机器指令”,所以说它非常地特别,它引起过许多争议,但是这条语句仍然一直被保留了下来,即便是今天的C++语言中,也有对它的支持(虽然不建议使用它)。goto语句有非常多的用途或优点,例如,它特别适合于在编写系统程序中被使用,它能使编写出来的代码非常简练。

2、另外,goto语句另外一个最重要的作用就是,它实际上是一种对异常处理编程,最初也最原始的支持手段或方法。它能把错误处理模块的代码有效与其它代码分离开来。例程如下(请与第一集文章中的示例代码相比较):

snippet.c
void main(int argc, char* argv[])
{
	if (Call_Func1(in, param out)
	{
		// 函数调用成功,我们正常的处理
		if (Call_Func2(in, param out)
		{
			// 函数调用成功,我们正常的处理
			while(condition)
			{
				//do other job				
				// 如果错误直接跳转
				if (has error) goto Error;				
				//do other job
			}
		}
		// 如果错误直接跳转
		else goto Error;		
	}
	// 如果错误直接跳转
	else goto Error;
	// 错误处理模块
Error:
	process_error();
	exit();	
}

呵呵!上面经过改善后的代码是不是更加清晰了一些,也更简练了一些。因此说,goto语句确是是能够很好地完成一些简易的异常处理编程的实现。虽然它较C++语言中提供的异常处理编程模型相差甚远。

为什么不建议使用goto语句来实现异常处理编程。

虽然goto语句能有效地支持异常处理编程的实现。但是没有人却建议使用它,即便是在C语言中。因为:

  • goto语句能破坏程序的结构化设计,使代码难于测试,且包含大量goto的代码模块不易理解和阅读。它一直遭结构化程序设计思想所抛弃,强烈建议程序员不易使用它;
  • 与C++语言中提供的异常处理编程模型相比,它的确是太弱了一些。例如,它一般只能是在某个函数的局部作用域内跳转,也即它不能有效和方便地实现程序控制流的跨函数远程的跳转。
  • 如果在C++语言中,用goto语句来实现异常处理,那么它将给面向对象构成极大破坏,并影响到效率。这一点,以后会继续深入阐述。

总结:

虽然goto语句缺点多多,但不管如何,goto语句的确为程序员朋友们,在C语言中,有效运用异常处理思想来进行编程处理,提供了一种途径或简易的手段。当然,运用goto语句来进行异常处理编程已经成为历史。因为,在C语言中,早就已经提供了一种更加优雅的异常处理机制。去看看吧!继续!

2. C语言中一种更优雅的异常处理机制

上一篇文章对C语言中的goto语句进行了较深入的阐述,实际上goto语句是面向过程与面向结构化程序语言中,进行异常处理编程的最原始的支持形式。后来为了更好地、更方便地支持异常处理编程机制,使得程序员在C语言开发的程序中,能写出更高效、更友善的带有异常处理机制的代码模块来。于是,C语言中出现了一种更优雅的异常处理机制,那就是setjmp()函数与longjmp()函数。

实际上,这种异常处理的机制不是C语言中自身的一部分,而是在C标准库中实现的两个非常有技巧的库函数,也许大多数C程序员朋友们对它都很熟悉,而且,通过使用setjmp()函数与longjmp()函数组合后,而提供的对程序的异常处理机制,以被广泛运用到许多C语言开发的库系统中,如jpg解析库,加密解密库等等。

也许C语言中的这种异常处理机制,较goto语句相比较,它才是真正意义上的、概念上比较彻底的,一种异常处理机制。作风一向比较严谨、喜欢刨根问底的主人公阿愚当然不会放弃对这种异常处理机制进行全面而深入的研究。下面一起来看看。

setjmp函数有何作用?

前面刚说了,setjmp是C标准库中提供的一个函数,它的作用是保存程序当前运行的一些状态。它的函数原型如下:

int setjmp( jmp_buf env );

这是MSDN中对它的评论,如下:

setjmp函数用于保存程序的运行时的堆栈环境,接下来的其它地方,你可以通过调用longjmp函数来恢复先前被保存的程序堆栈环境。当setjmp和longjmp组合一起使用时,它们能提供一种在程序中实现“非本地局部跳转”("non-local goto")的机制。并且这种机制常常被用于来实现,把程序的控制流传递到错误处理模块之中;或者程序中不采用正常的返回(return)语句,或函数的正常调用等方法,而使程序能被恢复到先前的一个调用例程(也即函数)中。

对setjmp函数的调用时,会保存程序当前的堆栈环境到env参数中;接下来调用longjmp时,会根据这个曾经保存的变量来恢复先前的环境,并且当前的程序控制流,会因此而返回到先前调用setjmp时的程序执行点。此时,在接下来的控制流的例程中,所能访问的所有的变量(除寄存器类型的变量以外),包含了longjmp函数调用时,所拥有的变量。

setjmp和longjmp并不能很好地支持C++中面向对象的语义。因此在C++程序中,请使用C++提供的异常处理机制。

好了,现在已经对setjmp有了很感性的了解,暂且不做过多评论,接着往下看longjmp函数。

longjmp函数有何作用?

同样,longjmp也是C标准库中提供的一个函数,它的作用是用于恢复程序执行的堆栈环境,它的函数原型如下:

void longjmp( jmp_buf env, int value );

这是MSDN中对它的评论,如下:

longjmp函数用于恢复先前程序中调用的setjmp函数时所保存的堆栈环境。setjmp和longjmp组合一起使用时,它们能提供一种在程序中实现“非本地局部跳转”("non-local goto")的机制。并且这种机制常常被用于来实现,把程序的控制流传递到错误处理模块,或者不采用正常的返回(return)语句,或函数的正常调用等方法,使程序能被恢复到先前的一个调用例程(也即函数)中。

对setjmp函数的调用时,会保存程序当前的堆栈环境到env参数中;接下来调用longjmp时,会根据这个曾经保存的变量来恢复先前的环境,并且因此当前的程序控制流,会返回到先前调用setjmp时的执行点。此时,value参数值会被setjmp函数所返回,程序继续得以执行。并且,在接下来的控制流的例程中,它所能够访问到的所有的变量(除寄存器类型的变量以外),包含了longjmp函数调用时,所拥有的变量;而寄存器类型的变量将不可预料。setjmp函数返回的值必须是非零值,如果longjmp传送的value参数值为0,那么实际上被setjmp返回的值是1。

在调用setjmp的函数返回之前,调用longjmp,否则结果不可预料。

在使用longjmp时,请遵守以下规则或限制:

  • 不要假象寄存器类型的变量将总会保持不变。在调用longjmp之后,通过setjmp所返回的控制流中,例程中寄存器类型的变量将不会被恢复。
  • 不要使用longjmp函数,来实现把控制流,从一个中断处理例程中传出,除非被捕获的异常是一个浮点数异常。在后一种情况下,如果程序通过调用 _fpreset函数,来首先初始化浮点数包后,它是可以通过longjmp来实现从中断处理例程中返回。
  • 在C++程序中,小心对setjmp和longjmp的使用,应为setjmp和longjmp并不能很好地支持C++中面向对象的语义。因此在C++程序中,使用C++提供的异常处理机制将会更加安全。

把setjmp和longjmp组合起来,原来它这么厉害!

现在已经对setjmp和longjmp都有了很感性的了解,接下来,看一个示例,并从这个示例展开分析,示例代码如下(来源于MSDN):

snippet.c
/* FPRESET.C: This program uses signal to set up a
* routine for handling floating-point errors.
*/
#include <stdio.h>
#include <signal.h>
#include <setjmp.h>
#include <stdlib.h>
#include <float.h>
#include <math.h>
#include <string.h>
 
jmp_buf mark; /* Address for long jump to jump to */
int fperr; /* Global error number */
 
void __cdecl fphandler( int sig, int num ); /* Prototypes */
void fpcheck( void );
 
void main( void )
{
	double n1, n2, r;
	int jmpret;
	/* Unmask all floating-point exceptions. */
	_control87( 0, _MCW_EM );
	/* Set up floating-point error handler. The compiler
	* will generate a warning because it expects
	* signal-handling functions to take only one argument.
	*/
	if( signal( SIGFPE, fphandler ) == SIG_ERR )
 
	{
		fprintf( stderr, "Couldn't set SIGFPE\n" );
		abort(); }
 
		/* Save stack environment for return in case of error. First
		* time through, jmpret is 0, so true conditional is executed.
		* If an error occurs, jmpret will be set to -1 and false
		* conditional will be executed.
	*/
 
	// 注意,下面这条语句的作用是,保存程序当前运行的状态
	jmpret = setjmp( mark );
	if( jmpret == 0 )
	{
		printf( "Test for invalid operation - " );
		printf( "enter two numbers: " );
		scanf( "%lf %lf", &n1, &n2 );
 
		// 注意,下面这条语句可能出现异常,
		// 如果从终端输入的第2个变量是0值的话
		r = n1 / n2;
		/* This won't be reached if error occurs. */
		printf( "\n\n%4.3g / %4.3g = %4.3g\n", n1, n2, r );
 
		r = n1 * n2;
		/* This won't be reached if error occurs. */
		printf( "\n\n%4.3g * %4.3g = %4.3g\n", n1, n2, r );
	}
	else
		fpcheck();
}
/* fphandler handles SIGFPE (floating-point error) interrupt. Note
* that this prototype accepts two arguments and that the
* prototype for signal in the run-time library expects a signal
* handler to have only one argument.
*
* The second argument in this signal handler allows processing of
* _FPE_INVALID, _FPE_OVERFLOW, _FPE_UNDERFLOW, and
* _FPE_ZERODIVIDE, all of which are Microsoft-specific symbols
* that augment the information provided by SIGFPE. The compiler
* will generate a warning, which is harmless and expected.
*/
void fphandler( int sig, int num )
{
/* Set global for outside check since we don't want
* to do I/O in the handler.
	*/
	fperr = num;
	/* Initialize floating-point package. */
	_fpreset();
	/* Restore calling environment and jump back to setjmp. Return
	* -1 so that setjmp will return false for conditional test.
	*/
	// 注意,下面这条语句的作用是,恢复先前setjmp所保存的程序状态
	longjmp( mark, -1 );
}
void fpcheck( void )
{
	char fpstr[30];
	switch( fperr )
	{
	case _FPE_INVALID:
		strcpy( fpstr, "Invalid number" );
		break;
	case _FPE_OVERFLOW:
		strcpy( fpstr, "Overflow" );
 
		break;
	case _FPE_UNDERFLOW:
		strcpy( fpstr, "Underflow" );
		break;
	case _FPE_ZERODIVIDE:
		strcpy( fpstr, "Divide by zero" );
		break;
	default:
		strcpy( fpstr, "Other floating point error" );
		break;
	}
	printf( "Error %d: %s\n", fperr, fpstr );
}

程序的运行结果如下:

Test for invalid operation - enter two numbers: 1 2
1 / 2 = 0.5
1 * 2 = 2

上面的程序运行结果正常。另外程序的运行结果还有一种情况,如下:

Test for invalid operation - enter two numbers: 1 0
Error 131: Divide by zero

呵呵!程序运行过程中出现了异常(被0除),并且这种异常被程序预先定义的异常处理模块所捕获了。厉害吧!可千万别轻视,这可以C语言编写的程序。

分析setjmp和longjmp。

当程序运行到第②步时,调用setjmp函数,这个函数会保存程序当前运行的一些状态信息,主要是一些系统寄存器的值,如ss,cs,eip, eax,ebx,ecx,edx,eflags等寄存器,其中尤其重要的是eip的值,因为它相当于保存了一个程序运行的执行点。这些信息被保存到 mark变量中,这是一个C标准库中所定义的特殊结构体类型的变量。

调用setjmp函数保存程序状态之后,该函数返回0值,于是接下来程序执行到第③步和第④步中。在第④步中语句执行时,如果变量n2为0值,于是便引发了一个浮点数计算异常,,导致控制流转入fphandler函数中,也即进入到第⑤步。

然后运行到第⑥步,调用longjmp函数,这个函数内部会从先前的setjmp所保存的程序状态,也即mark变量中,来恢复到以前的系统寄存器的值。于是便进入到了第⑦步,注意,这非常有点意思,实际上,通过longjmp函数的调用后,程序控制流(尤其是eip的值)再次戏剧性地进入到了 setjmp函数的处理内部中,但是这一次setjmp返回的值是longjmp函数调用时,所传入的第2个参数,也即-1,因此程序接下来进入到了第⑧ 步的执行之中。

总结:

与goto语句不同,在C语言中,setjmp()与longjmp()的组合调用,为程序员提供了一种更优雅的异常处理机制。它具有如下特点:

  • goto只能实现本地跳转,而setjmp()与longjmp()的组合运用,能有效的实现程序控制流的非本地(远程)跳转;
  • 与goto语句不同,setjmp()与longjmp()的组合运用,提供了真正意义上的异常处理机制。例如,它能有效定义受监控保护的模块区域(类似于C++中try关键字所定义的区域);同时它也能有效地定义异常处理模块(类似于C++中catch关键字所定义的区域);还有,它能在程序执行过程中,通过longjmp函数的调用,方便地抛出异常(类似于C++中throw关键字)。

现在,相信大家已经对在C语言中提供的这种异常处理机制有了很全面地了解。但是我们还没有深入它研究它,下一篇文章中继续探讨吧!go!

3. 全面了解setjmp与longjmp的使用

上一篇文章对setjmp函数与longjmp函数有了较全面的了解,尤其是这两个函数的作用,函数所完成的功能,以及将setjmp函数与 longjmp函数组合起来,实现异常处理机制时,程序模块控制流的执行过程等。这里更深入一步,将对setjmp与longjmp的具体使用方法和适用的场合,进行一个非常全面的阐述。

另外请特别注意,setjmp函数与longjmp函数总是组合起来使用,它们是紧密相关的一对操作,只有将它们结合起来使用,才能达到程序控制流有效转移的目的,才能按照程序员的预先设计的意图,去实现对程序中可能出现的异常进行集中处理。

与goto语句的作用类似,它能实现本地的跳转。

这种情况容易理解,不过还是列举出一个示例程序吧!如下:

snippet.c
void main( void )
{
	int jmpret;
 
	jmpret = setjmp( mark );
	if( jmpret == 0 )
	{
		// 其它代码的执行
		// 判断程序远行中,是否出现错误,如果有错误,则跳转!
		if(1) longjmp(mark, 1);
 
		// 其它代码的执行
		// 判断程序远行中,是否出现错误,如果有错误,则跳转!
		if(2) longjmp(mark, 2);
 
		// 其它代码的执行
		// 判断程序远行中,是否出现错误,如果有错误,则跳转!
		if(-1) longjmp(mark, -1);
 
		// 其它代码的执行
	}
	else
	{
		// 错误处理模块
		switch (jmpret)
		{
		case 1:
			printf( "Error 1\n");
			break;
		case 2:
			printf( "Error 2\n");
			break;
		case 3:
			printf( "Error 3\n");
			break;
		default :
			printf( "Unknown Error");
			break;
		}
		exit(0);
	}	
	return;
}

上面的例程非常地简单,其中程序中使用到了异常处理的机制,这使得程序的代码非常紧凑、清晰,易于理解。在程序运行过程中,当异常情况出现后,控制流是进行了一个本地跳转(进入到异常处理的代码模块,是在同一个函数的内部),这种情况其实也可以用goto语句来予以很好的实现,但是,显然setjmp与 longjmp的方式,更为严谨一些,也更为友善。

setjmp与longjmp相结合,实现程序的非本地的跳转。

呵呵!这就是goto语句所不能实现的。也正因为如此,所以才说在C语言中,setjmp与longjmp相结合的方式,它提供了真正意义上的异常处理机制。其实上一篇文章中的那个例程,已经演示了longjmp函数的非本地跳转的场景。这里为了更清晰演示本地跳转与非本地跳转,这两者之间的区别,我们在上面刚才的那个例程基础上,进行很小的一点改动,代码如下:

snippet.c
void Func1()
{
	// 其它代码的执行
	// 判断程序远行中,是否出现错误,如果有错误,则跳转!
	if(1) longjmp(mark, 1);
}
 
void Func2()
{
	// 其它代码的执行
	// 判断程序远行中,是否出现错误,如果有错误,则跳转!
	if(2) longjmp(mark, 2);
}
 
void Func3()
{
	// 其它代码的执行
	// 判断程序远行中,是否出现错误,如果有错误,则跳转!
	if(-1) longjmp(mark, -1);
}
 
void main( void )
{
	int jmpret;	
	jmpret = setjmp( mark );
	if( jmpret == 0 )
	{
		// 其它代码的执行		
		// 下面的这些函数执行过程中,有可能出现异常
		Func1();		
		Func2();
		Func3();		
		// 其它代码的执行
	}
	else
	{
		// 错误处理模块
		switch (jmpret)
		{
		case 1:
			printf( "Error 1\n");
			break;
		case 2:
			printf( "Error 2\n");
			break;
		case 3:
			printf( "Error 3\n");
			break;
		default :
			printf( "Unknown Error");
			break;
		}
		exit(0);
	}	
	return;
}

回顾一下,这与C++中提供的异常处理模型是不是很相近。异常的传递是可以跨越一个或多个函数。这的确为C程序员提供了一种较完善的异常处理编程的机制或手段。

setjmp和longjmp使用时,需要特别注意的事情。

1、setjmp与longjmp结合使用时,它们必须有严格的先后执行顺序,也即先调用setjmp函数,之后再调用longjmp函数,以恢复到先前被保存的“程序执行点”。否则,如果在setjmp调用之前,执行longjmp函数,将导致程序的执行流变的不可预测,很容易导致程序崩溃而退出。请看示例程序,代码如下:

snippet.cpp
class Test
{
public:
	Test() {printf("构造对象\n");}
	~Test() {printf("析构对象\n");}
}obj;
//注意,上面声明了一个全局变量obj
 
void main( void )
{
	int jmpret;	
	// 注意,这里将会导致程序崩溃,无条件退出
	Func1();
	while(1);	
	jmpret = setjmp( mark );
	if( jmpret == 0 )
	{
		// 其它代码的执行	
		// 下面的这些函数执行过程中,有可能出现异常
		Func1();		
		Func2();		
		Func3();		
		// 其它代码的执行
	}
	else
	{
		// 错误处理模块
		switch (jmpret)
		{
		case 1:
			printf( "Error 1\n");
			break;
		case 2:
			printf( "Error 2\n");
			break;
		case 3:
			printf( "Error 3\n");
			break;
		default :
			printf( "Unknown Error");
			break;
		}
		exit(0);
	}	
	return;
}

上面的程序运行结果,如下:

构造对象
Press any key to continue

的确,上面程序崩溃了,由于在Func1()函数内,调用了longjmp,但此时程序还没有调用setjmp来保存一个程序执行点。因此,程序的执行流变的不可预测。这样导致的程序后果是非常严重的,例如说,上面的程序中,有一个对象被构造了,但程序崩溃退出时,它的析构函数并没有被系统来调用,得以清除一些必要的资源。所以这样的程序是非常危险的。(另外请注意,上面的程序是一个C++程序,所以大家演示并测试这个例程时,把源文件的扩展名改为 xxx.cpp)。

2、除了要求先调用setjmp函数,之后再调用longjmp函数(也即longjmp必须有对应的setjmp函数)之外。另外,还有一个很重要的规则,那就是longjmp的调用是有一定域范围要求的。这未免太抽象了,还是先看一个示例,如下:

snippet.cpp
int Sub_Func()
{
	// 注意,这里改动了一点
	int be_modify, jmpret;	
	be_modify = 0;	
	jmpret = setjmp( mark );
	if( jmpret == 0 )
	{
		// 其它代码的执行
	}
	else
	{
		// 错误处理模块
		switch (jmpret)
		{
		case 1:
			printf( "Error 1\n");
			break;
		case 2:
			printf( "Error 2\n");
			break;
		case 3:
			printf( "Error 3\n");
			break;
		default :
			printf( "Unknown Error");
			break;
		}		
		//注意这一语句,程序有条件地退出
		if (be_modify==0) exit(0);
	}	
	return jmpret;
}
 
void main( void )
{
	Sub_Func();	
	// 注意,虽然longjmp的调用是在setjmp之后,但是它超出了setjmp的作用范围。
	longjmp(mark, 1);
}

运行或调试(单步跟踪)上面的程序,发现它崩溃了,为什么?这就是因为,“在调用setjmp的函数返回之前,调用longjmp,否则结果不可预料” (这在上一篇文章中已经提到过,MSDN中做了特别的说明)。为什么这样做会导致不可预料?其实仔细想想,原因也很简单,那就是因为,当setjmp函数调用时,它保存的程序执行点环境,只应该在当前的函数作用域以内(或以后)才会有效。如果函数返回到了上层(或更上层)的函数环境中,那么setjmp保存的程序的环境也将会无效,因为堆栈中的数据此时将可能发生覆盖,所以当然会导致不可预料的执行后果。

3、不要假象寄存器类型的变量将总会保持不变。在调用longjmp之后,通过setjmp所返回的控制流中,例程中寄存器类型的变量将不会被恢复。(MSDN中做了特别的说明,上一篇文章中,这也已经提到过)。寄存器类型的变量,是指为了提高程序的运行效率,变量不被保存在内存中,而是直接被保存在寄存器中。寄存器类型的变量一般都是临时变量,在C语言中,通过register定义,或直接嵌入汇编代码的程序。这种类型的变量一般很少采用,所以在使用setjmp和longjmp时,基本上不用考虑到这一点。

4、MSDN中还做了特别的说明,“在C+ +程序中,小心对setjmp和longjmp的使用,因为setjmp和longjmp并不能很好地支持C++中面向对象的语义。因此在C++程序中,使用C++提供的异常处理机制将会更加安全。”虽然说C++能非常好的兼容C,但是这并非是100%的完全兼容。例如,这里就是一个很好的例子,在C++ 程序中,它不能很好地与setjmp和longjmp和平共处。在后面的一些文章中,有关专门讨论C++如何兼容支持C语言中的异常处理机制时,会做详细深入的研究,这里暂且跳过。

总结:

主人公阿愚现在对setjmp与longjmp已经是非常钦佩了,虽然它没有C++中提供的异常处理模型那么好用,但是毕竟在C语言中,有这么好用的东东,已经是非常不错了。为了更上一层楼,使setjmp与longjmp更接近C++中提供的异常处理模型(也即try()catch()语法)。阿愚找到了不少非常有价值的资料。不要错过,继续到下一篇文章中去吧!让程序员朋友们“玩转setjmp与longjmp”,Let’s go!

后面的是有关模拟C++中try,catch还有throw的方法,以及为什么不要在C++中使用setjmp和longjum的讨论,主要还是因为无法保证对象正确销毁,就不贴了。



打赏作者以资鼓励: