字符串操作函数string.h相关函数strcpy,strcat,等源码

字符串操作函数string.h相关函数strcpy,strcat,等源码

2013-08-20 20:35    阅读(2842)  评论(0)    收藏

首先说一下源码到底在哪里找。

我们在文件中包含<cstring>时,如果点击右键打开文档,

会打开cstring,我们会发现路径为:

D:\Program Files\visual studio\VC\include\cstring

这个文件内容如下:

复制代码

// cstring standard header #pragma once #ifndef _CSTRING_ #define _CSTRING_ #include <yvals.h> #ifdef _STD_USING #undef _STD_USING #include <string.h> #define _STD_USING #else /* _STD_USING */ #include <string.h>#endif /* _STD_USING */ #if _GLOBAL_USING && !defined(RC_INVOKED) _STD_BEGIN using _CSTD size_t; using _CSTD memchr; using _CSTD memcmp; using _CSTD memcpy; using _CSTD memmove; using _CSTD memset; using _CSTD strcat; using _CSTD strchr; using _CSTD strcmp; using _CSTD strcoll; using _CSTD strcpy; using _CSTD strcspn; using _CSTD strerror; using _CSTD strlen; using _CSTD strncat; using _CSTD strncmp; using _CSTD strncpy; using _CSTD strpbrk; using _CSTD strrchr; using _CSTD strspn; using _CSTD strstr; using _CSTD strtok; using _CSTD strxfrm; _STD_END #endif /* _GLOBAL_USING */ #endif /* _CSTRING_ */ /* * Copyright (c) 1992-2009 by P.J. Plauger.  ALL RIGHTS RESERVED. * Consult your license regarding permissions and restrictions. V5.20:0009 */

复制代码

它没有cpp文件。包含了<string.h>头文件,也在这个目录下,内容如下;

View Code

在Vc\include下面倒是有一个string的cpp文件,但是没有string操作函数的代码,那么strcpy,strcat源码到底在哪里?

D:\Program Files\visual studio\VC\crt\src 目录下面

这个目录下面包含所有C语言函数的源代码

大多数函数的名字都是以名字命名的.c文件里,但是strcpy并没有strcpy.c文件,它的源码在strcat.c里面:

strcat.c内容如下:

复制代码

/*** *strcat.c - contains strcat() and strcpy() * *Purpose: *       Strcpy() copies one string onto another. * *       Strcat() concatenates (appends) a copy of the source string to the *       end of the destination string, returning the destination string. * *******************************************************************************/ #include <cruntime.h> #include <string.h> #ifndef _MBSCAT #pragma function(strcat,strcpy) #endif  /* _MBSCAT */ /*** *char *strcat(dst, src) - concatenate (append) one string to another * *Purpose: *       Concatenates src onto the end of dest.  Assumes enough *       space in dest. * *Entry: *       char *dst - string to which "src" is to be appended *       const char *src - string to be appended to the end of "dst" * *Exit: *       The address of "dst" * *Exceptions: * *******************************************************************************/ char * __cdecl strcat ( char * dst, const char * src ) { char * cp = dst; while( *cp ) cp++;                   /* find end of dst */ /*不能写成while(*cp++)/ 因为这样的话为*cp为0时还会+1,导致cp执向了\0的后一个。 while( *cp++ = *src++ ) ;       /* Copy src to end of dst */ return( dst );                  /* return dst */ } /*** *char *strcpy(dst, src) - copy one string over another * *Purpose: *       Copies the string src into the spot specified by *       dest; assumes enough room. * *Entry: *       char * dst - string over which "src" is to be copied *       const char * src - string to be copied over "dst" * *Exit: *       The address of "dst" * *Exceptions: *******************************************************************************/ char * __cdecl strcpy(char * dst, const char * src) { char * cp = dst; while( *cp++ = *src++ ) ;               /* Copy src over dst */ return( dst ); }

复制代码

strcpy另一种实现策略:

林锐《高质量C++/C编程指南》

复制代码

#include <assert.h> char *strcpy(char *strDest, const char *strSrc) { assert((strDest!=NULL) && (strSrc !=NULL)); // 2分 char *address = strDest;                   // 2分 while( (*strDest++ = * strSrc++) != ‘/0’ )   // 2分 ; return address ;                          // 2分 }

复制代码

附:

strcpy能把strSrc的内容复制到strDest,为什么还要char * 类型的返回值?

答:为了实现链式表达式。 // 2分
例如 int length = strlen( strcpy( strDest, “hello world”) );

个人觉得   (*strDest++ = * strSrc++) != ‘/0’ 不能没有必要判断是否=0,因为但char内容为字符串结束符时ascii为0,dst=src; dst=0; while 判断dst是否等于0,等于0就退出了。 strcmp怎么写,最开始我这么写的:

复制代码

int strcmp(char *src,char *dst) { char *p=src,*q=dst; while( (*p!='\0') && (*q!='\0')) { if(*p==*q) { p++; q++; } else if(*p<*q) { return -1; } else { return 1; } } return 0; }

复制代码

表面上看没有问题,但是有很大的问题,但2个长度不等时,退出循环还是输出了0,。如de和def比较还是0.

可以把return改下,判断*P和*q是否后面还有。显然太麻烦了。

函数源码:

复制代码

/*** *strcmp - compare two strings, returning less than, equal to, or greater than * *Purpose: *       STRCMP compares two strings and returns an integer *       to indicate whether the first is less than the second, the two are *       equal, or whether the first is greater than the second. * *      Comparison is done byte by byte on an UNSIGNED basis, which is to *       say that Null (0) is less than any other character (1-255).* *Entry: *       const char * src - string for left-hand side of comparison *       const char * dst - string for right-hand side of comparison * *Exit: *       returns -1 if src <  dst *       returns  0 if src == dst *       returns +1 if src >  dst * *Exceptions: * *******************************************************************************/ int __cdecl strcmp ( const char * src, const char * dst ) { int ret = 0 ; while( ! (ret = *(unsigned char *)src - *(unsigned char *)dst) && *dst) ++src, ++dst; if ( ret < 0 ) ret = -1 ; else if ( ret > 0 ) ret = 1 ; return( ret ); }

复制代码

刚开始对 while( ! (ret = *(unsigned char *)src - *(unsigned char *)dst) && *dst) ++src, ++dst; 不是很理解。 如果是de和def比较,*src没有为0,还是在继续比较吗? 刚开始我们认为是在继续比较,其实没有比较了。因为。 ! ret ret=0才继续比较。 ret=0-'f'=负数。 !负数   为假。 0为假,非0为真。!0为真。 这里取非很巧妙。没有 用 ! (ret = *(unsigned char *)src - *(unsigned char *)dst) && *src && *dst)这种。 strcmp算法的可以有多种,不过我觉的可以把这么多算法分为两种:一种是利用减法运算判断结果,另一种是利用比较运算==得出结果。上面的就是用减法。判断。 为什么要把src转成: unsigned char *

这个函数要注意的几点:

(1)使用*(unsigned char *)str1而不是用*str1。这是因为传入的参数为有符号数,

有符号字符值的范围是-128-127,无符号字符值的范围是0-255,而字符串的ASCII没有负值,若不转化为无符号数,在减法实现时出现错误。

例如:str的值为1,str2的值为255。

作为无符号数计算时ret=-254,结果为负值,正确。

作为有符号数计算时ret=-2,结果为正值,错误。

ascii char范围为0-127,为什么上面说的255.怎么才能打印255的字符。

在cmd下,按alt+255 回车,就可以打印ÿ。这个不是ascii字符。

我们把这个字符粘贴到vs2010文件中,会提示当前编码文件为ascii格式,不能存储当前的字符,是否转换为unicode,转换为unicode就可以存储这个字符了。


char *c="dÿ";
printf("%s\n",c);

运行控制台会输出:

d?

?说明第二个字符不可打印。

(2)while循环中(ret=*(unsigned char *)str1 - *(unsigned char *)str2)&& *str1,最后的str1也可以换成str2,因为前面已经做了相减,无论哪个先为'\0'都会退出。

(3)这个函数没有判断参数为NULL时的情况,所以当传入NULL时程序会崩溃。 可以看到我们传递的参数有const,这会为面试加分。

用比较实现

复制代码

int strcmp(const char *str1,const char * str2) { while((*str1)&&(*str1 == *str2)) { str1++; str2++; } if(*(unsiged char *)str1 > *(unsiged char *)str2) { return 1; } else if(*(unsiged char *)str1 < *(unsiged char *)str2) { return -1; } else { return 0; } }

复制代码

注意:把while循环简写成while((*str1)&&(*str1++ == *str2++))

当str1为abcd, str2为abfd时,由于判断到第三个字符时while推出,而str指针又加了1,str都指向第四个字符输出结果为0,显然 这是错误的。

参考了:http://www.cnblogs.com/kaifublog/archive/2012/09/23/2699017.html strlen:

复制代码

int strlen(const char *str) { int len = 0; assert(str != NULL); while(*str++) { len++; } return len; }

复制代码

我刚开始写的是:

复制代码

int strlen2(const char *src) { const char *p=src; int i=0; while(*p++) i++; return i; }

复制代码

用了一个临时的p来存储src,有没有必要,是没有必要的,调用时,形参只是copy一份实参的值,所以,src只是copy了一份

原理src的值。

源码:

复制代码

size_t __cdecl strlen ( const char * str) { const char *eos = str; while( *eos++ ) ; return( eos - str - 1 ); }

复制代码

用递归求:

复制代码

int strlen4(const char *str) { if(*str=='\0') return 0; else return strlen4(++str)+1; }

复制代码

有点非常值得注意,最开始我写的是strlen4(str++),程序崩溃了,为什么?

每次函数内部调用时,str都指向h,strlen4(str)执行,str根本没动,导致了无穷递归,实在是一个很大的错误。

strncpy:

原型:char * strncpy(char *dest, char *src,num);

功能:(c/c++)复制src中的内容(字符,数字、汉字....)到dest,复制多少由num的值决定,返回指向dest的指针。如果遇到null字符('\0'),且还没有到num个字符时,就用(num - n)(n是遇到null字符前已经有的非null字符个数)个null字符附加到destination。注意:并不是添加到destination的最后,而是紧跟着由source中复制而来的字符后面。下面举例说明[1]:

char des[] = "Hello,i am!";

char source[] = "abc\0def";

strncpy(des,source,5);

此时,des区域是这样的:a,b,c,\0,\0,逗号,i,空格,a,m,!

在测试时不要用prinf("%s"),因为遇到\0就结束了,  for(int i=0;i<sizeof(d)/sizeof(d[0]);i++) printf("%c",d[i]);

注意:\0,\0并不是添加在!的后面。

头文件:#include "string.h"

说明:

如果n > dest串长度,dest栈空间溢出产生崩溃异常。

否则:

1)src串长度<=dest串长度,(这里的串长度包含串尾NULL字符)

如果n<src串长度,src的前n个字符复制到dest中。但是由于没有NULL字符,所以直接访问dest串会发生的异常情况。

如果n = src串长度,与strcpy一致。

如果n >src串长度,src串存放于desk字串的[0,src串长度],dest串的(src串长度, dest串长度]处存放NULL。

2)src串长度>dest串长度

如果n =dest串长度,则dest串没有NULL字符,会导致输出会有。如果不考虑src串复制完整性,可以将dest最后一字符置为NULL。

综上,一般情况下,使用strncpy时,建议将n置为dest串长度(除非你将多个src串都复制到dest,并且从dest尾部反向操作),复制完毕后,为保险起见,将dest串最后一字符置NULL,避免发生在第2)种情况下的输出问题。当然喽,无论是strcpy还是strncpy,保证src串长度<dest串长度才是最重要的。

我的实现:

复制代码

char *strncpy2(char *dest,char *src,int num) { char *p=dest; int i=0; while( *src && (*p++=*src++) && (i<num)) i++; if(i<num) { for(int j=1;j<=num-i;j++) { *p++='\0'; } } return dest; }

复制代码

写这几行代码时经常发生各种各样的错误,如在for(j=1;j<num-i;j++)内,j写成了i,导致与前面的i重复。

*p++='\0'写成*p='\0';导致最后一个num字符没有赋0.

源码:

复制代码

/*** *strncpy.c - copy at most n characters of string * *       Copyright (c) Microsoft Corporation. All rights reserved. * *Purpose: *       defines strncpy() - copy at most n characters of string * *******************************************************************************/ #include <cruntime.h> #include <string.h> /*** *char *strncpy(dest, source, count) - copy at most n characters * *Purpose: *       Copies count characters from the source string to the *       destination.  If count is less than the length of source, *       NO NULL CHARACTER is put onto the end of the copied string. *       If count is greater than the length of sources, dest is padded *       with null characters to length count.* * *Entry: *       char *dest - pointer to destination *       char *source - source string for copy *       unsigned count - max number of characters to copy * *Exit: *       returns dest * *Exceptions: * *******************************************************************************/ char * __cdecl strncpy ( char * dest, const char * source, size_t count ) { char *start = dest; while (count && (*dest++ = *source++))    /* copy string */ count--; if (count)                              /* pad out with zeroes */ while (--count) *dest++ = '\0'; return(start); }

复制代码

为什么我写的代码比官方写的代码要长,因为我用了一个变量i 来计算,看有没有达到num,官方则自己用num--来判断。在while

循环里用count来代替i<num.这样不加少了一个变量i,而且很紧凑。在后面的填充null时,也没用用j来技术,还是count字减。

官方的源码写的漂亮。

strrev:

自己写的:

复制代码

char * strrev2(char *src) { char *p,*q; p=src; q=src+strlen(src)-1; while(p<q) { char tmp=*p;*p=*q;*q=tmp; //注意是char tmp,我已经习惯写成int tmp p++; q--; } return src; }

复制代码

官方源码:

复制代码

char * __cdecl _strrev ( char * string ) { char *start = string; char *left = string; char ch; while (*string++)                 /* find end of string */ ; string -= 2; while (left < string) { ch = *left; *left++ = *string; *string-- = ch; } return(start); }

复制代码

更多