字符串操作函数string.h相关函数strcpy,strcat,等源码
2013-08-20 20:35 阅读(2842) 评论(0) 收藏
首先说一下源码到底在哪里找。
我们在文件中包含<cstring>时,如果点击右键打开文档,
会打开cstring,我们会发现路径为:
D:\Program Files\visual studio\VC\include\cstring
这个文件内容如下:
// cstring standard header #pragma once #ifndef _CSTRING_ #define _CSTRING_ #include <yvals.h> #ifdef _STD_USING #undef _STD_USING #include <string.h> #define _STD_USING #else /* _STD_USING */ #include <string.h>#endif /* _STD_USING */ #if _GLOBAL_USING && !defined(RC_INVOKED) _STD_BEGIN using _CSTD size_t; using _CSTD memchr; using _CSTD memcmp; using _CSTD memcpy; using _CSTD memmove; using _CSTD memset; using _CSTD strcat; using _CSTD strchr; using _CSTD strcmp; using _CSTD strcoll; using _CSTD strcpy; using _CSTD strcspn; using _CSTD strerror; using _CSTD strlen; using _CSTD strncat; using _CSTD strncmp; using _CSTD strncpy; using _CSTD strpbrk; using _CSTD strrchr; using _CSTD strspn; using _CSTD strstr; using _CSTD strtok; using _CSTD strxfrm; _STD_END #endif /* _GLOBAL_USING */ #endif /* _CSTRING_ */ /* * Copyright (c) 1992-2009 by P.J. Plauger. ALL RIGHTS RESERVED. * Consult your license regarding permissions and restrictions. V5.20:0009 */
它没有cpp文件。包含了<string.h>头文件,也在这个目录下,内容如下;
View Code
在Vc\include下面倒是有一个string的cpp文件,但是没有string操作函数的代码,那么strcpy,strcat源码到底在哪里?
在D:\Program Files\visual studio\VC\crt\src 目录下面。
这个目录下面包含所有C语言函数的源代码。
大多数函数的名字都是以名字命名的.c文件里,但是strcpy并没有strcpy.c文件,它的源码在strcat.c里面:
strcat.c内容如下:
/*** *strcat.c - contains strcat() and strcpy() * *Purpose: * Strcpy() copies one string onto another. * * Strcat() concatenates (appends) a copy of the source string to the * end of the destination string, returning the destination string. * *******************************************************************************/ #include <cruntime.h> #include <string.h> #ifndef _MBSCAT #pragma function(strcat,strcpy) #endif /* _MBSCAT */ /*** *char *strcat(dst, src) - concatenate (append) one string to another * *Purpose: * Concatenates src onto the end of dest. Assumes enough * space in dest. * *Entry: * char *dst - string to which "src" is to be appended * const char *src - string to be appended to the end of "dst" * *Exit: * The address of "dst" * *Exceptions: * *******************************************************************************/ char * __cdecl strcat ( char * dst, const char * src ) { char * cp = dst; while( *cp ) cp++; /* find end of dst */ /*不能写成while(*cp++)/ 因为这样的话为*cp为0时还会+1,导致cp执向了\0的后一个。 while( *cp++ = *src++ ) ; /* Copy src to end of dst */ return( dst ); /* return dst */ } /*** *char *strcpy(dst, src) - copy one string over another * *Purpose: * Copies the string src into the spot specified by * dest; assumes enough room. * *Entry: * char * dst - string over which "src" is to be copied * const char * src - string to be copied over "dst" * *Exit: * The address of "dst" * *Exceptions: *******************************************************************************/ char * __cdecl strcpy(char * dst, const char * src) { char * cp = dst; while( *cp++ = *src++ ) ; /* Copy src over dst */ return( dst ); }
strcpy另一种实现策略:
林锐《高质量C++/C编程指南》
#include <assert.h> char *strcpy(char *strDest, const char *strSrc) { assert((strDest!=NULL) && (strSrc !=NULL)); // 2分 char *address = strDest; // 2分 while( (*strDest++ = * strSrc++) != ‘/0’ ) // 2分 ; return address ; // 2分 }
附:
strcpy能把strSrc的内容复制到strDest,为什么还要char * 类型的返回值?
答:为了实现链式表达式。 // 2分
例如 int length = strlen( strcpy( strDest, “hello world”) );
个人觉得 (*strDest++ = * strSrc++) != ‘/0’ 不能没有必要判断是否=0,因为但char内容为字符串结束符时ascii为0,dst=src; dst=0; while 判断dst是否等于0,等于0就退出了。 strcmp怎么写,最开始我这么写的:
int strcmp(char *src,char *dst) { char *p=src,*q=dst; while( (*p!='\0') && (*q!='\0')) { if(*p==*q) { p++; q++; } else if(*p<*q) { return -1; } else { return 1; } } return 0; }
表面上看没有问题,但是有很大的问题,但2个长度不等时,退出循环还是输出了0,。如de和def比较还是0.
可以把return改下,判断*P和*q是否后面还有。显然太麻烦了。
函数源码:
/*** *strcmp - compare two strings, returning less than, equal to, or greater than * *Purpose: * STRCMP compares two strings and returns an integer * to indicate whether the first is less than the second, the two are * equal, or whether the first is greater than the second. * * Comparison is done byte by byte on an UNSIGNED basis, which is to * say that Null (0) is less than any other character (1-255).* *Entry: * const char * src - string for left-hand side of comparison * const char * dst - string for right-hand side of comparison * *Exit: * returns -1 if src < dst * returns 0 if src == dst * returns +1 if src > dst * *Exceptions: * *******************************************************************************/ int __cdecl strcmp ( const char * src, const char * dst ) { int ret = 0 ; while( ! (ret = *(unsigned char *)src - *(unsigned char *)dst) && *dst) ++src, ++dst; if ( ret < 0 ) ret = -1 ; else if ( ret > 0 ) ret = 1 ; return( ret ); }
刚开始对 while( ! (ret = *(unsigned char *)src - *(unsigned char *)dst) && *dst) ++src, ++dst; 不是很理解。 如果是de和def比较,*src没有为0,还是在继续比较吗? 刚开始我们认为是在继续比较,其实没有比较了。因为。 ! ret ret=0才继续比较。 ret=0-'f'=负数。 !负数 为假。 0为假,非0为真。!0为真。 这里取非很巧妙。没有 用 ! (ret = *(unsigned char *)src - *(unsigned char *)dst) && *src && *dst)这种。 strcmp算法的可以有多种,不过我觉的可以把这么多算法分为两种:一种是利用减法运算判断结果,另一种是利用比较运算==得出结果。上面的就是用减法。判断。 为什么要把src转成: unsigned char *
这个函数要注意的几点:
(1)使用*(unsigned char *)str1而不是用*str1。这是因为传入的参数为有符号数,
有符号字符值的范围是-128-127,无符号字符值的范围是0-255,而字符串的ASCII没有负值,若不转化为无符号数,在减法实现时出现错误。
例如:str的值为1,str2的值为255。
作为无符号数计算时ret=-254,结果为负值,正确。
作为有符号数计算时ret=-2,结果为正值,错误。
ascii char范围为0-127,为什么上面说的255.怎么才能打印255的字符。
在cmd下,按alt+255 回车,就可以打印ÿ。这个不是ascii字符。
我们把这个字符粘贴到vs2010文件中,会提示当前编码文件为ascii格式,不能存储当前的字符,是否转换为unicode,转换为unicode就可以存储这个字符了。
char *c="dÿ";
printf("%s\n",c);
运行控制台会输出:
d?
?说明第二个字符不可打印。
)
(2)while循环中(ret=*(unsigned char *)str1 - *(unsigned char *)str2)&& *str1,最后的str1也可以换成str2,因为前面已经做了相减,无论哪个先为'\0'都会退出。
(3)这个函数没有判断参数为NULL时的情况,所以当传入NULL时程序会崩溃。 可以看到我们传递的参数有const,这会为面试加分。
用比较实现
int strcmp(const char *str1,const char * str2) { while((*str1)&&(*str1 == *str2)) { str1++; str2++; } if(*(unsiged char *)str1 > *(unsiged char *)str2) { return 1; } else if(*(unsiged char *)str1 < *(unsiged char *)str2) { return -1; } else { return 0; } }
注意:把while循环简写成while((*str1)&&(*str1++ == *str2++))
当str1为abcd, str2为abfd时,由于判断到第三个字符时while推出,而str指针又加了1,str都指向第四个字符输出结果为0,显然 这是错误的。
参考了:http://www.cnblogs.com/kaifublog/archive/2012/09/23/2699017.html strlen:
int strlen(const char *str) { int len = 0; assert(str != NULL); while(*str++) { len++; } return len; }
我刚开始写的是:
int strlen2(const char *src) { const char *p=src; int i=0; while(*p++) i++; return i; }
用了一个临时的p来存储src,有没有必要,是没有必要的,调用时,形参只是copy一份实参的值,所以,src只是copy了一份
原理src的值。
源码:
size_t __cdecl strlen ( const char * str) { const char *eos = str; while( *eos++ ) ; return( eos - str - 1 ); }
用递归求:
int strlen4(const char *str) { if(*str=='\0') return 0; else return strlen4(++str)+1; }
有点非常值得注意,最开始我写的是strlen4(str++),程序崩溃了,为什么?
每次函数内部调用时,str都指向h,strlen4(str)执行,str根本没动,导致了无穷递归,实在是一个很大的错误。
strncpy:
原型:char * strncpy(char *dest, char *src,num);
功能:(c/c++)复制src中的内容(字符,数字、汉字....)到dest,复制多少由num的值决定,返回指向dest的指针。如果遇到null字符('\0'),且还没有到num个字符时,就用(num - n)(n是遇到null字符前已经有的非null字符个数)个null字符附加到destination。注意:并不是添加到destination的最后,而是紧跟着由source中复制而来的字符后面。下面举例说明[1]:
char des[] = "Hello,i am!";
char source[] = "abc\0def";
strncpy(des,source,5);
此时,des区域是这样的:a,b,c,\0,\0,逗号,i,空格,a,m,!
在测试时不要用prinf("%s"),因为遇到\0就结束了, for(int i=0;i<sizeof(d)/sizeof(d[0]);i++) printf("%c",d[i]);
注意:\0,\0并不是添加在!的后面。
头文件:#include "string.h"
说明:
如果n > dest串长度,dest栈空间溢出产生崩溃异常。
否则:
1)src串长度<=dest串长度,(这里的串长度包含串尾NULL字符)
如果n<src串长度,src的前n个字符复制到dest中。但是由于没有NULL字符,所以直接访问dest串会发生的异常情况。
如果n = src串长度,与strcpy一致。
如果n >src串长度,src串存放于desk字串的[0,src串长度],dest串的(src串长度, dest串长度]处存放NULL。
2)src串长度>dest串长度
如果n =dest串长度,则dest串没有NULL字符,会导致输出会有。如果不考虑src串复制完整性,可以将dest最后一字符置为NULL。
综上,一般情况下,使用strncpy时,建议将n置为dest串长度(除非你将多个src串都复制到dest,并且从dest尾部反向操作),复制完毕后,为保险起见,将dest串最后一字符置NULL,避免发生在第2)种情况下的输出问题。当然喽,无论是strcpy还是strncpy,保证src串长度<dest串长度才是最重要的。
我的实现:
char *strncpy2(char *dest,char *src,int num) { char *p=dest; int i=0; while( *src && (*p++=*src++) && (i<num)) i++; if(i<num) { for(int j=1;j<=num-i;j++) { *p++='\0'; } } return dest; }
写这几行代码时经常发生各种各样的错误,如在for(j=1;j<num-i;j++)内,j写成了i,导致与前面的i重复。
*p++='\0'写成*p='\0';导致最后一个num字符没有赋0.
源码:
/*** *strncpy.c - copy at most n characters of string * * Copyright (c) Microsoft Corporation. All rights reserved. * *Purpose: * defines strncpy() - copy at most n characters of string * *******************************************************************************/ #include <cruntime.h> #include <string.h> /*** *char *strncpy(dest, source, count) - copy at most n characters * *Purpose: * Copies count characters from the source string to the * destination. If count is less than the length of source, * NO NULL CHARACTER is put onto the end of the copied string. * If count is greater than the length of sources, dest is padded * with null characters to length count.* * *Entry: * char *dest - pointer to destination * char *source - source string for copy * unsigned count - max number of characters to copy * *Exit: * returns dest * *Exceptions: * *******************************************************************************/ char * __cdecl strncpy ( char * dest, const char * source, size_t count ) { char *start = dest; while (count && (*dest++ = *source++)) /* copy string */ count--; if (count) /* pad out with zeroes */ while (--count) *dest++ = '\0'; return(start); }
为什么我写的代码比官方写的代码要长,因为我用了一个变量i 来计算,看有没有达到num,官方则自己用num--来判断。在while
循环里用count来代替i<num.这样不加少了一个变量i,而且很紧凑。在后面的填充null时,也没用用j来技术,还是count字减。
官方的源码写的漂亮。
strrev:
自己写的:
char * strrev2(char *src) { char *p,*q; p=src; q=src+strlen(src)-1; while(p<q) { char tmp=*p;*p=*q;*q=tmp; //注意是char tmp,我已经习惯写成int tmp p++; q--; } return src; }
官方源码:
char * __cdecl _strrev ( char * string ) { char *start = string; char *left = string; char ch; while (*string++) /* find end of string */ ; string -= 2; while (left < string) { ch = *left; *left++ = *string; *string-- = ch; } return(start); }
更多