2020-7-10 13:44:36 | 作者:老铁SEO | 0个评论 | 人浏览
字符串或串(String)是由数字、字母、下划线组成的一串字符。一般记为s=“a1a2···an”(n>=0)。它是编程语言中表示文本的数据类型。通常以串的整体作为操作对象,如:在串中查找某个子串、求取一个子串、在串的某个位置上插入一个子串以及删除一个子串等。两个字符串相等的充要条件是:长度相等,并且各个对应位置上的字符都相等。
python字符串相关特性
1属于python基本数据类型和结构的一种。2本身是不可变的数据类型。3有很多内置的方法
字符串连接
方法1:用字符串的join方法
a=['a','b','c','d']
content=''
content=''.join(a)
printcontent
方法2:用字符串的替换占位符替换
a=['a','b','c','d']
content=''
content='%s%s%s%s'%tuple(a)
printcontent
想要了解更多,请看python字符串连接
字符串截取
我们可以通过索引来提取想要获取的字符,可以把python的字符串也做为字符串的列表就更好理解
python的字串列表有2种取值顺序
1是从左到右索引默认0开始的,最大范围是字符串长度少1
s='ilovepython'
s[0]的结果是i
2是从右到左索引默认-1开始的,最大范围是字符串开头
s='ilovepython'
s[-1]的结果是n
上面这个是取得一个字符,如果你的实际要取得一段子串的话,可以用到变量[头下标:尾下标],就可以截取相应的字符串,其中下标是从0开始算起,可以是正数或负数,下标可以为空表示取到头或尾。
比如
s='ilovepython'
s[1:5]的结果是love
当使用以冒号分隔的字符串,python返回一个新的对象,结果包含了以这对偏移标识的连续的内容,左边的开始是包含了下边界,比如
上面的结果包含了s的值l,而取到的最大范围不包括上边界,就是s[5]的值p
想要了解更多,请看python字符串截取
字符串替换
字符串替换可以用内置的方法和正则表达式完成。
1用字符串本身的replace方法:
a='helloword'
b=a.replace('word','python')
printb
2用正则表达式来完成替换:
importre
a='helloword'
strinfo=re.compile('word')
b=strinfo.sub('python',a)
printb
想要了解更多,请看python字符串替换
字符串比较
cmp方法比较两个对象,并根据结果返回一个整数。cmp(x,y)如果X<Y,返回值是负数如果X>Y返回的值为正数。
sStr1='strch'
sStr2='strchr'
printcmp(sStr1,sStr2)##-1
字符串相加
我们通过操作符号+来进行字符串的相加,不过建议还是用其他的方式来进行字符串的拼接,这样效率高点。
原因:在循环连接字符串的时候,他每次连接一次,就要重新开辟空间,然后把字符串连接起来,再放入新的空间,再一次循环,又要开辟新的空间,把字符串连接起来放入新的空间,如此反复,内存操作比较频繁,每次都要计算内存空间,然后开辟内存空间,再释放内存空间,效率非常低。
sStr1='strch'
sStr2='strchr'
newstr=sStr1+sStr2
printnewstr
字符串查找
python字符串查找有4个方法,1find,2index方法,3rfind方法,4rindex方法。
1find()方法:
info='abca'
printinfo.find('a')##从下标0开始,查找在字符串里第一个出现的子串,返回结果:0
info='abca'
printinfo.find('a',1)##从下标1开始,查找在字符串里第一个出现的子串:返回结果3
info='abca'
printinfo.find('333')##返回-1,查找不到返回-1
2index()方法:
python的index方法是在字符串里查找子串第一次出现的位置,类似字符串的find方法,不过比find方法更好的是,如果查找不到子串,会抛出异常,而不是返回-1
info='abca'
printinfo.index('a')
printinfo.index('33')
字符串分割
字符串分割,可以用split,rsplit方法,通过相应的规则来切割成生成列表对象
info='name:haha,age:20$name:python,age:30$name:fef,age:55'
content=info.split('$')
printcontent
字符串翻转
通过步进反转[::-1]
a='abcd'
b=a[::-1]##[::-1]通过步进反转
printb
字符串编码
通过字符串的decode和encode方法
1encode([encoding,[errors]])
#其中encoding可以有多种值,比如gb2312gbkgb18030bz2zlibbig5bzse64等都支持。errors默认值为"strict",意思是UnicodeError。可能的值还有'ignore','replace','xmlcharrefreplace','backslashreplace'和所有的通过codecs.register_error注册的值。
S.decode([encoding,[errors]])下面是字符串编码应用:
a='你好'
b='python'
printa.decode('utf-8').encode('gbk')##decode方法把字符串转换为unicode对象,然后通过encode方法转换为指定的编码字符串对象
printb.decode('utf-8')##decode方法把字符串转换为unicode对象
字符串追加和拼接
通过字符串的占位符来进行字符串的拼接
#1元组拼接
m='python'
astr='ilove%s'%m
printastr
#2字符串的format方法
m='python'
astr="ilove{python}".format(python=m)
printastr
#3字典格式化字符串
m='python'
astr="ilove%(python)s"%{'python':m}
printastr
字符串复制
通过变量来进行赋值
fstr='strcpy'
sstr=fstr
fstr='strcpy2'
printsstr
字符串长度
通过内置方法len()来计算字符串的长度,注意这个计算的是字符的长度。
aa='afebb'
bb='你'
printlen(aa)
printlen(bb)
字符串大小写
通过下面的upper(),lower()等方法来转换大小写
S.upper()#S中的字母大写
S.lower()#S中的字母小写
S.capitalize()#首字母大写
S.istitle()#S是否是首字母大写的
S.isupper()#S中的字母是否便是大写
S.islower()#S中的字母是否全是小写
字符串去空格
通过strip(),lstrip(),rstrip()方法去除字符串的空格
S.strip()去掉字符串的左右空格
S.lstrip()去掉字符串的左边空格
S.rstrip()去掉字符串的右边空格
字符串其他方法
字符串相关的其他方法:count(),join()方法等。
S.center(width,[fillchar])#中间对齐
S.count(substr,[start,[end]])#计算substr在S中出现的次数
S.expandtabs([tabsize])#把S中的tab字符替换没空格,每个tab替换为tabsize个空格,默认是8个
S.isalnum()#是否全是字母和数字,并至少有一个字符
S.isalpha()#是否全是字母,并至少有一个字符
S.isspace()#是否全是空白字符,并至少有一个字符
S.join()#S中的join,把列表生成一个字符串对象
S.ljust(width,[fillchar])#输出width个字符,S左对齐,不足部分用fillchar填充,默认的为空格。
S.rjust(width,[fillchar])#右对齐
S.splitlines([keepends])#把S按照行分割符分为一个list,keepends是一个bool值,如果为真每行后而会保留行分割符。
S.swapcase()#大小写互换
Python中如何定义字符串
在Python中字符串是不可改变的对象(immutable),因此无法直接修改字符串的某一位字符。
一种可行的方式,是将字符串转换为列表,修改列表的元素后,在重新连接为字符串。
示例代码如下:
s='abcdefghijk'#原字符串l=list(s)#将字符串转换为列表,列表的每一个元素为一个字符l='z'#修改字符串的第1个字符为znewS=''.join(l)#将列表重新连接为字符串print(newS)#azcdefghijk#修改后的字符串
如何进行Python字符串操作?
它合理地结合了高性能与使得编写程序简单有趣的特色,下面讲述python字符串操作流程。要使用string的方法要先import,但后来由于众多的python使用者的建议,从python2.0开始,string方法改为用S.method()的形式调用,只要S是一个字符串对象就可以这样使用,而不用import。同时为了保持向后兼容,现在的Python中仍然保留了一个string的module。阐述编制Python程序相关注意什么是Python解释器及其使用?深度剖析PythonWeb应用程序怎样正确安装Python?浅析Python中的Python全局变量其中定义的方法与python字符串操作是相同的,这些方法都最后都指向了用S.method()调用的函数。要注意,S.method()能调用的方法比string的module中的多,比如isdigit()、istitle()等就只能用S.method()的方式调用。对一个字符串对象,首先想到的操作可能就是计算它有多少个字符组成,很容易想到用S.len(),但这是错的,应该是len(S)。因为len()是内置函数,包括在__builtin__模块中。python字符串操作不把len()包含在string类型中,乍看起来好像有点不可理解,其实一切有其合理的逻辑在里头。len()不仅可以计算字符串中的字符数。还可以计算list的成员数,tuple的成员数等等,因此单单把len()算在string里是不合适,因此一是可以把len()作为通用函数。用重载实现对不同类型的操作,还有就是可以在每种有len()运算的类型中都要包含一个len()函数。Python选择的是第一种解决办法。类似的还有str(arg)函数,它把arg用string类型表示出来。
字符串中字符大小写的变换:S.lower()#小写S.upper()#大写S.swapcase()#大小写互换S.capitalize()#首字母大写String.capwords(S)字符串在输出时的对齐:S.lower()#小写S.upper()#大写S.swapcase()#大小写互换S.capitalize()#首字母大写String.capwords(S)字符串中的搜索和替换:S.lower()#小写S.upper()#大写S.swapcase()#大小写互换S.capitalize()#首字母大写String.capwords(S)使用上面的函数产后的翻译表,把S进行翻译,并把deletechars中有的字符删掉。需要注意的是,如果S为unicode字符串,那么就不支持deletechars参数。可以使用把某个字符翻译为python字符串操作的方式实现相同的功能。此外还可以使用codecs模块的功能来创建更加功能强大的翻译表。
python字符串为什么有
一.Python中如何声明字符串
在Python中声明一个字符串通常有三种方法:在它的两边加上那个单引号、双引号或者三引号。
如:
从上面可以看出三种声明方法的效果是完全一样的,在Python中用这三种声明方法来声明字符串意义完全等同的,即'helloworld'和"helloworld"以及'''helloworld'''是没有任何区别的。但是会有人问:既然是完全等同的,为什么要弄出三种声明方式呢?下面看一下这几个例子:
在Python中提供了这几种方法,使得使用起来更加方便灵活(当然也可以使用转义字符去解决上面报错的地方)。
在这里要注意的是,
1)在Python中没有类似C语言中char这种类型的字符串,也就是说即使是单个字符也是字符串。
2)Python中的字符串一旦声明,是不能进行更改的,即不能通过对某一位置重新赋值改变内容。
二.Python中的字符串类型
Python中的字符串有两种数据类型:str类型和unicode类型。str类型采用的ASCII编码,也就是说它无法表示中文。unicode类型采用unicode编码,能够表示任意的字符,包括中文、日文、韩文等。
在python中字符串默认采用的ASCII编码,如果要显示声明为unicode类型的话,需要在字符串前面加上'u'或者'U'。
下面看一段代码
print'我'
printu'我'
print'python'
printu'python'
这段代码的运行结果为:
从运行结果可以看出,如果是中文的话,不采用unicode类型,输出的会是乱码。
三.转义字符和原始字符串
同C语言中一样,Python中也有转义字符,用反斜杠'\'来表示对后面字符进行转义。
比如上面例子中的问题就可以用转义来解决:
如果你编写过Java程序,并且使用过Java中的正则表达式,你可能会对Java正则表达式深恶痛绝(我自己就是),因为稍不注意就会出错,里面有太多的转义,而且看起来也很繁琐杂乱。在Python中,你不必再为这个问题烦恼了,因为Python提供了原始字符串,顾名思义,就是保留原始字符的意思,不对反斜杠及反斜杠后面的字符进行转义,声明原始字符串的方法是在字符串前面加上'r'或者'R'。
在这里要注意:在Python中行尾结束符始终为'\n',不论Python程序在哪个操作系统下运行。在Linux环境下编写C语言时,换行符为'\n',而在windows下为'\r\n'。编写Python程序不用担心这种因运行环境不同引起的不兼容问题。
四.用户输入以及格式化输出字符串
在Python中最常用的从键盘获取输入的函数是raw_input()和input()。但是这两个函数有很大的区别:
raw_input()以字符串的形式返回用户输入的一切内容;
而input()却不是这样,它会根据输入内容的形式确定返回的形式(可能有点拗口)。下面看个例子就明白了:
从这个例子显而易见可以看出两者的区别,同样输入123,raw_input()返回的是字符串123,而input()返回的是整数123。个人建议一般情况下使用raw_input()获取输入,这样能避免程序中出现一些不必要的麻烦。
同C语言一样,Python中也提供了格式化输出。
Python中的格式化输出和C语言类似,基本格式如下:
print'....%formmat..'%(var...)
当var只有一个时,括号可以省略。