Python标准库之collections模块

来源:千锋教育

发布人:xqq

2023-11-05

推荐

在线提问>>

collections模块简介

collections是Python标准库里有关数据类型的模块，里面包含了一些实用的数据类型，在某些情况下作为Python标准内建容器(dict,list,set,和tuple)的替代选择。

namedtuple()命名元组的工厂函数

Python官方文档上是这样说的:"命名元组赋予每个位置一个含义，提供可读性和自文档性。它们可以用于任何普通元组，并添加了通过名字获取值的能力，通过索引值也是可以的。“我是这样理解的:它可以构建一个有名字的类，而且为元组中的元素添加了更易懂的"名字”(或者说是对元素的简单描述)，这样就可以用"名字"取值。

如果元组内的元素很多，比如记录一个人的身高，年龄，家庭住址，电话号码…等等，只靠索引访问这些信息是很麻烦的，这就凸显出了"名字"的重要性。

fromcollectionsimportnamedtuple

City=namedtuple('City','namecountry')#注1

beijing=City('Beijing','China')

print(beijing)#City(name='Beijing',country='China')

print(beijing.name)#通过"名字"获取对应的值

print(beijing.country)

print(beijing[0])#同样支持用索引访问

注1.创建了一个类名是"City"的类，其中"name"和"country"是"名字"，"名字"可以是数个字符串组成的可迭代类型(比如list)，还可以是用空格分开的字符串。

下面介绍一些常用的功能：

fromcollectionsimportnamedtuple

Point=namedtuple('Point',['x','y'])

print(Point._fields)#_fields方法会返回一个包含"Point"类里所有"名字"的元组('x','y')

p=[1,2]

print(Point._make(p))#_make()接受一个可迭代对象创建新的命名元组

p=Point(1,2)

print(p._asdict())#返回一个OrderedDict(这个数据类型以后再谈)，它能友好地呈现出元组里的信息

print(p._replace(x=2))#返回一个新的命名元组实例，并将指定"名字"的值替换为新的值

print(p)#_replace()返回的是新的命名元组实例，所以p不会改变

p2={'x':2,'y':3}

print(Point(**p2))#将字典转化为命名元组

Counter(计数器)

Counter是dict的子类，可以给可散列对象(文末有解释)计数。

废话不多说，直接上例子:

fromcollectionsimportCounter

a=Counter('aaabbcdddd')#统计'aaabbcdddd'(可迭代对象)里字母出现的次数并创建对应的计数器(按次数大小排列)

print(a)

b=Counter()#空的计数器

print(b)

c=Counter({'a':3,'b':2,'c':3,'d':4})#根据字典创建计数器

print(c)

d=Counter(a=3,b=2,c=1,d=4)#根据键值创建

print(d)

e=Counter(['a','a','b'])#也可以换成其他可迭代对象

print(e['a'])#统计列表中'a'出现的次数

print(e['c'])#如果没有相应的键就返回零

下面介绍一些常用的功能：

fromcollectionsimportCounter

#elements()方法会返回一个迭代器

a=Counter(a=2,b=1,c=0,d=-1)#elements()函数会忽略计数值小于1的元素

print(sorted(f.elements()))#迭代器不能直接打印，需要先用sorted()函数新建一个列表

#most_common([n])返回一个包含n个最常见的元素及出现次数的列表

b=Counter('aaabbcdddd')

print(g.most_common(2))#结果:[('d',4),('a',3)]

print(g.most_common())#如果不传参或传"None",将返回计数器中的所有元素

print(g.most_common(None))

#subtract减去元素

e=Counter(a=4,b=1,c=0,d=-1)

f=Counter(a=2,b=1,c=2,d=0)

e.subtract(f)#这里既可以减去可迭代对象(如字符串，列表)也可以是映射对象(如字典)

print(e)

e.subtract('aaa')

print(e)#输入和输出都可以是0或者负数

关于可散列对象的介绍不多，《流畅的Python》里是这样说的(选自Python词汇表):

如果一个对象是可散列的，那么在这个对象的生命周期中，他的散列值是不会变的，而且这个对象需要实现__hash__()方法。另外还要有__eq__()方法，这样才能和其他键作比较。如果两个可散列对象是相等的，那么他们的散列值一定是一样的。

简单说可散列对象就是能被映射成数字的对象。

“可散列”，"映射"会牵扯到一种数据结构:散列表(《算法图解》第五章和《流畅的Python》第三章中对散列表都有一定介绍，读者可以用微信读书了解这种数据结构)

在理解了散列表之后，可散列对象就不难理解了。

下面看几个例子：

a=1

print(hash(a))

s='a'

print(hash(s))

t1=(1,2,3)

t2=(1,[2,3])

t3=(1,frozenset([2,3]))

print(hash(t1))

print(hash(t2))

print(hash(t3))

l=[1,2]

print(hash(l))#list是不可散列的，所以会抛出异常:TypeError:unhashabletype:'list'

b=1

print(hash(a)==hash(b))

在以上的例子中，变量a,s,t1和t3都是可散列对象(都实现了__hash__()方法);

最后一个例子证明了"如果两个可散列对象是相等的，那么他们的散列值一定是一样的"这句话。

总结一下可散列对象:

1.str(s),bytes,和数值类型(a);

2.frozenset，因为frozenset只能容纳可散列类型;

3.在元组里的所有元素都是可散列类型的情况下，它才是可散列的。

以上内容为大家介绍了Python标准库之collections模块，希望对大家有所帮助，如果想要了解更多Python相关知识，请关注 IT培训机构:千锋教育。//www.mobiletrain.org/

上一篇如何把awk脚本移植到Python

下一篇详解Python元类

如何使用python中的help函数?

如何使用python的callable函数?

python gensim库是什么?

python中xluntils库是什么?

python中getattr()是什么?

校区精品课程

互联网前瞻热门课程从入门到成神

全国旗舰校区