python for in原理

2025-01-19 23:07:44
推荐回答(1个)
回答1:

怎么给你说呢?

这些牵涉到Iterables和Generator的定义. 
先讲Iterables吧, 在Python中很多东西都可以使用for...in...来iterable,比如list, strings, 和files. 这些iterables是方便,你可多次经行处理,因为你在内存中存储的所有值.

下面是个例子:

>>> mylist = [1, 2, 3]>>> for i in mylist:
..    print(i)
1
2
3
>>> mylist = [x*x for x in range(3)]
>>> for i in mylist:
...    print(i)
0
1
4

然后是Generator. 广义上将Generator也是个Iterator, 但是你不能reset, 也就是说你只能历遍一次.因为内存存储的问题,当你使用yield的之前, 内存中存储的是你需要的值,当你调用完之后内存中存储的是你的下一个需要的值. 换句话说你如果用Generator内存的使用比较少.是一个常量.

下面是个例子:

>>> mygenerator = (x*x for x in range(3))
>>> for i in mygenerator:
...    print(i)
0
1
4

两个例子请注意括号的不同.

yield关键字工作原理与上面所说的Generator类似. 原理也一样,这也就是为什么当你得到最后一个值后,尝试着调用next()会出错的问题. 或者说长度为0, 因为此时内存中没有存值.


如果你想处理完,再次历遍输入内容. 给你介绍个比较简洁的方法.

y = FunctionWithYield()
y, y_backup = tee(y)
for x in y:
    print(x)
for x in y_backup:
    print(x)


tee() 函数,生成了一个列表,存储了所有的输入值.  

题外话: 如果你学过Python相比你可能知道range和xrange两个不同的关键字.  例如在Python 2.x 中, 代码:

for i in range(1000): pass

会导致生成一个 1000 个元素的 List,而代码:

 for i in xrange(1000): pass

则不会生成一个 1000 个元素的 List,而是在每次迭代中返回下一个数值,内存空间占用很小。因为 xrange 不返回 List,而是返回一个类似的iterable 对象。

网上曾经有人尝尝着模拟range和xrange, 猜测xrange中包含yield的函数.实现结果也符合猜想. 

结合上面所说的 这也就是为什么xrange更加高效.

至于yield内存使用方法, 确实没有深究. 所以不能给你提供更多信息. 但想必也已经解决了你的部分疑问.