怎么给你说呢?
这些牵涉到Iterables和Generator的定义.
先讲Iterables吧, 在Python中很多东西都可以使用for...in...来iterable,比如list, strings, 和files. 这些iterables是方便,你可多次经行处理,因为你在内存中存储的所有值.
下面是个例子:
>>> mylist = [1, 2, 3]>>> for i in mylist:
.. print(i)
1
2
3
>>> mylist = [x*x for x in range(3)]
>>> for i in mylist:
... print(i)
0
1
4
然后是Generator. 广义上将Generator也是个Iterator, 但是你不能reset, 也就是说你只能历遍一次.因为内存存储的问题,当你使用yield的之前, 内存中存储的是你需要的值,当你调用完之后内存中存储的是你的下一个需要的值. 换句话说你如果用Generator内存的使用比较少.是一个常量.
下面是个例子:
>>> mygenerator = (x*x for x in range(3))
>>> for i in mygenerator:
... print(i)
0
1
4
两个例子请注意括号的不同.
yield关键字工作原理与上面所说的Generator类似. 原理也一样,这也就是为什么当你得到最后一个值后,尝试着调用next()会出错的问题. 或者说长度为0, 因为此时内存中没有存值.
如果你想处理完,再次历遍输入内容. 给你介绍个比较简洁的方法.
y = FunctionWithYield()
y, y_backup = tee(y)
for x in y:
print(x)
for x in y_backup:
print(x)
tee() 函数,生成了一个列表,存储了所有的输入值.
题外话: 如果你学过Python相比你可能知道range和xrange两个不同的关键字. 例如在Python 2.x 中, 代码:
for i in range(1000): pass
会导致生成一个 1000 个元素的 List,而代码:
for i in xrange(1000): pass
则不会生成一个 1000 个元素的 List,而是在每次迭代中返回下一个数值,内存空间占用很小。因为 xrange 不返回 List,而是返回一个类似的iterable 对象。
网上曾经有人尝尝着模拟range和xrange, 猜测xrange中包含yield的函数.实现结果也符合猜想.
结合上面所说的 这也就是为什么xrange更加高效.
至于yield内存使用方法, 确实没有深究. 所以不能给你提供更多信息. 但想必也已经解决了你的部分疑问.