python中的迭代器详解

#原创,转载请先联系

理论性的东西有点枯燥,耐心点看~

1.迭代是什么?

我们知道可以对list,tuple,dict,str等数据类型使用for...in的循环语法,从其中依次取出数据,这个过程叫做遍历,也叫迭代。迭代是访问集合元素的一种常用的方式。

------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

2.可迭代对象是什么?

简单来说,可以用for...in循环语句,从其中依次取出数据的对象,就是可迭代对象。例如,列表、元组、字典、字符串都是可迭代对象。整数、浮点数、布尔值都是不可迭代的。

------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

3.迭代器是什么?

在可迭代对象进行迭代的时候,即用for...in...循环语法依次取出数据时,过程是怎样的呢?

我们发现,每迭代一次(即在for...in...中每循环一次)都会返回对象中的下一条数据,一直向后读取数据直到迭代了所有数据后结束。那么,在这个过程中就应该有一个“人”去记录每次访问到了第几条数据,以便每次迭代都可以返回下一条数据。我们把这个能帮助我们进行数据迭代的“人”称为迭代器(Iterator)。举个栗子,老师安排一个班的同学每节课上课前进行演讲,按学号顺序进行,A同学这节课演讲,老师就会记住这节课是A同学演讲,那么下节课就是B同学进行演讲...依次类推,在这个例子里,老师就是一个迭代器。

------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

4.怎样获取可迭代对象的迭代器?

我们可以通过iter()内置函数取得可迭代对象的迭代器。

list = [1,2,3,4,5]  # list是可迭代对象
lterator = iter(list)  # 通过iter()方法取得list的迭代器
print(lterator)

输出:
<list_iterator object at 0x7f35e6537a20>

迭代器是获取到了,那么应该怎样用呢?

next()函数是通过迭代器获取下一个位置的值。

注意: 当我们已经迭代完最后一个数据之后,再次调用next()函数会抛出StopIteration的异常,来告诉我们所有数据都已迭代完成,不用再执行next()函数了。

list = [1,2,3,4,5]  # list是可迭代对象
lterator = iter(list)  # 通过iter()方法取得list的迭代器
print(next(lterator))  # 1
print(next(lterator))  # 2
print(next(lterator))  # 3
print(next(lterator))  # 4
print(next(lterator))  # 5
print(next(lterator))

输出:
1
2
3
4
5
Traceback (most recent call last):
  File "/home/chichung/桌面/课堂练习/协程/iter方法取得可迭代对象的迭代器.py", line 8, in <module>
    print(next(lterator))
StopIteration

看完觉得奇怪的同学,是不是觉得一个对象能拿出一个迭代器很amazing。好像编的一样,别急,继续看上去,下面有答案。

------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

5.判断一个对象是否可迭代

isinstance(object,classinfo)内置函数可以判断一个对象是否是一个已知的类型,类似 type()。

  • object -- 实例对象。
  • classinfo -- 可以是直接或间接类名、基本类型或者由它们组成的元组。

在这之前,还需要知道collections模块里的Iterable。通俗点讲,凡是可迭代对象都是这个类的实例对象。下面来验证一下:

import collections

print(isinstance([1, 2, 3], collections.Iterable))
print(isinstance((1,2,3), collections.Iterable))
print(isinstance({"name":"chichung","age":23}, collections.Iterable))
print(isinstance("sex", collections.Iterable))
print(isinstance(123,collections.Iterable))
print(isinstance(True,collections.Iterable))
print(isinstance(1.23,collections.Iterable))

输出:
True
True
True
True
False
False
False

------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

6.可迭代对象怎么可以获取迭代器呢?

看完第4点,有些人就感觉很奇怪,例如:[1,2,3]不就是一个列表,一个对象吗?怎么还能拿出一个迭代器来了?

首先,我们从第5点可以知道,可迭代对象其实都是collections模块里的Iterable类创建出来的实例的。你写一个列表,以为他不是任何类创建的,只是单纯一个列表?不是的,其实它就是Iterable类创建的实例对象。点进Iterable的类看一下,你会发现新大陆。

class Iterable(metaclass=ABCMeta):

    __slots__ = ()

    @abstractmethod
    def __iter__(self):  # 注意点
        while False:
            yield None

原来由Iterable创建的对象,是有一个魔方方法__iter__(self)的。这个方法就是返回一个迭代器的。所以,由Iterable类创建的实例对象,是可以拿出一个迭代器的。

接下来要说的有点绕......

之所以Iterable类创建的对象是可迭代对象,是因为Iterable类有这个方法!不信?我就来编写一个能创建可迭代对象的类。

 

import collections

class BecomeIterable:

    def __iter__(self):
        """返回一个空的迭代器"""
        return None

people = BecomeIterable()
print(isinstance(people, collections.Iterable))

输出:
True

 

骚不骚?什么都没有,就一个魔法方法,创建的对象就是可迭代对象了。

------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

7.迭代器为什么能用next()函数进行迭代?

我们知道,可以用iter()函数,在可迭代对象中获取迭代器。例如:iterator = iter([1,2,3])

这样一看,迭代器也就是一个对象而已啊,为什么他可以用next()函数,一下子出来一个值,一下子又出来一个值。

其实是这样的,iter()函数能调用可迭代对象的魔方方法__iter__(),从而返回一个迭代器。怎么返回的呢?__iter__()方法是使用collections模块里的Iterator类来创建一个迭代器对象。

接下来看下Iterator的一部分源代码:

class Iterator(Iterable):

    __slots__ = ()

    @abstractmethod
    def __next__(self):
        'Return the next item from the iterator. When exhausted, raise StopIteration'
        raise StopIteration

    def __iter__(self):
        return self

是不是茅塞顿开了?和第6点的解释原理一样。这里就不详细解释了。稍微注意下魔方方法__next__()的最后一句,如果超出迭代方位就抛出StopIteration异常。

还有一点需要注意,迭代器的源代码也有__iter__()魔方方法,所以,Iterator也是一个可迭代对象呀!!!

所以,如果你喜欢在迭代器里面再取出迭代器也是可以的,但是好像有点无聊......目前还不知道有什么应用到......

 ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

8.创建一个迭代器类

理论讲完了额...不懂的还是要多看几遍。下面开始应用~

如果我们编写一段代码,想把结果一个一个迭代出来,这时候就需要编写迭代器类了。

class MyIterator():
    def __init__(self):
        self.list = []
        self.position = 0

    def add_name(self,name):
        self.list.append(name)

    def __iter__(self):
        return self  # 返回一个迭代器

    def __next__(self):
        if self.position < len(self.list):
            item = self.list[self.position]
            self.position += 1
            return item
        else:
            raise StopIteration


people = MyIterator()  # people对象既是一个迭代器,也是一个可迭代对象
people.add_name("张三")
people.add_name("李四")
people.add_name("王五")

# 把people当做一个迭代器来看时
print(next(people))
print(next(people))
print(next(people))

# 把humen当做一个可迭代对象来看时
humen = MyIterator()  # 因为迭代器只能用一次,再用会抛出错误,所以需要再创建
humen.add_name("张三")
humen.add_name("李四")
humen.add_name("王五")
iterator = iter(humen)  # iter()方法获取可迭代对象的迭代器
print(next(iterator))
print(next(iterator))
print(next(iterator))

输出:
张三
李四
王五
张三
李四
王五

注意看注释,如果原理都懂,这其实是一个很简单的例子。

posted @ 2018-08-26 21:27  苦瓜爆炒牛肉  阅读(6588)  评论(0编辑  收藏  举报