python直方图一行代码

5 浏览
0 Comments

python直方图一行代码

有很多种方法可以编写一个计算直方图的Python程序。

直方图函数是指一个用于计算iterable中对象出现次数并输出计数的字典的函数。例如:

>>> L = 'abracadabra'
>>> histogram(L)
{'a': 5, 'b': 2, 'c': 1, 'd': 1, 'r': 2}

编写这个函数的一种方法是:

def histogram(L):
    d = {}
    for x in L:
        if x in d:
            d[x] += 1
        else:
            d[x] = 1
    return d

是否有更简洁的编写这个函数的方法?

如果在Python中有字典推导式,我们可以写成:

>>> { x: L.count(x) for x in set(L) }

但由于Python 2.6没有字典推导式,我们必须这样写:

>>> dict([(x, L.count(x)) for x in set(L)])

虽然这种方法可能更易读,但它不高效:L被多次遍历。此外,这种方法对于单次生成功能不起作用;该函数应该同样适用于迭代器生成器,例如:

def gen(L):
    for x in L:
        yield x

我们可以尝试使用reduce函数(已经被废弃):

>>> reduce(lambda d,x: dict(d, x=d.get(x,0)+1), L, {}) # 错误!

糟糕,这不起作用:键名是'x',而不是x。:(

我最终得到了:

>>> reduce(lambda d,x: dict(d.items() + [(x, d.get(x, 0)+1)]), L, {})

(在Python 3中,我们需要写成list(d.items())而不是d.items(),但这只是假设,因为那里没有reduce。)

请用更好、更易读的一行代码战胜我吧! 😉

0