我在列表列表或元组列表中有一些数据,如下所示:
data = [[1,2,3], [4,5,6], [7,8,9]] data = [(1,2,3), (4,5,6), (7,8,9)]
我想按子集中的第二个元素排序 . 意思是,按2,5,8排序,其中2来自(1,2,3),5来自(4,5,6) . 这样做的常见方法是什么?我应该在列表中存储元组或列表吗?
sorted_by_second = sorted(data, key=lambda tup: tup[1])
要么:
data.sort(key=lambda tup: tup[1]) # sorts in place
没有lambda:
def sec_elem(s): return s[1]
sorted(data, key=sec_elem)
@Stephen的答案是关键!这是一个更好的可视化的例子,
为Ready Player One粉丝大喊大叫! =)
>>> gunters = [('2044-04-05', 'parzival'), ('2044-04-07', 'aech'), ('2044-04-06', 'art3mis')] >>> gunters.sort(key=lambda tup: tup[0]) >>> print gunters [('2044-04-05', 'parzival'), ('2044-04-06', 'art3mis'), ('2044-04-07', 'aech')]
key 是一个函数,它将被调用以转换集合的项目以进行比较..就像Java中的 compareTo 方法一样 .
key
compareTo
传递给key的参数必须是可调用的 . 在这里,使用 lambda 创建一个匿名函数(可调用) .lambda的语法是单词lambda,后跟可迭代的名称,然后是单个代码块 .
lambda
下面的例子中,我们正在排序一个元组列表,它包含某个事件和演员名称的信息时间 .
我们按事件发生的时间对此列表进行排序 - 这是元组的第0个元素 .
注 - s.sort([cmp[, key[, reverse]]]) 对s项进行排序
s.sort([cmp[, key[, reverse]]])
itemgetter() 比 lambda tup: tup[1] 快一些,但增幅相对适中(约10%至25%) .
itemgetter()
lambda tup: tup[1]
(IPython Session )
>>> from operator import itemgetter >>> from numpy.random import randint >>> values = randint(0, 9, 30000).reshape((10000,3)) >>> tpls = [tuple(values[i,:]) for i in range(len(values))] >>> tpls[:5] # display sample from list [(1, 0, 0), (8, 5, 5), (5, 4, 0), (5, 7, 7), (4, 2, 1)] >>> sorted(tpls[:5], key=itemgetter(1)) # example sort [(1, 0, 0), (4, 2, 1), (5, 4, 0), (8, 5, 5), (5, 7, 7)] >>> %timeit sorted(tpls, key=itemgetter(1)) 100 loops, best of 3: 4.89 ms per loop >>> %timeit sorted(tpls, key=lambda tup: tup[1]) 100 loops, best of 3: 6.39 ms per loop >>> %timeit sorted(tpls, key=(itemgetter(1,0))) 100 loops, best of 3: 16.1 ms per loop >>> %timeit sorted(tpls, key=lambda tup: (tup[1], tup[0])) 100 loops, best of 3: 17.1 ms per loop
from operator import itemgetter data.sort(key=itemgetter(1))
Stephen's answer是具有列表推导的DSU(decorate-sort-undecorate)模式的模式:
decorated = [(tup[1], tup) for tup in data] decorated.sort() undecorated = [tup for second, tup in decorated]
或者,更简洁:
[b for a,b in sorted((tup[1], tup) for tup in data)]
正如Python Sorting HowTo中所述,自从Python 2.4出现关键功能以来,这是不必要的 .
为了按 (<word>, <count>) 排序元组 (<word>, <count>) ,按降序排序 count ,按字母顺序排序 word :
(<word>, <count>)
count
word
data = [ ('betty', 1), ('bought', 1), ('a', 1), ('bit', 1), ('of', 1), ('butter', 2), ('but', 1), ('the', 1), ('was', 1), ('bitter', 1)]
我用这个方法:
sorted(data, key=lambda tup:(-tup[1], tup[0]))
它给了我结果:
[('butter', 2), ('a', 1), ('betty', 1), ('bit', 1), ('bitter', 1), ('bought', 1), ('but', 1), ('of', 1), ('the', 1), ('was', 1)]
对于按多个标准排序,即例如通过元组中的第二个和第三个元素,让
data = [(1,2,3),(1,2,1),(1,1,4)]
因此,定义一个lambda,它返回一个描述优先级的元组
sorted(data, key=lambda tup: (tup[1],tup[2]) ) [(1, 1, 4), (1, 2, 1), (1, 2, 3)]
对元组进行排序非常简单:
tuple(sorted(t))
我只想添加到Stephen的答案,如果你想要将数组从高到低排序,除了上面的评论之外的另一种方式只是将其添加到该行:
reverse = True
结果如下:
data.sort(key=lambda tup: tup[1], reverse=True)
10 回答
要么:
没有lambda:
@Stephen的答案是关键!这是一个更好的可视化的例子,
为Ready Player One粉丝大喊大叫! =)
key
是一个函数,它将被调用以转换集合的项目以进行比较..就像Java中的compareTo
方法一样 .传递给key的参数必须是可调用的 . 在这里,使用
lambda
创建一个匿名函数(可调用) .lambda的语法是单词lambda,后跟可迭代的名称,然后是单个代码块 .
下面的例子中,我们正在排序一个元组列表,它包含某个事件和演员名称的信息时间 .
我们按事件发生的时间对此列表进行排序 - 这是元组的第0个元素 .
注 -
s.sort([cmp[, key[, reverse]]])
对s项进行排序itemgetter()
比lambda tup: tup[1]
快一些,但增幅相对适中(约10%至25%) .(IPython Session )
Stephen's answer是具有列表推导的DSU(decorate-sort-undecorate)模式的模式:
或者,更简洁:
正如Python Sorting HowTo中所述,自从Python 2.4出现关键功能以来,这是不必要的 .
为了按
(<word>, <count>)
排序元组(<word>, <count>)
,按降序排序count
,按字母顺序排序word
:我用这个方法:
它给了我结果:
对于按多个标准排序,即例如通过元组中的第二个和第三个元素,让
因此,定义一个lambda,它返回一个描述优先级的元组
对元组进行排序非常简单:
我只想添加到Stephen的答案,如果你想要将数组从高到低排序,除了上面的评论之外的另一种方式只是将其添加到该行:
结果如下: