菜单

Pandas分组函数:groupby、pivot_table及crosstab

2018年11月15日 - jQuery

五 多规格分组的实现

2.1 group函数

分组groupby Pandas中不过常用和行之有效之分组函数。

1)按列分组

只顾以下使用groupby()函数生成的group1是一个中级分组变量,为GroupBy类型。

group1 = df.groupby('key1')  

group2 = df.groupby(['key1','key2'])  

使推导式[x for x in group1]但兆示分组内容。

[x for x in group1]

[('a',       data1     data2 key1 key2
  0  1.830651  0.407903    a  one
  1 -0.973132 -0.056084    a  two
  4 -1.069184  0.043338    a  one), ('b',       data1     data2 key1 key2
  2 -0.477718 -1.488174    b  one
  3 -0.227680 -0.825671    b  two)]

在分组group1、group2上可以动用size()、sum()、count()等统计函数,能分别统计分组数量、不同排列的分组和、不同排列的分组数量。

group1.size()  

key1
a    3
b    2
dtype: int64

group1.sum() 

图片 1

对此分组的之一平排列或者多只列,应用agg(func)可以对分组后的多寡采取func函数。例如:用group1[‘data1’].agg(‘mean’)对分组后底’data1’列求均值。当然为可以放大至以作用为多个列和运用多单函数上。

group1['data1'].agg(['mean','sum'])  

图片 2

  Function<Product, List<Object>> compositeKey = personRecord ->
        Arrays.asList(personRecord.getName(), personRecord.getCode());

    Map<Object, List<Product>> map =
        products.stream().collect(Collectors.groupingBy(compositeKey));

1. 起因

利用python的pandas库进行多少分组分析深便民,其中以最多的道包括:groupby、pivot_table及crosstab,以下分别展开介绍。

  @Value
  class Item {
    private Date createAt;
    private int count;
    private BigDecimal price;
  }

  @Value
  class Product {
    private String name;
    private String code;
    private List<Item> items;
  }

2.2 透视表pivot_table

pivot_table可以有类似于excel数据透视表的结果,相当之直观。其中参数index指定“行”键,columns指定“列”键。

pd.pivot_table(df, index = 'key1', columns= 'key2')

图片 3

图片 4

3. 总结

近年来在学《利用Python进行数量解析》,会管遇到的题目及习及之知识写出来,希望不用弃坑。

季 调试代码,在断点处查看分组后的结果

2.3 交叉表crosstab

交叉表crosstab
可以按指定的推行及列统计分组频数,用起格外便利;当然同样的成效为可采用groupby实现。

pd.crosstab(df.key1,df.key2, margins=True)

图片 5

对数据聚合来说,分组操作是十分广阔的,在.net里发lambda和linq,而在java里吗时有发生lambda,现在咱们来促成对一个会合进行分组。

2. 详解

第一构造数据

import numpy as np
import pandas as pd
df = pd.DataFrame({'key1':['a','a','b','b','a'],'key2':['one','two','one','two','one'],'data1':np.random.randn(5),'data2':np.random.randn(5)}) 

图片 6

df数据结构

亚 为有限单门类建立集,并赋值

如出一辙 准备工作,有半点个档次

    List<Product> products = new ArrayList<>();
    products.add(new Product("apple", "1001", Arrays.asList(
        new Item(new Date(2018, 1, 1), 10, new BigDecimal("9.99")))));

    products.add(new Product("apple", "1001", Arrays.asList(
        new Item(new Date(2018, 2, 1), 10, new BigDecimal("19.99")))));

    products.add(new Product("apple", "1001", Arrays.asList(
        new Item(new Date(2018, 3, 1), 10, new BigDecimal("29.99")))));

老三
使用lambda进行分组,主要对name字段进行分组,然后将结果有一个新的汇聚里

    Map<String, List<Product>> groupByPriceMap =
        products.stream().collect(Collectors.groupingBy(Product::getName));
    products = new ArrayList<>();
    for (Map.Entry<String, List<Product>> str : groupByPriceMap.entrySet()) {
      List<Item> items = new ArrayList<>();
      for (Product product : str.getValue()) {
        items.addAll(product.getItems());
      }
      products.add(new Product(str.getKey(), "", items));
    }

 感谢阅读!

相关文章

发表评论

电子邮件地址不会被公开。 必填项已用*标注

网站地图xml地图