关联数据
关联数据 可以通俗理解为“列拼接”,不同的是,关联数据需要找到双方数据集中相同的关联列进行拼接;并且拼接的形式也比较多样,最终呈现的数据集也可以自定义列,具体如下:
关联方式 | 特性描述 |
---|---|
内连接 | 仅对关联列中交集进行连接 |
左连接 | 默认输出左表所有行,并将右表中关联匹配的列进行连接 |
全连接 | 对关联列中并集进行连接 |
如图两个数据集分别为零售信息和商品基础信息,对于商品基础信息而言商品编号为唯一主键。
我们想要对零售信息中的商品按照商品基础信息中的信息进行补全,因此选择以 商品编号 为关联字段进行左连接。