MongoDB/SAP BW连接指南
1. 概述
注意:
1. 本文仅描述MongoDB、SAP BW数据库接入过程中的“选择数据表”配置。
2. 和其他数据库的接入流程不同,在数据表配置过程中,MongoDB和SAP BW数据库不支持引入时间宏参数、全局参数等。
由于 MongoDB、SAP BW数据库的数据结构和查询特性有所不同,在接入数据集的过程中,“选择数据表”的配置流程会相应地有所差异,这里单独另开一篇介绍。
除“选择数据表”之外,其他配置(选择连接器、设置更新方式、确认数据表信息)和接入标准数据库基本一致,可以参考学习《标准数据库连接指南》。
2. MongoDB
1. 选择一个已建好的MongoDB账户,左侧列出该账户下可见的数据表。
2. 选择其中一张表,系统会根据这张表中前100行数据自动生成字段信息。用户可查看这些字段信息,并手动修改字段类型,若有些字段并不需要被抽取,可将字段删除。
3. 若前100行数据中未包含您想要的字段,您也可以通过新建字段来自行添加字段信息。字段类型也可自行指定。
4. 若需添加多个字段,观远BI支持用户使用“批量新建字段”功能,通过换行输入数据字段名称和字段类型,实现多个字段的快速新建。
注意:
1. 请按照字段名称,字段类型的顺序输入,字段名称与字段类型以半角格式的分号";"进行分隔,不同字段以换行符进行分隔;
2. 当输入中存在平台不支持的字段类型时,将按转换规则统一处理,转换规则为:若数据集中带有非结构化的数组、JSON字段时,因其是以文本的形式存储的,若需要进行加工转换处理,可能需要使用到Spark中JSON相关的函数。
5. 若想对抽取的数据进行一些筛选,点击“添加筛选条件”,您可以按字段添加若干筛选条件,筛选条件的配置逻辑和绘制图表时的筛选条件配置逻辑基本一致,可参考学习《图表绘制》中的“数据筛选”章节。
6. 配置完成后,点击“预览”,可以预览最终得到的数据信息。
3. SAP BW
从 SAP BW 接入数据,是指观远数据提供的从 SAP BW 这一数据库类型进行接入数据的服务。观远数据针对 SAP BW 专门开发了 SAP BW 数据连接器,用来支持对 SAP BW 的直接连接。
观远数据是通过XMLA方式来连接SAP BW,从而获取Catalog以及Cube信息,进而获取数据的。因此,需要在SAP BW服务器端开启XMLA服务,才能正确连接SAP BW。
客户端进入到SAP系统,输入TCODE: SICF, 在default_host -> sap -> bw -> xml -> soap下找到xmla,右键点击Activate Service来启用XMLA。
服务器端配置完后,便可在观远平台上配置账户连接。
3.1 创建 SAP BW 数据连接账户
如果没有已经建立的数据账户,那么在数据账户界面,点击“新建数据账户”,选择SAP BW,然后填写数据库相关信息。
需要注意的是,如果您访问的是info cube,则需要在catalog一栏中填写“$INFOCUBE”;如果访问的是具体某Info Provider下的Query Cube,则填写相应的Info Provider信息即可。账户信息填写完毕后,点击“测试连接”,显示“连接成功”,则点击“确认”创建好一个 SAP BW 数据连接账户。
3.2 选择连接器
进入数据中心,在“新建数据集”中选择“数据库”,进入“选择连接器”界面,选择“SAP BW”,点击“下一步”。
3.3 选择数据表
选择一个已建好的 SAP BW 账户,左侧列出该账户下可见的数据表(如果之前没有建好数据账户,点击“新建账户”也可进行创建)。
选择其中一张表,系统会根据这张表中前100行数据自动生成字段信息。若有些字段您并不想要抽取上来,可以选择删除若干。若前100行数据中未包含您想要的字段,您也可以通过新建字段来自行添加字段信息。字段类型也可自行指定。若想对抽取的数据进行一些筛选,您可以按字段添加若干筛选条件。
配置完成后点击“预览”,可以查看到获得的预览数据。
3.4 更新设置
SAP BW 的数据对接,仅支持Guan-Index的模式。您可以为 SAP BW 数据集设置更新周期。
在数据集详情页面,也可以设置数据更新。具体操作可点击查看《数据集》。
3.5 确认数据表信息
为您的数据集提供一个方便辨识的名字,以及指定保存位置,最后点击“确认新建”。
数据集创建成功,可以在“数据中心”-“数据集”中找到它。
3.6 使用 SAP BW 数据集
您可以直接使用 SAP BW 数据集创建卡片或ETL。值得注意的是,若数据集中带有非结构化的数组、JSON字段时,我们是以文本的形式存储的,若需要进行加工转换处理,您可能需要使用到Spark中JSON相关的函数。
3. 名词解释
SAP BW
SAP BW 是SAP 商务智能(BI)的集成化组件之一,为SAP数据和非SAP数据的采集、存储、分析和管理提供一个集成的,面向商务的平台。SAP BW 全称 Business Information Warehouse,在版本3.5之后又称SAP Business Intelligence。