跳到主要内容
版本:6.0.0

观远BI核心功能

1. 说明

观远BI是由一系列产品矩阵组合的一站式BI平台,比如零代码拖拽式开发的ETL工具-Smart ETL;沉淀了行业最佳实践的场景化应用-场景包、智能洞察应用等;高度兼容 Excel 的中国式报表功能;供一键安装的酷炫可视化组件和一键数据填报解决临时数据源的整合问题等等。

产品能力矩阵主要由BI Core、BI Plus、BI Management、BI copilot构成,分别对应端到端的易用性、面向业务的场景化、企业级平台底座和创新实验室。下文将带您速览不同版本下的观远BI平台产品功能。

  • 提示:部分产品模块为增值模块,如需试用体验请联系观远数据商务人员或客户成功经理(通常是贵公司当前的服务交流负责人)。

2. 版本功能清单

观远BI目前提供用于快速启动的低门槛基础版,也提供了适用于数字化转型节点的完整解决方案版本,提供面向企业级、大数据能力侧的增购服务等。

基础版

低门槛快速启动

高级版


数据接入

多源数据接入

表单填报

数仓开发

数据建模


SmartETL


数据抽取和计算引擎


湖仓数据存储


作业调度


数据血缘


自助分析与展现

中国式报表Pro

可视化图表

可视化扩展

桌面端仪表板

移动端仪表板

共享和协同

报告生成导出

订阅 & 预警

OA 集成

平台管理

云巡检

企业级权限管理

平台运维

基准服务

产品和数据分析入门培训

运维服务

通用能力增购

自助取数

付费增购

付费增购

数据应用与门户(桌面&移动)

付费增购

付费增购

数据大屏

付费增购

付费增购

数据脱敏

付费增购

付费增购

企业级能力增购

数据回写


付费增购

复杂任务编排


付费增购

集群扩展


付费增购

多租户支持


付费增购

极速引擎


付费增购

大数据集成


付费增购

高可用和容灾


付费增购

3. 功能介绍

观远BI拥有四大核心产品能力矩阵,主要由BI Core、BI Plus、BI Management、BI copilot构成,分别对应端到端的易用性、面向业务的场景化、企业级平台底座和创新实验室。

3.1. 数据接入与准备

多源数据接入

针对企业零散多态的多源异构数据,观远BI提供完善的数据接入能力。通过统一数据口径,沉淀拥有数据全貌的数据池,打破数据孤岛现象。观远目前支持提供JDBC、API对接等方式接入文件、数据库等各类形态的数据,包括但不限于内置35+数据库及自助式对接的云厂商/国产化的外部数据库,本地文件,Web Service,FTP/SFTP,视图数据集,存储过程等多源数据的整合方案。

  • 文件数据:提供从Excel、CSV等文件导入数据,并进行数据处理的服务。

  • 数据库数据:支持连接多种数据库,包括但不限于MySQL、PostgreSQL、 Greenplum、 SQL Server、 Oracle等35+种数据库;并且还支持自助式对接云厂商、国产化等外部数据库数据。接入时提供直连数据库、非直连同步(抽取)两种方式。

image.png

  • API数据:通过Web Service将API数据接入,支持自定义灵活配置API返回数据的解析规则和选取所需字段。

  • 账户数据:支持常用OA系统中同步获取账户数据,通过账户同步实现企业OA系统与观远数据分析平台之间的账户数据无缝对接,目前支持企业微信、钉钉、LDAP、飞书等。

  • 公共/行业数据:可接入各类公开的公共数据或行业数据,如天气数据、国民经济数据等。

  • 远程文件数据:支持接入远程文件存储服务器中的文件数据,支持FTP/SFTP 、ADSL Gen2两种。

  • 在线文档数据:支持与飞书电子表格进行集成,使用户能够无缝地将飞书电子表格中的数据导入与同步,形成在线文档数据集。

  • 存储过程数据:支持与Oracle、MySQL、SQLServer等存储过程进行集成,通过参数化拉取的方式进行创建,并提供页面端对存储过程数据集进行参数化动态查询数据的功能。

  • 视图数据集:是基于SparkSQL的可参数化执行的动态数据集,用户将1个或多个非直连数据集(实时数据集除外)进行动态关联与计算,重新整合为新的数据集。

表单填报

表单填报是一款灵活易用的工具,旨在提供便捷的表单搭建和表单数据管理功能,通过简单的数据收集表/问卷进行数据收集,实现数据收集、管理和可视化分析。

适用于:

  • 业务数据的灵活收集:以前业务数据的收集维护主要依靠Excel表格来进行,通知烦、提交烦、汇总烦。通过观远BI提供的表单填报功能即可在后台有效简化 Excel 模板维护、数据收集汇总等工作。

  • 手机活动报名信息:公司内外部活动收集人员信息,再也不用一个个钉钉、微信询问,一个表单都搞定:创建表单--发送表单--收集信息,流程简单高效

  • 进行问卷调研:使用表单快速创建调研问卷并发放给受众,无需打印、街头派发,可规范收集数据的质量,提高调研的有效性。

  • 实现主数据管理:将主数据从个人Excel手工维护中解放出来,自动收集,及时更新,定时维护。

Smart ETL

智能ETL(Smart ETL)是观远数据面向业务可用提供的一款零代码·全拖拽式的自助式数据准备和数仓构建工具。智能ETL让用户在数据分析、数据可视化制作前,能够自助式对数据集进行易操作、低门槛、智能化的高效数据处理。基于强大的数据处理算子和节点,通过全拖拉拽式、配置化的方式对数据进行清洗、转换、加载等操作,对任意节点的实时预览纠错与输出等完成数据处理工作流的构建,帮助企业/部门完成轻型数仓的建设,不懂SQL的业务人员也可达到专业级的数据处理效果。

image.png

数据回写

数据回写将BI平台处理或分析后的数据集回流至客户业务系统和数据仓库中,回流数据会包括ETL输出的结果数据、有重要业务价值的卡片分析结果或表单填报数据等。基于该功能,BI平台将分析洞察的结果直接应用到企业实际的业务场景中,如商品销售数据回传至供应链系统用于供销需求规划、又或是基于人群画像分析数据回传至营销数据库中用于新品定向推送的精准营销等,这样通过对业务过程的融合赋能,可进一步加快企业决策的实时调整和优化,完成数字化运营场景的完整闭环。

image.png

复杂任务编排(高级调度)

传统的事件调度使用门槛高,用户需要掌握SQL语法来完成不同任务间的调度与依赖配置,ETL错综复杂的依赖关系,不能直观监控任务健康状态,观远提供的高级调度以DAG工作流的方式将平台内各任务(包括ETL、数据集等)组装起来,用户通过拖拽式配置其依赖关系及运行顺序,并建立起全局任务运行以及运维管理视图,方便实时监控任务的运行状态,同时支持重试、从指定节点恢复失败、暂停及Kill任务等操作。

并且我们还提供基于事件驱动和定时驱动的工作流调度,与基于Micro-Batch “微批”计算引擎的高频增量更新调度器配合,用更低的成本为用户提供了高性能、高稳定的实时数据融合和处理分析体验。

image.png

3.2. 报表与可视化

中国式报表Pro

中国式报表Pro是观远提供的一款“高度兼容Excel用户习惯”的低门槛、一站式复杂报表产品,旨在让报表开发更敏捷,复杂报表不再”复杂“。它是嵌入在观远BI平台中的一套与Excel深度融合的拓展图表,支持多源接入、多表合并分析、跨行引用计算、函数计算等复杂功能,还具备与BI内其他图表之间实现联动、在线/本地编辑模式的一键切换等易用特点,以降低用户使用门槛,提升报表开发效率,满足业务用户制作报表等需求。

image.png

观远BI提供的中国式报表Pro具有以下优势特点:

  • 高度兼容Excel:兼容Excel交互习惯,支持Excel各类制表能力和多于450种原生函数,功能强大。

  • 低门槛:拖拉拽式完成报表模板编辑,学习上手门槛低,报表效果实时预览,所见即所。

  • 快速线上化:支持复用线下原有报表的格式及内容实现线上快速迁移,无需重新定义计算逻辑。

  • 智能数据准备:通过观远BI平台自带的Smart ETL功能,中国式报表可快速接入和处理企业制作复杂报表所需要的各类数据源,高效完成数据准备工作,降低报表开发门槛;

  • 复杂计算与分析:支持执行数值查询语句、格间计算、参数化查询等功能,可以与BI内其他图表融合呈现,并实现联动、筛选;

  • 安全权限管控:企业可以通过观远BI平台原有的数据权限管控能力,对复杂报表的数据来源进行数据安全管理,降低风险;

  • 分享与协作:支持模板下载、卡片导出和订阅,满足多人共享同一报表要求。

可视化图表分析

观远为用户提供丰富多样的图表、表格类型等数据分析的展示方式,通过图形化手段呈现直观、易懂的分析结果,不再局限于枯燥的数字和报告。

基础图表可视化:包括多种图表类型和数据分析选项,保证用户的灵活查询与分析需求。

  • 图表可视化:支持表格、指标卡、计量图、折线图、簇状柱形图、堆积柱状图、百分比堆积柱状图、瀑布图、条形图、堆积条形图、桑基图仪表盘等50余种可视化图表、数据透视表。

  • 可视化编辑:在可视化编辑的过程中,支持数据基础分析(包括字段维度、数值、筛选、排序、拆分等分析设置)、图表属性配置(包括主题颜色、文本颜色、辅助线等样式设置),还有计算字段、分组字段、高级计算(自由同环比、自动百分比、排名、重复率等)、条件格式、汇总指标、图/表切换等设置。

  • 动态查询与分析:支持动态时间宏、全局参数的引用,实现对复杂分析情况下的动态分析,适用于分析维度及指标的切换、数据动态分类、跨表查询等场景。

image.png

拓展图表可视化:是指在基础图表可视化的基础上,提供更多的扩展能力和自定义选项,以满足用户对于特定图表类型、样式和功能的个性化需求。

  • 自定义图表:提供基于Echarts、highcharts等第三方图表库的自定义可视化扩展能力,支持自定义图表、自定义图表Lite两种编辑方式。

  • 图表插件:提供基于观远可视化SDK开发的可视化扩展能力,支持动态条形图、蝴蝶图、哑铃图、预测曲线、线性回归、日历图等,可在观远数据应用市场中下载使用。

  • 自定义地图:提供自定义地图的可视化扩展与管理能力,包括Etone室内地图、平面地图以及集成第三方室内地图(如蜂鸟云)、自定义行政地图。

image.png

桌面端/移动端仪表板

仪表板,是指数据可视化卡片集合的页面,主要包含仪表板页面和目录。其中,页面是数据可视化卡片的一个集合,在页面中,可以对卡片的大小、位置等进行自定义排版,同时还可以对卡片进行复制、收藏等操作。而移动端仪表板则是通过移动端布局,将移动端页面中内容(多个卡片)进行不同方式的排布。为了让移动端页面更加的美观丰富,用户可以在此进行排版和设置,具体包含:页面组件添加及设置、组件库添加及设置、卡片样式设置、页面样式设置等。

3.3. 消费与分析应用

数据门户

数据门户,是观远数据推出的数据应用管理功能,包含桌面端和移动端。通过数据门户,可以按照部门、业务主题等不同类别将数据分析应用进行分类分组管理。为数据消费者特别是企业高层管理者打造直观的门户看数体验,帮助企业高层管理者对企业经营状况快速了解。

image.png

自助取数

自助取数指灵活的报表构建与即席查询的功能,能够使终端用户通过界面化的方式,基于模板构建自定义的数据报表,完成自助取数以及即席查询。自助取数可以有效帮助零开发经验的业务人员轻松获取数据,面对变化频繁的数据需求,一键拖拽式操作即可快速灵活的获取数据。

image.png

数据大屏

观远BI支持让用户通过零代码的方式打造酷炫数据大屏,数据大屏是指利用相应的系统来分析数据,通过图形的形式为企业提供客观、直接的数据分析结果,帮助业务人员和企业决策者直观面对数据背后的信息,实时监测企业数据,并获得更更直观的决策场景体验,以助力企业数字化运营升级。

image.png

3.4. 企业级平台底座

报告生成导出

观远BI支持各类数据的导出,如图表数据导出、数据集导出、ETL结果数据导出;支持对数据集进行手动、定时等方式导出至FTP/SFTP指定位置,可进行大数据量的导出;支持设置禁止数据的导出与下载,保证企业数据安全。

image.png

订阅 & 预警

订阅和预警功能是观远数据提供的一项千人千面·数据追人的通知功能,旨在满足用户对业务指标变动的实时关注需求,可广泛应用于业务风险管控、数据实时获取、数据指标跟踪等场景,数据的”主动触达“是数据消费与企业用户融合的最后一环。

  • 订阅计划:用户可以根据需求订阅特定的图表、仪表板或数据集。通过自定义发送时间,订阅结果将以邮件、企业微信、钉钉、飞书、云之家等渠道发送通知消息给相关人员。这样,用户就能定期获取关键数据的最新信息,无需频繁登录系统,便可及时了解数据动态。邮件订阅支持将页面或卡片作为图片插入正文,以及将卡片数据或页面 PDF 作为附件发送。钉钉、企业微信等其他OA平台支持消息推送,附带页面链接,接收者可通过点击链接登录系统查看推送内容。页面及多卡片合并订阅支持周期订阅,卡片订阅除支持周期订阅外还可配置数据更新后订阅。

image.png

  • 风险预警:用户按需自定义维度和指标的预警触发条件。当数据符合预设的异常条件时,平台将通过邮件、企业微信、钉钉、飞书、云之家等渠道第一时间通知用户,无论用户是否在办公设备前,都将第一时间知晓潜在的业务风险和问题。

OA集成

支持基于H5技术和企业微信、钉钉、飞书、云之家、泛微OA等其他企业系统的开放能力,提供单点登录或免密登录的能力,同时提供利用第三方进行告警或订阅的消息推送能力。其他办公OA可以通过登录插件与消息通知插件定制化支持。 

云巡检

云巡检是观远BI提供的一项智能运维服务,提供对BI系统和业务资产的可视化巡检、问题诊断、和行动建议。通过自动生成的可视化分析报告,帮助企业快速发现运维问题,主动排除故障,并快速获取可优化或解决方案的建议,这项服务有助于减少日常运维工作成本,并提前计划好容量规划。

  • 可视化巡检报告:提供基于运维数据自动生成的可视化诊断报告,包含数量高达100+的巡检指标,数据分析全面,报告内容清晰美观,整体情况一目了然。并且提供系统运维和业务治理多角度的报告解读模式,以及问题处理建议与快捷操作引导。

  • 系统运维解读:主要为场景内的常见问题提供原因分析、排查思路解析与行动优化建议。

  • 业务治理解读:主要分为机器资源用量盘点和数据资产管理盘点,分别对数据集、ETL、仪表板、卡片消耗的系统资源与产生的业务价值提供了盘点思路和行动优化建议。

image.png

企业级权限管理

观远BI支持基于角色的访问控制(RBAC),支持三种系统预置角色(管理员、普通用户、只读用户)和用户自定义角色。支持基于用户账号、用户组等载体实现对仪表板、数据集、文件夹等各类资源细粒度的数据访问控制,也支持基于各类角色的功能权限管控。

image.png

平台运维

平台运维是指管理员对平台整体运维方面的监控与管理功能。包括任务监控、任务管理、资源监控、审计日志、运维日志、信息通知、服务管理、参数配置和资源迁移等。

  • 任务监控:BI系统中对数据处理运行任务进行监督和控制的重要功能,它能够监控和管理各类数据处理运行任务,包括Smart ETL和数据集任务,并生成可视化报告供分析使用。

  • 任务管理:可以查看到当前企业域下的全部任务情况,并可以对造成异常的任务手动取消/停止。其中任务管理中的甘特图模块,可以按时间轴直观依次展示每日各个时间段内任务状态及执行时长,帮助企业运维人员快速定位任务运营的高低峰时段和高耗时任务。

  • 系统管理:指管理员对系统的运行情况、资源情况等进行整体监控,主要包括:系统资源监控、操作审计日志、运维日志、信息通知等。

  • 参数配置:对ETL、数据集、数据库等执行类任务进行性能参数的全局配置。

数据脱敏

观远BI提供成熟的多网段敏感信息管控方案,主要通过数据集敏感信息识别,再将敏感数据内容进行字段级的动态脱敏处理,确保企业敏感数据的隐私性与安全性。支持在数据集上进行敏感数据的探测和识别、脱敏规则配置,最后在可视化层面脱敏展示。

image.png

3.5. 企业级能力增购

多域/多租户

域(租户)的定义: 在观远BI系统中,域是逻辑单元,主要用于BI资源与内容的逻辑隔离,帮助各类组织按需将不同的业务进行逻辑隔离,提升管理效率,满足数据安全、内容安全要求。

  • 适用场景: 当组织业务复杂时(如存在多个子公司),建议采购多域模块来实现不同业务的数据分析与数据资源的隔离。

  • 域的独立性:每个域有独立的管理员、用户体系、权限体系、数据集与报表体系。

  • 域之间的联系:不同域之间的资源默认无关联,如需迁移,可以使用离线迁移功能,实现仪表板、数据集的迁移,以提供资源复用性。

  • 域的数量:一套环境支持的域数量取决于环境所能使用的计算资源,一般不超过10个。

测试环境

观远BI测试环境是一套独立的、与生产环境隔离的环境。一般用于软件质量验证、系统集成开发、系统运行参数修改验证、数据开发、报表与仪表板等数据资产的开发与验证。部分企业也选择在测试环境进行UAT(User Acceptance Test), 待验证通过后,再升级与测试环境完全一致的产品版本以及迁移基于产品开发的数据资产。

  • 硬件配置:一般建议与生产环境保持一致,尤其是需要在测试环境进行性能测试的场景;可以按需降低一些配置,但不应低于Galaxy产品对硬件的最低配置。

  • License策略:需要使用独立的许可证,开通的功能模块与生产环境一致。

  • 集群与高可用配置:支持相关配置。  

  • 网络配置:建议与生产环境保持一定的连通性,以便捷使用Galaxy产品的在线一键迁移功能,实现数据资产的跨环境迁移。

image.png

高性能集群扩展

观远BI提供灵活的部署选择,既支持单节点部署,也支持多节点部署(即集群化部署)。

高性能集群扩展通过增加服务器节点的规模数量,来提升计算引擎性能和任务并发能力。集群规模越大,观远BI的计算能力就越强。

三节点高可用

面对越来越庞大的数据量级,BI产品还需保障自身系统的稳定,避免因系统崩溃影响业务分析。观远数据基于容器化部署,具备自恢复能力,所有组件去单点部署,核心模块支持多副本能力,提升系统的稳定性与可用性。

高可用技术架构,降低系统崩溃影响:

观远数据的整体技术架构进行了高可用方案设计,为整体性能与安全提供底层支撑。目前观远数据提供的BI组件高可用方案,主要使用的运维组件有K8s、MySQL、Cassandra、Postgresql、MinIO、Spark、Guandata-Server 等服务在K8s 上,单个节点的Pod故障后,可由K8s将其调度到其他节点上运行起来。能够实现当系统某个节点故障后,运维组件仍能够提供正常的服务,有效控制对应用的影响,减少对用户使用的影响与感知。

高可用集群扩展通过增加各组件及服务节点,结合高可用机制来提高系统的稳定性和可用性,在单节点故障发生时,实现秒级或分钟级的故障切换到其他可用节点,以保证系统的连续稳定性。并采用数据冗余机制,保障数据备份与恢复,预防因节点故障而导致数据丢失。

高可用集群扩展一般会包括以下内容:

  • 复杂均衡集群:适用于需要处理大量请求并确保系统稳定性的场景。通过将网络请求分发到集群中的多个服务器上,实现负载均衡,即使在高流量时期也能保持系统的稳定性和高可用性。

  • 数据库集群:适用于需要高效处理和管理大量数据的场景。通过部署多个数据库,实现数据的分布式存储和处理,提升数据库的性能和扩展性。

  • 文件存储集群:适用于需要大规模存储和高性能文件访问的场景。通过将文件分布在多个服务器上,实现文件的冗余备份和高速读写。

  • 计算集群:适用于需要大量计算资源和高性能计算的场景。通过并行处理和分布式计算,实现快速完成大规模计算和数据处理任务。

注意:上述方案可通过主流云服务商(如华为云、阿里云)提供的组件进行高可用部署,同时也支持在本地私有化环境中实现。

数据备份

观远 BI 提供数据备份方案,避免数据丢失

基于分析云与私有化部署,观远数据均提供数据备份方案,以观远分析云为例,其提供:

  • 定时的数据备份:观远数据制定了相关规定,对系统的备份策略、备份数据保管等方面进行规范。业务数据库均有定期快照和备份,对数据进行备份存储,同时公司部署了备份执行情况监控机制,确保数据备份的完整性。

  • 云平台定时快照:云平台均有自带的定时快照服务,可以保障数据安全,如发生数据丢失或者安全问题等数据问题可通过快照恢复。

Hadoop & Databricks集成

观远 BI 基于云原生体系,深度集成 Hadoop、Databricks 大数据架构。支持万级用户数、十亿级数据量的企业规模化业务需求,保障业务用起来。云原生+大数据的融合让 BI 适配企业业务、低成本的无限扩展,避免2年重构或3年迁移的窘境。

观远BI基于云原生大数据架构深度集成Hadoop,将计算和存储交由 Hadoop 进行管理维护,充分发挥Hadoop 自身能力。针对企业级部署场景,利用Hadoop 的高可用性、高可扩展性、高容错能力等优势,搭建一个真正面向业务可用的企业级大数据分析平台。可实现 300+服务器大规模计算集群,上万核CPU。与此同时,支持无限水平扩展与万量级用户。