ChatBI后台操作指南

1. 概述

使用 ChatBI 前，需在 ChatBI 运营管理后台对数据源、问数主题、主题权限等进行配置。本文介绍后台功能详细配置。

2.主题构成

在搭建主题之前，我们先理解什么是主题，可以参考下面这张图。

3. 使用指导

3.1. 前提条件

已在 BI 平台完成数据准备与权限配置。

3.2. 界面概览

序号	说明
1	主题展示区，可在当前区域新建主题和切换右侧展示主题。
2	展示当前页面所属主题，可在左侧区域进行切换。
3	主题功能区域，可对当前主题进行开启/关闭、测试、重命名等操作，详见主题功能。
4	运营管理后台功能配置区域，参考功能详情。

3.3. 功能详情

3.3.1. 新建主题

Chat 地址为：http://xxx.xxx.xxx.xxx/chatManage（私有化客户请将/chatManage前的内容替换为自己的环境地址）。

说明

首次创建主题时建议基于单表创建，在单表问答准确率达到80%后，再扩展其他表进行问答。

在 ChatBI 运营管理后台，点击「新建主题」。
填写主题基础信息。
后续若要对基础信息进行修改，可参考基础配置。
- 主题名称（必填）：业务视角简单概括当前业务主题，会作为训练知识给到大模型。
- 问答头像配置：默认为观远logo，可以由用户自行上传图片，进行前台问答头像变更。
- 欢迎语配置（选填）：默认第一行为欢迎语标题，第二行开始为正文内容。
- 主题描述（选填）：帮助业务用户了解当前主题可以解决哪些业务场景/问题，会作为训练知识给到大模型。
- 关联数据集（必填）：问数回答的数据范围，目前版本支持部分直连数据库和添加抽取数据集，数据集描述、数据集结构和字段注释会作为模型学习知识。
前台展示效果：
直接新建完成主题/添加业务知识库。
- 若知识库没有准备好，可点击「直接新建」完成主题创建，后续可在「业务知识库」界面添加知识。
  知识库相关操作可参考业务知识库。
- 若知识库已准备好，点击「下一步」配置业务知识集，配置完成后点击「完成」完成主题创建。
  知识库相关操作可参考业务知识库。

3.3.2. 使用追踪

3.3.2.1. 运营指标

序号	说明
1	通过该按钮切换是否详细展示运营指标数据。
2	切换查看运营指标数据的时间范围，此筛选条件同时适用于对话历史
3	可查看当前主题被提问的次数、提问人数、活跃的用户以及对问数结果的评价。问数结果评价来源于前台问数时的反馈，详见反馈。

3.3.2.2. 对话历史

前台每个提问均会在后台生成一条历史对话，支持筛选查看。

序号	说明
1	可根据前台反馈、完整的消息ID/对话内容以及时间范围筛选历史对话。
2	展示消息ID列，支持复制消息ID提供给到观远侧进行问题排查。
3	根据类型筛选历史对话，包括问答和归因。
4	根据用户名称筛选历史对话。
5	查看历史对话，可在该界面查看消息通知和运维日志，支持将该问题加入错题集，也支持复制SQL和消息ID。若在前台问数时进行了消息通知，可在「消息通知历史」中查看到消息通知数据。后台对话历史展示的可视化效果与前台保持一致，如问数所选数据集为直连数据集，支持「复制执行SQL」，可将该SQL直接用于数仓查询。支持复制消息ID提供给到观远侧进行问题排查。
6	若当前问数返回的SQL回答错误，可点击此按钮，修改SQL查询语句并校验通过后将此问题加入错题集。系统会对当前SQL语法类型进行检查并提示（抽取数据集语法类型显示为Spark）。如出现不同直连数据集混合SQL场景，进行报错提示当前无法支持跨数据库查询。
7	若前台问数效果不理想，可通过查看运维日志排查原因，运维日志包括：相关表信息（数据集结构、字段枚举值 Value examples）相关业务知识（「业务知识库」中与当前提问有关的条目）相关训练样本（「错题集」中与当前提问有关的条目）

3.3.3. 基础配置

3.3.3.1. 基础信息配置

展示当前主题的基础配置，可在此界面修改头像、欢迎语、主题描述。

序号	说明
1	问答头像默认为观远数据logo，可点击「上传图片」修改前台问答头像。
2	点击「编辑」，修改前台欢迎语。
3	点击「编辑」，修改主题描述信息。

3.3.3.2. 数据集配置

序号	说明
1	点击「添加数据集」，为主题新增数据集接入。若数据集名称包含以下特殊字符，则无法加入主题。原因是特殊字符严重影响模型对表名称的生成准确性，建议在加入主题前对BI数据集命名修改（不影响下游卡片或ETL引用）。 `注意：已加入主题的数据集不受影响。` 特殊字符列表： " ", "\t", "\n", "\r","-", "+", "*", "/", "%", "^", "&", "\|", "~", "=", "<", ">", "!", "?",",", ".", ":", ";", "'", """, "`", "(", ")", "[", "]", "{", "}","@", "#", "$","¥", "€", "£", "¢", "¤","「", "」","（","）"
2	当创建主题/修改主题数据集后，将触发数据集表知识自动重新学习。对于字符串类型的数据集字段，系统会自动判断该数据集字段是否需要枚举值学习。对于系统未进行自动学习的字符串类型字段，用户可以进行手动勾选触发学习。
3	点击数据集跳转至数据集详细信息界面，具体操作可参考查看数据集。
4	点击按钮可切换数据集。用户确认需要切换的目标数据集后，可选择当前数据集字段对应目标数据集的字段。确认映射关系并点击确定后，错题集、测试-答案集中涉及的当前数据集及其字段，将会替换为目标数据集及目标数据集的映射字段，相关错题集SQL将会重新触发运行检查，更新错题集SQL有效性。
5	点击按钮可删除该关联数据集，删除操作会进行二次确认以防误删。

3.3.4. 错题集

优先维护业务知识库，针对业务知识库难以清晰维护的提问，可将提问添加至错题集。

注意

请勿将过于简单或者非长期有效的问题添加至错题集。

3.3.4.1. 创建错题集

支持批量导入和单个创建。

单个创建：点击「新建」，跳转至「新建错题集」界面，在此界面输入问题描述与对应的SQL语句，「预览」校验完成后点击「确定」将此问题加入错题集。系统会对当前SQL语法类型进行检查并提示（抽取数据集语法类型显示为Spark）。如出现不同直连数据集混合SQL场景，进行报错提示当前无法支持跨数据库查询。
批量导入：点击「下载问题列表样例」将模板下载至本地，根据模板填写后点击「+」上传，上传后自动开始SQL校验。

3.3.4.2. 设置为推荐问题

若将「设置为推荐问题」开关打开，此问题可在推荐问题中展示。

3.3.4.3. 编辑错题集

点击右侧编辑按钮，可对已有错题集进行修改。

系统会对当前SQL语法类型进行检查并提示（抽取数据集语法类型显示为Spark）。如出现不同直连数据集混合SQL场景，进行报错提示当前无法支持跨数据库查询。

3.3.4.4. 删除错题集

点击此按钮可删除该错题集，删除操作会进行二次确认以防误删。

3.3.4.5. 批量导入导出

当已有错题集需要批量修改或者添加时，可通过「批量导出」导出Excel，在Excel中进行修改与添加，完成后再通过「批量导入」上传Excel。

上传时，系统会校验ID，当ID相同时，覆盖该条错题集；ID不同时，新增一条错题集。

3.3.5. 业务知识库

业务知识库包含通用知识和业务知识。

通用知识：每次对话都需要应用到的知识。
业务知识：“行业术语”、“业务常用语”、“指标口径定义”以文字版形式给到大模型学习。

3.3.5.1. 通用知识

点击右侧「编辑」输入通用知识，通用知识每次提问都会参考。

3.3.5.2. 业务知识

业务知识库中，列表中支持展示操作记录，包括最近更新时间和最近操作人。

最近更新时间：最近一次编辑该行知识记录的时间，格式 yyyy-mm-dd hh:mm:ss
最近操作人：最近一次编辑该行知识的用户信息

3.3.5.2.1. 创建知识

新建业务知识：点击「新建」输入知识描述。
批量导入：点击「下载知识列表样例」将模板下载至本地，根据模板填写后点击「+」上传，上传后自动开始ID校验。当ID相同时，覆盖原有知识；ID不同时，新增一条知识。
生成业务知识：点击「生成业务知识」，可选择仪表板圈定业务知识范围，仪表板可选范围为包含当前主题内数据集创建卡片的仪表板。
选中仪表板后确定，系统会根据当前仪表板范围，定位当前主题内数据集创建的卡片，将卡片上的计算字段、分组字段、过滤字段的计算规则进行提取，生成业务知识存储到业务知识库中。

注意：如果存在两个字段公式提取完全一致，则系统会进行默认去重。

3.3.5.2.2. 编辑知识

点击右侧编辑按钮，可对已有业务知识进行修改。

3.3.5.2.3. 删除知识

点击此按钮可删除该业务知识，删除操作会进行二次确认以防误删。

3.3.5.2.4. 批量导入导出

当已有业务知识需要批量修改或者添加时，可通过「批量导出」导出Excel，在Excel中进行修改与添加，完成后再通过「批量导入」上传Excel。

上传时，系统会校验ID，当ID相同时，覆盖该条知识；ID不同时，新增一条知识。

3.3.6. 权限管理

3.3.6.1. 前提条件

已在 BI 管理后台配置编辑与授权权限，参考权限配置。

3.3.6.2. 使用指导

点击下方「添加用户」，选择使用权限以及需要添加的用户后点击「添加」。

所有者权限：该用户能在运营管理后台看到当前主题，并对主题名称、基础配置、知识库配置及权限配置进行修改；同时，用户能在问数前台对该主题进行提问。
使用者权限：该用户能在问数前台对该主题进行提问。

3.3.7. 主题功能

3.3.7.1. 启用/停用

首次创建并测试完成的主题，需要点击「启用」将主题上线。业务用户可在前台问数界面，看到全部已启用且有权限的主题。

若该主题需要下线，点击「停用」下线当前主题。停用的主题会在界面左侧展示「停用」状态，若想再次开启该主题，点击「启用」即可。

3.3.7.2. 测试

点击右上角的「测试」按钮，进入到测试界面。
在测试界面中，通过批量导入问题或添加单条问题来添加问题。
- 批量导入：批量导入时，下载Excel模板，将调研收集的用户问题及回答SQL填入，进行批量上传。
  
  说明
  问题列表样例中的回答SQL非必填，可以仅上传测试问题。上传文件后即开始文件内所有问题条目的测试。
- 单条添加：逐条录入问题与回答SQL，点击「确定」后即开始添加问题条目的测试。
  
  说明
  回答SQL非必填，可以仅填写问题描述。
触发问题测试时，大模型会根据当前的数据表和知识，批量生成针对当前问题的SQL结果，系统执行该SQL检查其有效性。如SQL执行出错，界面会提示SQL有效性及批改结果错误。
1. 此时用户点击「批改」，可以看到当前大模型生成的SQL详情。
2. 如果此时没有答案集，建议用户点击「复制到答案集并编辑」，将SQL改正后保存，此时该问题将存储一份正确的SQL作为答案。如果已有答案集或已在答案集中维护了正确SQL，点击「添加错题集」，将本条问题加入知识库中。
3. 最后，返回到列表页，勾选本条问题进行重新测试。
对于没有答案集的问题，在SQL有效性为正确后，需要人工进行批改。
- 若数据结果正确，则点击标记为正确，本条测试问题判对，且大模型生成的SQL会自动录入到答案集中。
- 若数据结果错误，则参考第3步的流程，先维护答案集，再点击「标记为错误并添加至错题集」，进行知识录入维护。

对于有答案集的问题，系统会进行大模型生成SQL的执行结果与答案集SQL的执行结果比对，两者数据必须完全一致，则系统自动判定批改结果为正确；如数据不一致，则系统批改结果为错误。
- 对于系统判对的问题，可以人工再核验一版数据，评估是否要修改判定结果。
- 对于系统判错的问题，则参考第3步的流程，点击「标记为错误并添加至错题集」，进行知识录入维护。
在全部测试问题批改完成后，会生成测试准确率提示。

注意
建议主题测试准确率90%及以上后再投入生产。

3.3.7.3. 重命名

点击「重命名」，重命名当前主题名称。

3.3.7.4. 另存为

点击「另存为」，可根据当前主题配置快速创建一个新的主题。

3.3.7.5. 删除

点击「删除」删除当前主题，删除操作会进行二次确认以防误删。

1. 概述​

2.主题构成​

3. 使用指导​

3.1. 前提条件​

3.2. 界面概览​

3.3. 功能详情​

3.3.1. 新建主题​

3.3.2. 使用追踪​

3.3.2.1. 运营指标​

3.3.2.2. 对话历史​

3.3.3. 基础配置​

3.3.3.1. 基础信息配置​

3.3.3.2. 数据集配置​

3.3.4. 错题集​

3.3.4.1. 创建错题集​

3.3.4.2. 设置为推荐问题​

3.3.4.3. 编辑错题集​

3.3.4.4. 删除错题集​

3.3.4.5. 批量导入导出​

3.3.5. 业务知识库​

3.3.5.1. 通用知识​

3.3.5.2. 业务知识​

3.3.5.2.1. 创建知识​

3.3.5.2.2. 编辑知识​

3.3.5.2.3. 删除知识​

3.3.5.2.4. 批量导入导出​

3.3.6. 权限管理​

3.3.6.1. 前提条件​

3.3.6.2. 使用指导​

3.3.7. 主题功能​

3.3.7.1. 启用/停用​

3.3.7.2. 测试​

3.3.7.3. 重命名​

3.3.7.4. 另存为​

3.3.7.5. 删除​