本文介绍如何进行一个“会话数据分析”主题的创建及配置,主要分三个步骤:

  1. 准备相关文件
  2. 调用接口向量化并存储
  3. 配置主题文件
    asdfasd [1]

1、准备工作

准备好三个内容,

  • 业务库表结构
    当前业务主题所涉及的库表结构,不要遗漏也不要多余。表和字段的注释要有且精确。
  • 业务词条
    当前业务主体所涉及的专业术语及解释,便于大模型理解。比如当前行业,或客户特定的一些表述,如:三大主体税种、财年的定义等。
    业务词条非必须,可以后续根据回答效果,进行补充。
  • SQL示例
    为了提高回答的准确些,给大模型提供一些SQL示例,比如一些高级、复杂业务的SQL示例。
    SQL示例非必须项,可以后续根据回答效果,进行补充。

2、【文件向量化解析存储】接口说明

把内容向量化并存储,目前是通过调用小乐AI的后端微服务的“文件向量化解析存储”接口完成。该接口说明:

● URL: api/vector/fileParse
● Method:POST

2.1 请求头

名称
Content-Type multipart/form-data

2.2 表单参数

名称 类型 描述
file byte[] 文件二进制
collectionName string 数据库名称,注意名称,别存到其它库了
removeCollection boolean 删除集合,注意collectionName,别存到其它库了

2.3 接口调用示例

2.4 文件格式说明

分为三个部分:文本、desc、sql。后两者根据文本的类型可选。
每个文本采用两空白行分割!

3、向量化并存储

接下来就是调用上述描述的接口,对业务库表结构业务词条SQL示例向量化并存储。

注意:不同主题、不同类型的内容,最好存放在不同的collection中,collectionName名称自行定义,比如:lczChatBI_ERP、lczChatBI_ERP_entry、lczChatBI_ERP_sample,分别存放库表结构、业务词条、SQL示例。

下面列出三个例子:
业务库表结构

库表结构文件里,没有使用desc、sql内容。

业务词条

业务词条文件里,没有使用sql内容。

sql示例

sql示例,包括了问题、业务逻辑说明和sql三部分。

4、配置主题信息

主题配置信息在微服务的 subject/businessSubject.json 文件中。
新增或修改一个主题对象:

  {
  "subjectId": "1",                                      #主题ID
  "subjectTitle": "销售分析",                            #主题标题
  "desc": "销售分析,包括销售明细、销售员、产品、供应商",   #主题描述
  "dbStructureCollection": "lczChatBI_ERP",             #库表结构存储的向量库名
  "samplesCollection": "lczChatBI_ERP_sample",          #sql示例存储的向量库名
  "entrysCollection": "lczChatBI_ERP_entry"             #业务词条存储的向量库名
  }

主题文件修改后,需要重启微服务。

作者:管理员  创建时间:2025-03-05 09:07
最后编辑:管理员  更新时间:2025-03-11 11:37