本文介绍如何进行一个“会话数据分析”主题的创建及配置,主要分三个步骤:
- 准备相关文件
- 调用接口向量化并存储
- 配置主题文件
asdfasd [1]
1、准备工作
准备好三个内容,
- 业务库表结构
当前业务主题所涉及的库表结构,不要遗漏也不要多余。表和字段的注释要有且精确。 - 业务词条
当前业务主体所涉及的专业术语及解释,便于大模型理解。比如当前行业,或客户特定的一些表述,如:三大主体税种、财年的定义等。
业务词条非必须,可以后续根据回答效果,进行补充。 - SQL示例
为了提高回答的准确些,给大模型提供一些SQL示例,比如一些高级、复杂业务的SQL示例。
SQL示例非必须项,可以后续根据回答效果,进行补充。
2、【文件向量化解析存储】接口说明
把内容向量化并存储,目前是通过调用小乐AI的后端微服务的“文件向量化解析存储”接口完成。该接口说明:
● URL: api/vector/fileParse
● Method:POST
2.1 请求头
名称 | 值 |
---|---|
Content-Type | multipart/form-data |
2.2 表单参数
名称 | 类型 | 描述 |
---|---|---|
file | byte[] | 文件二进制 |
collectionName | string | 数据库名称,注意名称,别存到其它库了 |
removeCollection | boolean | 删除集合,注意collectionName,别存到其它库了 |
2.3 接口调用示例
2.4 文件格式说明
分为三个部分:文本、desc、sql。后两者根据文本的类型可选。
每个文本采用两空白行分割!
3、向量化并存储
接下来就是调用上述描述的接口,对业务库表结构、业务词条、SQL示例向量化并存储。
注意:不同主题、不同类型的内容,最好存放在不同的collection中,collectionName名称自行定义,比如:lczChatBI_ERP、lczChatBI_ERP_entry、lczChatBI_ERP_sample,分别存放库表结构、业务词条、SQL示例。
下面列出三个例子:
业务库表结构
库表结构文件里,没有使用desc、sql内容。
业务词条
业务词条文件里,没有使用sql内容。
sql示例
sql示例,包括了问题、业务逻辑说明和sql三部分。
4、配置主题信息
主题配置信息在微服务的 subject/businessSubject.json 文件中。
新增或修改一个主题对象:
{
"subjectId": "1", #主题ID
"subjectTitle": "销售分析", #主题标题
"desc": "销售分析,包括销售明细、销售员、产品、供应商", #主题描述
"dbStructureCollection": "lczChatBI_ERP", #库表结构存储的向量库名
"samplesCollection": "lczChatBI_ERP_sample", #sql示例存储的向量库名
"entrysCollection": "lczChatBI_ERP_entry" #业务词条存储的向量库名
}
主题文件修改后,需要重启微服务。
作者:管理员 创建时间:2025-03-05 09:07
最后编辑:管理员 更新时间:2025-03-11 11:37
最后编辑:管理员 更新时间:2025-03-11 11:37
