一、配置向量数据库
内部资料,请扫码登录
pigcloud
# 一、配置向量数据库
- 如果训练私有知识库,则此步骤是必选 ,qdrant docker 命令一键启动,非常轻量
# 可用内存不能低于 4G
docker run -p 6333:6333 -p 6334:6334 registry.cn-hangzhou.aliyuncs.com/dockerhub_mirror/qdrant
- 配置yaml相关配置,application-ai.yml
# 二、配置模型
# 2.0 大模型KEY
阿里云提供的免费用量,足够大部分用户使用,如果需要更多的用量,可以在阿里云购买(非常便宜,1块钱足够你玩很久)。
# 2.1 配置聊天模型
# 2.2 配置向量模型
# 2.3 配置视觉模型
# 3.1、创建知识库
- 知识库管理 > 新增
- 高级配置、安全配置参数 正常情况下不需要修改
- 匹配率、匹配条数: 决定了大模型匹配的幻觉率,比如匹配率越低,在知识内容较少的情况下,大模型匹配的幻觉率越高(胡说八道)。建议根据自己实际情况动态调整此处参数
# 3.2、上传资料
- 知识库管理 > 新增
# 文件状态说明
文件上传后,请耐心等待后台处理文件等,过程状态参考如下说明
- 未切片: 上传文件后的状态
- 已切片: 文件已经解析并切割成一段段的文本
- 已总结: 通过大模型生成的整个文本的缩略信息,提高准确性
- 已训练(切片管理): 通过大模型生成的文本向量并入向量库
# 3.3、切片管理
上传至知识库的资料,会自动切片,切片管理可以查看切片详情,点击切片即可编辑。
当右上角显示已训练的标识时,则说明文档已经调用大模型生成了切片的向量并存储到向量数据库。
# 问答测试调用
AI 助手点击具体的文档库,进行针对性的问答调用。