📄 系统简介

内部资料,请扫码登录

PIG AI 是一款开源的大语言模型(LLM)应用开发平台,它结合了后端即服务(Backend as Service)和 LLMOps 的理念,使开发者能够快速搭建生产级的生成式 AI 应用。即使你是非技术人员,也能参与到 AI 应用的定义和数据运营过程中。

PIG AI 内置了构建 LLM 应用所需的关键技术栈,包括对数十个模型的支持、高质量的 RAG 引擎以及灵活的 Agent 框架,并提供了一套易用的界面和 API。这使得开发者可以节省大量重复造轮子的时间,适用于多种企业级商业场景,如企业智能客服、企业智能文档、专家顾问助理、业务联动等。

通过PIG AI,企业可以轻松构建出功能强大、高效智能的应用程序,提升业务流程的自动化程度和智能化水平,从而提高企业的竞争力和创新能力。

# 一、多模型支持

PIG AI 为以下模型提供商提供原生支持:

模型 LLM Embedding Function Call
阿里云通义千问 ✔️ ✔️ ✔️
MINIMAX (海螺 AI) ✔️ ✔️
百度文心 ✔️ ✔️ ✔️
清华智谱 ✔️ ✔️
OpenAI ChatGPT ✔️ ✔️ ✔️
Anthropic Claude ✔️ ✔️ ✔️
Mistral AI ✔️ ✔️ ✔️
Gemini ✔️ ✔️ ✔️
Qwen2:72B ✔️ ✔️
Llama3:8B ✔️ ✔️
Mistral:7B ✔️ ✔️ ✔️
Llama2:13B ✔️ ✔️
Llama2:70B ✔️ ✔️
Code Llama:7B ✔️ ✔️

理论上,我们的系统支持 Ollama (opens new window) 本地推理框架客户端,这使得一键部署像 Llama 2、Mistral、Llava 等大型语言模型成为可能。PIG AI 可以轻松接入 Ollama 部署的大型语言模型,并利用其强大的推理和 embedding 能力。这意味着我们的系统可以利用 Ollama 提供的高效、可扩展的推理框架,从而为用户提供更快速、更准确的语言理解和处理功能。通过与 Ollama 的集成,我们能够为用户带来更优秀的语言模型服务,助力他们在各种应用场景下实现更高水平的智能化处理。

# 二、RAG 知识库

PIG AI 的知识库功能确实非常强大,支持上传外部数据,如本地文件和实时数据,并利用向量搜索来检索最相关的内容以回答用户的问题。这种功能可以大大提高机器人的回答准确度和效率,使其能够更精确地理解和回应用户的提问。

通过上传外部数据,用户可以将各种类型的信息整合到 PIG AI 的知识库中,包括文档、数据库查询结果、实时数据等。然后,PIG AI 使用先进的向量搜索技术来对这些数据进行索引和搜索,以便快速找到与用户查询最相关的内容。

这种功能对于各种场景都非常有用,包括客户服务、技术支持、知识管理等。通过使用 PIG AI 的知识库功能,用户可以轻松构建出功能强大的智能问答系统,为用户提供更快速、更准确的帮助和支持。

1713174212 1713173663

# ① 知识库

将数据上传到 PIG AI 知识库后,PIG AI 会自动将你的文档分割成内容片段进行存储,并通过向量搜索来检索最相关的内容来回答用户问题。

例如:

  • 你可以将几十页的产品介绍文档导入知识库,当 Bot 使用了这个知识库后,你就可以拥有一个专属产品顾问 Bot。

  • 你可以将常关注的资讯网站或在线论文导入知识库,通过知识库的自动更新能力,让 Bot 帮助你收集最新数据。

# ② 多模态

PIG AI 知识库可以处理和理解来自不同模态(例如文本、图像、PDF、Office 等)的文档信息,使大型模型能够跨越多种输入形式进行学习和推理。

    1. 深度文档理解:能够从各类复杂格式的非结构化数据中提取真知灼见。
    1. 基于模板的文本切片:提供多种文本模板,实现智能且可控的文本处理。
    1. 降低幻觉(hallucination):通过文本切片过程可视化,支持手动调整,确保答案提供关键引用的快照并支持追根溯源。
    1. 兼容各类异构数据源:支持丰富的文件类型,包括 Word 文档、PPT、Excel 表格、txt 文件、图片、PDF、影印件、复印件、结构化数据和网页等。

为解决目前 RAG(Retrieval-Augmented Generation)在实施中遇到的问题,如数据库的多路召回能力和数据处理问题。通过提供专用的数据库和工具,旨在使 RAG 更易于被更多企业和个人使用,并解锁更多应用场景。

# 三、Function 函数

将自然语言转换为 API 调用参数或查询数据库的条件;提取文本中的结构化数据。提供基于通用大型模型的实时回调业务函数能力,Function Calling 使得 Chat Completion 模型可以调用外部函数获取信息再针对输出进行格式化。能够方便地扩展任何业务逻辑,使模型更了解业务,更敏捷地构建您的私域大模型。使用函数调用能力,可以满足当前大模型无法解决的部分问题,包括:

  • 在进行自然语言交互时,可以通过调用外部工具回答问题(类似于 ChatGPT 插件)

  • 将自然语言转换为调用 API 时使用的参数,或者查询数据库时使用的条件

  • 从文本中提取结构化数据,实现 AI 表单

# ① 业务联动

将大模型回调业务系统的功能融入现有业务流程中 是一项关键任务。在这个过程中,首先需要经过现有业务的权限判断、参数校验等业务逻辑判断,以确保调用的合法性和准确性。一旦通过了这些判断,大模型回调功能就会被触发,开始执行相应的智能逻辑。

这种打通大模型和业务系统的壁垒,实际上是在传统应用中引入了更智能的处理方式。通过大模型的回调,业务系统可以获得更精准、更智能的决策支持,从而提升业务处理的效率和准确性。这种智能化的应用场景不仅可以优化现有业务流程,还可以为企业带来更多的竞争优势和创新可能性。

# ② 扩展能力

PIG AI 提供了强大的功能调用支持,允许用户自行开发和实现 function calling,从而实现业务联动能力。这意味着用户可以根据自身业务需求,开发定制的功能模块,并通过 PIG AI 提供的方便 API 接口将这些功能集成到应用中。

    1. 用户可以根据自身需求开发具体的业务逻辑和处理流程,并将其封装为可被 PIG AI 调用的函数或服务。这样可以实现更高度定制化和个性化的应用功能。
    1. API 接口集成: PIG AI 提供了简单易用的 API 接口,用户可以通过实现 Function Calling,将自定义功能模块集成到 PIG AI 的应用中。这样,用户可以利用 PIG AI 强大的语言理解和处理能力,结合自身的业务逻辑,构建出完整的智能应用。

# 四、Chat2SQL

Chat2SQL 能够实现**自然语言与 SQL 的转换,从而极大地提升了工作效率。在 AI 时代,数据库研发人员可以将 Chat2SQL 视为必备的利器,它为他们提供了便捷而高效的工作方式。即使是不懂 SQL 的运营或业务人员,也可以轻松地使用 Chat2SQL 进行快速的数据查询和报表生成。

Chat2SQL 还具有智能化的功能,能够根据上下文自动选中相关的数据表,并生成与业务需求相匹配的 SQL 查询语句。这种智能关联功能使得用户无需深入了解数据库结构,就能够轻松地执行复杂的数据查询操作,极大地降低了使用门槛,提高了工作效率。

# 五、Java 技术栈

基于 Java 语言 进行系统开发,提供了丰富的模型支持,包括公有模型和私有模型,并且具有方便的扩展性和二次开发性。让我详细解释一下:

  1. 丰富的模型支持: PIG AI 提供了多种大模型支持,涵盖了文本、图片视觉、语音识别等模型。这些模型既包括了公有模型,也支持用户上传和使用私有模型,因此可以满足各种不同场景和需求下的系统开发。
  2. 方便的扩展性: PIG AI 提供了友好的接口和工具,方便开发人员轻松地扩展系统功能。无论是集成新的预训练模型,还是开发定制的模型和算法,都可以通过 PIG AI 提供的扩展机制来实现。
  3. 二次开发支持: PIG AI 提供了灵活的二次开发支持,可以根据具体需求进行定制化开发。开发人员可以基于 PIG AI 提供的模型和工具,快速构建出符合业务需求的系统,并且可以根据实际情况进行调整和优化。
  4. 与 Java 的紧密集成: PIG AI 提供了与 Java 紧密集成的功能,这使得 Java 开发者可以更轻松地使用 PIG AI 的功能。通过 PIG AI 提供的 Java SDK 和 API,开发人员可以在 Java 项目中直接调用 PIG AI 的功能,实现各种智能化应用场景。

综上所述,基于 PIG AI 进行系统开发可以让大模型距离 Java 开发者更近一步,为他们提供了丰富的模型支持、方便的扩展性和二次开发支持。这将有助于开发人员快速构建出功能强大、智能化的系统应用。

# ① 服务端技术栈

  • 编程语言:Java17/21
  • 开发框架:Spring Boot 3.2
  • 安全框架:Spring Security + Spring Authorization Server
  • 任务调度:Quartz 、 XXL-JOB
  • 流程编排:LiteFlow
  • 持久层框架:MyBatis && MyBatis Plus
  • 数据库支持: MySQL、Oracle、SQL Server、PostgreSQL、 达梦、 TiDB

# ② 前端技术栈

  • 框架:Vue 3.2、TypeScript

  • CSS 框架:Sass、TailwindCSS

  • 组件库:ElementPlus

  • 打包构建工具:Vite

  • 状态管理: Pinia

# 五、规则引擎

生成式 AI 因其特性而在各地区受到不同程度的管控,针对这一挑战,我们的系统通过规则引擎平台实现了高度定制化 的解决方案。我们系统提供基于规则引擎的多维度风险控制审查,涵盖敏感词、IP、tokens 等多个关键维度。这些规则不仅仅是符合当地相关服务管理办法的要求,更能快速扩展模型接入和业务开发,以满足不断变化的业务需求。