GPT4All API 服务器
GPT4All提供了一个本地API服务器,允许您通过HTTP API运行LLM。
主要功能
- 本地执行: 在您自己的硬件上运行模型,以确保隐私和离线使用。
- LocalDocs集成: 使用从LocalDocs集合提供给您的LLM的相关文本片段来运行APILocalDocs collection.
- OpenAI API兼容性: 使用现有的OpenAI兼容客户端和工具与您的本地模型。
激活API服务器
- 打开GPT4All聊天桌面应用程序。
- 前往
Settings
>Application
并向下滚动到Advanced
. - 勾选
"Enable Local API Server"
设置中选择另一个端口号。 - 服务器默认监听端口4891。您可以在
"API Server Port"
设置中选择另一个端口号。
连接到API服务器
API服务器使用的基URL是http://localhost:4891/v1
(或者http://localhost:<PORT_NUM>/v1
如果您使用不同的端口号)。
服务器仅接受HTTP连接(不接受HTTPS),并且仅在本地主机(127.0.0.1)上监听(例如,不包括IPv6本地主机地址::1
.)。
示例
示例GPT4All API调用
API端点
方法 | 路径 | 描述 |
---|---|---|
GET | /v1/models |
列出可用模型 |
GET | /v1/models/<name> |
获取特定模型的详细信息 |
POST | /v1/completions |
生成文本补全 |
POST | /v1/chat/completions |
生成聊天补全 |
LocalDocs集成
您可以使用LocalDocs与API服务器:
- 在GPT4All应用程序中打开聊天视图。
- 向下滚动到聊天历史侧边栏的底部。
- 选择服务器聊天(它具有不同的背景颜色)。
- 在右侧边栏中激活LocalDocs集合。
(注意:LocalDocs目前只能通过GPT4All UI激活,不能通过API本身激活)。
现在,您对本地LLM的API调用将检索并放置来自您的LocalDocs集合的相关引用,作为LLM响应的输入消息。
您的API调用检索的引用可以在API响应对象中的
response["choices"][0]["references"]
访问。references
are:
-
text
: 从引用文档中提取的实际文本内容 -
author
: 引用文档的作者(如果可用) -
date
: 引用文档的创建日期(如果可用) -
page
: 提取片段的页码(目前仅适用于PDF文档) -
title
: 引用文档的标题(如果可用)