快速启动自托管、可扩展、管理友好的LLM
环境,使用One-Api
分发和管理Key
。
默认使用
ChatGLM3-6B
模型,4bit
量化,OpenAI
格式的Api
启动,使用GPU
推理。
暂不支持AMD显卡和苹果M系列GPU。
带有Nvidai
显卡(显存>=8GB),并且已经正确安装驱动的Windows
、Linux
环境。
或者使用CPU推理的Windows
、Linux
、MacOS
环境。
如果提示没有
lfs
命令,则需要安装git-lfs
,Debian / Ubuntu
系统可执行此命令安装sudo apt-get install git-lfs
。
仓库根目录执行
git lfs install
进入模型目录
cd ./models/THUDM
下载模型
git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git
复制.env.template
到.env
cp .env.template .env
docker-compose up -d
打开One-Api
http://ServerIP:3000/login
初始账号用户名为 root
,密码为 123456
,修改初始密码。
点击导航栏渠道,添加本地启动的ChatGML3到渠道。
可参考以下值填写:
类型:自定义渠道
Base URL:http://serverip:8000
名称:ChatGLM3-6B
分组:default
模型:gpt-3.5-turbo
模型重定向:-
密钥:none
填写完毕后点击提交
点击导航栏渠道按钮,点击新添加的渠道测试按钮,测试成功则代表本地ChatGLM3已启动成功。
至此,已经把本地ChatGLM3
,添加到了One-Api
。可以通过One-Api
分发密钥,此密钥可直接用于兼容OpenAI API
的ChatGPT
程序。
完成以上部分之后,我们可以开始分发并使用密钥了。这里以ChatGPT Next Web
为例。
点击创建新的令牌,选择参数,创建完毕后,复制令牌,选择 ChatGPT Next Web
。
这里复制的格式如下,只需要Key
部分sk-HTP3cKpFaA2p0HIc20EfFc0a412c4fF1812a4a420f343a04
https://chat.oneapi.pro/#/?settings={"key":"sk-HTP3cKpFaA2p0HIc20EfFc0a412c4fF1812a4a420f343a04","url":"http://localhost:3000"}
打开http://ServerIP:3001/
,点击左下角设置,勾选自定义接口按钮,填写接口地址为One-Api
地址http://ServerIP:3000
,API_KEY
一栏填写上一步拿到的Key
sk-HTP3cKpFaA2p0HIc20EfFc0a412c4fF1812a4a420f343a04
至此,整个环境搭建完成。
One-Api:OpenAI 接口管理 & 分发系统;
ChatGLM3:开源双语对话语言模型;
ChatGPT-Next-Web:跨平台 ChatGPT 应用;