Skip to content

ChatDoc安装

这部分将介绍如何启动一个ChatDoc程序。

文件下载

Alt text

扫描上面这个二维码下载,或者点击百度网盘下载地址。可根据使用的文件,按需下载。

模型文件

chatdoc仅推荐使用int8-2048模型。因此所需模型文件在位于~/airbox-app/chatglm应用/chatglm-int8-2048/路径下。

执行cp -r ~/airbox-app/chatglm应用/chatglm-int8-2048/ /data

将chatglm-int8-2048目录拷贝到AirBox的/data下。chatglm-int8-2048目录包含三个文件一个chatglm2-6b_2048_int8.bmodel模型文件,一个是libtpuchat.socpp编译的so文件,最后一个是tokenizer.model

项目结构树

|-- chatglm-int8-2048     -- 模型文件
    |-- chatglm2-6b_2048_int8.bmodel
    |-- libtpuchat.so
    |-- tokenizer.model
|-- chatdoc
    |-- README.md         -- README
    |-- api.py            -- API服务脚本
    |-- chat.py           -- Python调用cpp推理接口脚本
    |-- chatbot.py        -- ChatDoc业务逻辑脚本
    |-- config.ini        -- 推理模型配置文件
    |-- requirements.txt  -- 项目依赖
    |-- run.sh            -- 启动脚本
    |-- web_demo_st.py    -- 页面交互脚本
    |-- data          
        |-- db            -- 知识库持久化目录
        |-- uploaded      -- 已上传文件目录
    |-- embedding_tpu     -- 文本嵌入模型TPU版本
    |-- embedding         -- 文本嵌入模型CPU版本
    |-- static            -- README中图片文件

chatdoc项目文件

  • cd /data/
  • git clone https://github.com/zhengorange/chatdoc.git

依赖安装

在AirBox终端进入到/data/chatdoc/目录下。执行 virtualenv glm

source glm/bin/activate

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

pip install tpu_perf-1.2.24-py3-none-manylinux2014_aarch64.whl

安装项目所需要的依赖。

有些网络条件下,nltk语料将下载失败,解决办法是将我们提供的nltk_data文件夹拷贝到AirBox用户跟目录,即cp -r ~/airbox-app/nltk_data ~/

embedding分为cpu版本和tpu版本,任选其一即可。

  • TPU版本 百度网盘链接: https://pan.baidu.com/s/18wARtq7JdnzphUt9M9HScw?pwd=t2f3 下载完成将下载的embedding_tpu文件夹替换chatdoc目录下的embedding_tpu。

  • CPU版本 百度网盘链接: https://pan.baidu.com/s/1yFrk0Jtmbfr-nHnWvXF6AA?pwd=x5rw 下载完成将下载的embedding文件夹替换chatdoc目录下的embedding。

项目启动

  • 激活环境,若已激活则无需再执行source glm/bin/activate
  • 进入项目目录cd /data/chatdoc
  • 启动项目bash run.shbash run_emb_tpu.sh

更多项目细节参考GitHub仓库