Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
J
jinchat-server
概览
概览
详情
活动
周期分析
版本库
存储库
文件
提交
分支
标签
贡献者
分支图
比较
统计图
问题
0
议题
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
代码片段
成员
成员
折叠边栏
关闭边栏
活动
图像
聊天
创建新问题
作业
提交
问题看板
Open sidebar
aigc-pioneer
jinchat-server
Commits
86e54517
提交
86e54517
authored
4月 12, 2023
作者:
imClumsyPanda
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Add diagram in README.md
上级
55071c79
隐藏空白字符变更
内嵌
并排
正在显示
2 个修改的文件
包含
9 行增加
和
0 行删除
+9
-0
README.md
README.md
+9
-0
langchain+chatglm.png
img/langchain+chatglm.png
+0
-0
没有找到文件。
README.md
浏览文件 @
86e54517
...
...
@@ -10,6 +10,11 @@
✅ 本项目中 Embedding 选用的是
[
GanymedeNil/text2vec-large-chinese
](
https://huggingface.co/GanymedeNil/text2vec-large-chinese/tree/main
)
,LLM 选用的是
[
ChatGLM-6B
](
https://github.com/THUDM/ChatGLM-6B
)
。依托上述模型,本项目可实现全部使用
**开源**
模型
**离线私有部署**
。
⛓️ 本项目实现原理如下图所示,过程包括输入文档路径加载文档后,读取文本 ➡ ️文本分割 ➡ ️文本向量化 ➡ ️问句向量化 ➡ ️在文本向量中匹配出与问句向量最相似的
`top-k`
个 ➡ ️匹配出的文本作为上下文和问题一起添加到
`prompt`
中 ➡ ️提交给
`llm`
生成回答。
![
实现原理图
](
img/langchain+chatglm.png
)
🚩 本项目未设计微调、训练过程,但可利用微调或训练对本项目效果进行优化。
## 更新信息
...
...
@@ -94,6 +99,10 @@ Q: `Resource averaged_perceptron_tagger not found.` 如何解决?
A: 将 https://github.com/nltk/nltk_data/blob/gh-pages/packages/taggers/averaged_perceptron_tagger.zip 下载,解压放到
`Searched in:`
对应目录下。
Q: 本项目可否在 colab 中运行?
A: 可以尝试使用 chatglm-6b-int4 模型在 colab 中运行,需要注意的是,如需在 colab 中运行 Web UI,需将
`webui.py`
中
`demo.queue(concurrency_count=3).launch(
server_name='0.0.0.0', share=False, inbrowser=False)`
中参数
`share`
设置为
`True`
。
## DEMO
以问题
`chatglm-6b 的局限性具体体现在哪里,如何实现改进`
为例
...
...
img/langchain+chatglm.png
0 → 100644
浏览文件 @
86e54517
差异被折叠。
点击展开。
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论