Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
J
jinchat-server
概览
概览
详情
活动
周期分析
版本库
存储库
文件
提交
分支
标签
贡献者
分支图
比较
统计图
问题
0
议题
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
代码片段
成员
成员
折叠边栏
关闭边栏
活动
图像
聊天
创建新问题
作业
提交
问题看板
Open sidebar
aigc-pioneer
jinchat-server
Commits
7d37dc87
Unverified
提交
7d37dc87
authored
7月 21, 2023
作者:
Zhi-guo Huang
提交者:
GitHub
7月 21, 2023
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #904 from bones-zhu/dev
1 修复model_config.py的type;2 修改默认的LLM_model;3. 移除chatglm_llm.py的无用模块
上级
5f4f8dce
5479a747
显示空白字符变更
内嵌
并排
正在显示
2 个修改的文件
包含
5 行增加
和
5 行删除
+5
-5
model_config.py
configs/model_config.py
+2
-2
chatglm_llm.py
models/chatglm_llm.py
+3
-3
没有找到文件。
configs/model_config.py
浏览文件 @
7d37dc87
...
@@ -203,7 +203,7 @@ llm_model_dict = {
...
@@ -203,7 +203,7 @@ llm_model_dict = {
}
}
# LLM 名称
# LLM 名称
LLM_MODEL
=
"fastchat-chatglm
-6b-int4
"
LLM_MODEL
=
"fastchat-chatglm"
# 量化加载8bit 模型
# 量化加载8bit 模型
LOAD_IN_8BIT
=
False
LOAD_IN_8BIT
=
False
# Load the model with bfloat16 precision. Requires NVIDIA Ampere GPU.
# Load the model with bfloat16 precision. Requires NVIDIA Ampere GPU.
...
@@ -220,7 +220,7 @@ STREAMING = True
...
@@ -220,7 +220,7 @@ STREAMING = True
# Use p-tuning-v2 PrefixEncoder
# Use p-tuning-v2 PrefixEncoder
USE_PTUNING_V2
=
False
USE_PTUNING_V2
=
False
PTUNING_DIR
=
'./ptuing-v2'
PTUNING_DIR
=
'./ptu
n
ing-v2'
# LLM running device
# LLM running device
LLM_DEVICE
=
"cuda"
if
torch
.
cuda
.
is_available
()
else
"mps"
if
torch
.
backends
.
mps
.
is_available
()
else
"cpu"
LLM_DEVICE
=
"cuda"
if
torch
.
cuda
.
is_available
()
else
"mps"
if
torch
.
backends
.
mps
.
is_available
()
else
"cpu"
...
...
models/chatglm_llm.py
浏览文件 @
7d37dc87
...
@@ -2,14 +2,14 @@ from abc import ABC
...
@@ -2,14 +2,14 @@ from abc import ABC
from
langchain.chains.base
import
Chain
from
langchain.chains.base
import
Chain
from
typing
import
Any
,
Dict
,
List
,
Optional
,
Generator
from
typing
import
Any
,
Dict
,
List
,
Optional
,
Generator
from
langchain.callbacks.manager
import
CallbackManagerForChainRun
from
langchain.callbacks.manager
import
CallbackManagerForChainRun
from
transformers.generation.logits_process
import
LogitsProcessor
#
from transformers.generation.logits_process import LogitsProcessor
from
transformers.generation.utils
import
LogitsProcessorList
,
StoppingCriteriaList
#
from transformers.generation.utils import LogitsProcessorList, StoppingCriteriaList
from
models.loader
import
LoaderCheckPoint
from
models.loader
import
LoaderCheckPoint
from
models.base
import
(
BaseAnswer
,
from
models.base
import
(
BaseAnswer
,
AnswerResult
,
AnswerResult
,
AnswerResultStream
,
AnswerResultStream
,
AnswerResultQueueSentinelTokenListenerQueue
)
AnswerResultQueueSentinelTokenListenerQueue
)
import
torch
#
import torch
import
transformers
import
transformers
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论