Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
J
jinchat-server
概览
概览
详情
活动
周期分析
版本库
存储库
文件
提交
分支
标签
贡献者
分支图
比较
统计图
问题
0
议题
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
代码片段
成员
成员
折叠边栏
关闭边栏
活动
图像
聊天
创建新问题
作业
提交
问题看板
Open sidebar
aigc-pioneer
jinchat-server
Commits
6ec1e56e
提交
6ec1e56e
authored
7月 21, 2023
作者:
hzg0601
浏览文件
操作
浏览文件
下载
差异文件
Merge branch 'dev' of github.com:imClumsyPanda/langchain-ChatGLM into dev
上级
32122ee2
acee2d5a
显示空白字符变更
内嵌
并排
正在显示
4 个修改的文件
包含
9 行增加
和
8 行删除
+9
-8
model_config.py
configs/model_config.py
+2
-2
chatglm_llm.py
models/chatglm_llm.py
+3
-3
args.py
models/loader/args.py
+1
-1
loader.py
models/loader/loader.py
+3
-2
没有找到文件。
configs/model_config.py
浏览文件 @
6ec1e56e
...
...
@@ -203,7 +203,7 @@ llm_model_dict = {
}
# LLM 名称
LLM_MODEL
=
"fastchat-chatglm
-6b-int4
"
LLM_MODEL
=
"fastchat-chatglm"
# 量化加载8bit 模型
LOAD_IN_8BIT
=
False
# Load the model with bfloat16 precision. Requires NVIDIA Ampere GPU.
...
...
@@ -220,7 +220,7 @@ STREAMING = True
# Use p-tuning-v2 PrefixEncoder
USE_PTUNING_V2
=
False
PTUNING_DIR
=
'./ptuing-v2'
PTUNING_DIR
=
'./ptu
n
ing-v2'
# LLM running device
LLM_DEVICE
=
"cuda"
if
torch
.
cuda
.
is_available
()
else
"mps"
if
torch
.
backends
.
mps
.
is_available
()
else
"cpu"
...
...
models/chatglm_llm.py
浏览文件 @
6ec1e56e
...
...
@@ -2,14 +2,14 @@ from abc import ABC
from
langchain.chains.base
import
Chain
from
typing
import
Any
,
Dict
,
List
,
Optional
,
Generator
from
langchain.callbacks.manager
import
CallbackManagerForChainRun
from
transformers.generation.logits_process
import
LogitsProcessor
from
transformers.generation.utils
import
LogitsProcessorList
,
StoppingCriteriaList
#
from transformers.generation.logits_process import LogitsProcessor
#
from transformers.generation.utils import LogitsProcessorList, StoppingCriteriaList
from
models.loader
import
LoaderCheckPoint
from
models.base
import
(
BaseAnswer
,
AnswerResult
,
AnswerResultStream
,
AnswerResultQueueSentinelTokenListenerQueue
)
import
torch
#
import torch
import
transformers
...
...
models/loader/args.py
浏览文件 @
6ec1e56e
...
...
@@ -44,7 +44,7 @@ parser.add_argument('--no-remote-model', action='store_true', help='remote in th
parser
.
add_argument
(
'--model-name'
,
type
=
str
,
default
=
LLM_MODEL
,
help
=
'Name of the model to load by default.'
)
parser
.
add_argument
(
'--lora'
,
type
=
str
,
help
=
'Name of the LoRA to apply to the model by default.'
)
parser
.
add_argument
(
"--lora-dir"
,
type
=
str
,
default
=
LORA_DIR
,
help
=
"Path to directory with all the loras"
)
parser
.
add_argument
(
'--use-ptuning-v2'
,
type
=
str
,
default
=
USE_PTUNING_V2
,
help
=
"whether use ptuning-v2 checkpoint"
)
parser
.
add_argument
(
'--use-ptuning-v2'
,
action
=
'store_true'
,
help
=
"whether use ptuning-v2 checkpoint"
)
parser
.
add_argument
(
"--ptuning-dir"
,
type
=
str
,
default
=
PTUNING_DIR
,
help
=
"the dir of ptuning-v2 checkpoint"
)
# Accelerate/transformers
parser
.
add_argument
(
'--load-in-8bit'
,
action
=
'store_true'
,
default
=
LOAD_IN_8BIT
,
...
...
models/loader/loader.py
浏览文件 @
6ec1e56e
...
...
@@ -441,7 +441,7 @@ class LoaderCheckPoint:
if
self
.
use_ptuning_v2
:
try
:
prefix_encoder_file
=
open
(
Path
(
f
'{
self.ptuning_dir
}/config.json'
),
'r'
)
prefix_encoder_file
=
open
(
Path
(
f
'{
os.path.abspath(self.ptuning_dir)
}/config.json'
),
'r'
)
prefix_encoder_config
=
json
.
loads
(
prefix_encoder_file
.
read
())
prefix_encoder_file
.
close
()
self
.
model_config
.
pre_seq_len
=
prefix_encoder_config
[
'pre_seq_len'
]
...
...
@@ -457,13 +457,14 @@ class LoaderCheckPoint:
if
self
.
use_ptuning_v2
:
try
:
prefix_state_dict
=
torch
.
load
(
Path
(
f
'{
self.ptuning_dir
}/pytorch_model.bin'
))
prefix_state_dict
=
torch
.
load
(
Path
(
f
'{
os.path.abspath(self.ptuning_dir)
}/pytorch_model.bin'
))
new_prefix_state_dict
=
{}
for
k
,
v
in
prefix_state_dict
.
items
():
if
k
.
startswith
(
"transformer.prefix_encoder."
):
new_prefix_state_dict
[
k
[
len
(
"transformer.prefix_encoder."
):]]
=
v
self
.
model
.
transformer
.
prefix_encoder
.
load_state_dict
(
new_prefix_state_dict
)
self
.
model
.
transformer
.
prefix_encoder
.
float
()
print
(
"加载ptuning检查点成功!"
)
except
Exception
as
e
:
print
(
e
)
print
(
"加载PrefixEncoder模型参数失败"
)
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论