Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
J
jinchat-server
概览
概览
详情
活动
周期分析
版本库
存储库
文件
提交
分支
标签
贡献者
分支图
比较
统计图
问题
0
议题
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
代码片段
成员
成员
折叠边栏
关闭边栏
活动
图像
聊天
创建新问题
作业
提交
问题看板
Open sidebar
aigc-pioneer
jinchat-server
Commits
acee2d5a
Unverified
提交
acee2d5a
authored
7月 21, 2023
作者:
Zhi-guo Huang
提交者:
GitHub
7月 21, 2023
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #905 from chinainfant/dev
解决加载ptuning检查点失败的问题
上级
7d37dc87
c1c2ed19
隐藏空白字符变更
内嵌
并排
正在显示
2 个修改的文件
包含
4 行增加
和
3 行删除
+4
-3
args.py
models/loader/args.py
+1
-1
loader.py
models/loader/loader.py
+3
-2
没有找到文件。
models/loader/args.py
浏览文件 @
acee2d5a
...
...
@@ -44,7 +44,7 @@ parser.add_argument('--no-remote-model', action='store_true', help='remote in th
parser
.
add_argument
(
'--model-name'
,
type
=
str
,
default
=
LLM_MODEL
,
help
=
'Name of the model to load by default.'
)
parser
.
add_argument
(
'--lora'
,
type
=
str
,
help
=
'Name of the LoRA to apply to the model by default.'
)
parser
.
add_argument
(
"--lora-dir"
,
type
=
str
,
default
=
LORA_DIR
,
help
=
"Path to directory with all the loras"
)
parser
.
add_argument
(
'--use-ptuning-v2'
,
type
=
str
,
default
=
USE_PTUNING_V2
,
help
=
"whether use ptuning-v2 checkpoint"
)
parser
.
add_argument
(
'--use-ptuning-v2'
,
action
=
'store_true'
,
help
=
"whether use ptuning-v2 checkpoint"
)
parser
.
add_argument
(
"--ptuning-dir"
,
type
=
str
,
default
=
PTUNING_DIR
,
help
=
"the dir of ptuning-v2 checkpoint"
)
# Accelerate/transformers
parser
.
add_argument
(
'--load-in-8bit'
,
action
=
'store_true'
,
default
=
LOAD_IN_8BIT
,
...
...
models/loader/loader.py
浏览文件 @
acee2d5a
...
...
@@ -441,7 +441,7 @@ class LoaderCheckPoint:
if
self
.
use_ptuning_v2
:
try
:
prefix_encoder_file
=
open
(
Path
(
f
'{
self.ptuning_dir
}/config.json'
),
'r'
)
prefix_encoder_file
=
open
(
Path
(
f
'{
os.path.abspath(self.ptuning_dir)
}/config.json'
),
'r'
)
prefix_encoder_config
=
json
.
loads
(
prefix_encoder_file
.
read
())
prefix_encoder_file
.
close
()
self
.
model_config
.
pre_seq_len
=
prefix_encoder_config
[
'pre_seq_len'
]
...
...
@@ -457,13 +457,14 @@ class LoaderCheckPoint:
if
self
.
use_ptuning_v2
:
try
:
prefix_state_dict
=
torch
.
load
(
Path
(
f
'{
self.ptuning_dir
}/pytorch_model.bin'
))
prefix_state_dict
=
torch
.
load
(
Path
(
f
'{
os.path.abspath(self.ptuning_dir)
}/pytorch_model.bin'
))
new_prefix_state_dict
=
{}
for
k
,
v
in
prefix_state_dict
.
items
():
if
k
.
startswith
(
"transformer.prefix_encoder."
):
new_prefix_state_dict
[
k
[
len
(
"transformer.prefix_encoder."
):]]
=
v
self
.
model
.
transformer
.
prefix_encoder
.
load_state_dict
(
new_prefix_state_dict
)
self
.
model
.
transformer
.
prefix_encoder
.
float
()
print
(
"加载ptuning检查点成功!"
)
except
Exception
as
e
:
print
(
e
)
print
(
"加载PrefixEncoder模型参数失败"
)
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论