Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
J
jinchat-server
概览
概览
详情
活动
周期分析
版本库
存储库
文件
提交
分支
标签
贡献者
分支图
比较
统计图
问题
0
议题
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
代码片段
成员
成员
折叠边栏
关闭边栏
活动
图像
聊天
创建新问题
作业
提交
问题看板
Open sidebar
aigc-pioneer
jinchat-server
Commits
5524c476
Unverified
提交
5524c476
authored
5月 19, 2023
作者:
glide-the
提交者:
GitHub
5月 19, 2023
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Update moss_llm.py
上级
7c749332
显示空白字符变更
内嵌
并排
正在显示
1 个修改的文件
包含
12 行增加
和
1 行删除
+12
-1
moss_llm.py
models/moss_llm.py
+12
-1
没有找到文件。
models/moss_llm.py
浏览文件 @
5524c476
...
@@ -58,6 +58,11 @@ class MOSSLLM(BaseAnswer, LLM, ABC):
...
@@ -58,6 +58,11 @@ class MOSSLLM(BaseAnswer, LLM, ABC):
history
:
List
[
List
[
str
]]
=
[],
history
:
List
[
List
[
str
]]
=
[],
streaming
:
bool
=
False
,
streaming
:
bool
=
False
,
generate_with_callback
:
AnswerResultStream
=
None
)
->
None
:
generate_with_callback
:
AnswerResultStream
=
None
)
->
None
:
# Create the StoppingCriteriaList with the stopping strings
stopping_criteria_list
=
transformers
.
StoppingCriteriaList
()
# 定义模型stopping_criteria 队列,在每次响应时将 torch.LongTensor, torch.FloatTensor同步到AnswerResult
listenerQueue
=
AnswerResultQueueSentinelTokenListenerQueue
()
stopping_criteria_list
.
append
(
listenerQueue
)
if
len
(
history
)
>
0
:
if
len
(
history
)
>
0
:
history
=
history
[
-
self
.
history_len
:
-
1
]
if
self
.
history_len
>
0
else
[]
history
=
history
[
-
self
.
history_len
:
-
1
]
if
self
.
history_len
>
0
else
[]
prompt_w_history
=
str
(
history
)
prompt_w_history
=
str
(
history
)
...
@@ -83,6 +88,12 @@ class MOSSLLM(BaseAnswer, LLM, ABC):
...
@@ -83,6 +88,12 @@ class MOSSLLM(BaseAnswer, LLM, ABC):
response
=
self
.
tokenizer
.
decode
(
outputs
[
0
][
inputs
.
input_ids
.
shape
[
1
]:],
skip_special_tokens
=
True
)
response
=
self
.
tokenizer
.
decode
(
outputs
[
0
][
inputs
.
input_ids
.
shape
[
1
]:],
skip_special_tokens
=
True
)
self
.
checkPoint
.
clear_torch_cache
()
self
.
checkPoint
.
clear_torch_cache
()
history
+=
[[
prompt
,
response
]]
history
+=
[[
prompt
,
response
]]
yield
response
,
history
answer_result
=
AnswerResult
()
answer_result
.
history
=
history
answer_result
.
llm_output
=
{
"answer"
:
response
}
if
listenerQueue
.
listenerQueue
.
__len__
()
>
0
:
answer_result
.
listenerToken
=
listenerQueue
.
listenerQueue
.
pop
()
generate_with_callback
(
answer_result
)
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论