[INFER][LLM] Support qwen in fined grained dybatch v1 #7644

DanGuge · 2023-12-13T11:35:17Z

PR types

PR changes

Description

可以通过以下命令执行动态图推理

python predictor.py \
    --model_name_or_path "qwen/qwen-7b" \
    --inference_model \
    --dtype "float16"

paddle-bot · 2023-12-13T11:35:23Z

Thanks for your contribution!

codecov · 2023-12-13T12:17:06Z

Codecov Report

Attention: 213 lines in your changes are missing coverage. Please review.

Comparison is base (b02c716) 57.48% compared to head (4d478e8) 57.12%.
Report is 56 commits behind head on develop.

Files	Patch %	Lines
...ddlenlp/experimental/transformers/qwen/modeling.py	0.00%	211 Missing ⚠️
paddlenlp/experimental/transformers/__init__.py	0.00%	1 Missing ⚠️
...ddlenlp/experimental/transformers/qwen/__init__.py	0.00%	1 Missing ⚠️

Additional details and impacted files

@@             Coverage Diff             @@
##           develop    #7644      +/-   ##
===========================================
- Coverage    57.48%   57.12%   -0.37%     
===========================================
  Files          583      587       +4     
  Lines        87187    88190    +1003     
===========================================
+ Hits         50123    50376     +253     
- Misses       37064    37814     +750

☔ View full report in Codecov by Sentry.
📢 Have feedback on the report? Share it here.

wj-Mcat · 2023-12-28T08:53:55Z

从 PaddleNLP-CI 的日志中看来是精度没有对齐

DanGuge · 2023-12-28T09:18:57Z

从 PaddleNLP-CI 的日志中看来是精度没有对齐

https://github.com/PaddlePaddle/PaddleNLP/blob/develop/tests/llm/test_predictor.py#L71
此处的full_match是要求完全一致吗？我自己测试在小数点后几位是有区别的

DanGuge · 2024-01-06T08:31:21Z

qwen的非inference_model实现，在多batch推理时精度存在问题
运行目录：PaddleNLP/llm

qwen 推理

batch_size = 1

#!/bin/bash

python3 predictor.py \
    --model_name_or_path qwen/qwen-7b \
    --decode_strategy greedy_search \
    --batch_size 1 \
    --dtype float16

batch_size = 2

#!/bin/bash

python3 predictor.py \
    --model_name_or_path qwen/qwen-7b \
    --decode_strategy greedy_search \
    --batch_size 2 \
    --dtype float16

qwen inference model 推理

batch_size = 1

#!/bin/bash

python3 predictor.py \
    --model_name_or_path qwen/qwen-7b \
    --decode_strategy greedy_search \
    --batch_size 1 \
    --inference_model \
    --dtype float16

batch_size = 2

#!/bin/bash

python3 predictor.py \
    --model_name_or_path qwen/qwen-7b \
    --decode_strategy greedy_search \
    --batch_size 2 \
    --inference_model \
    --dtype float16

cc @wj-Mcat

wj-Mcat

LGTM

wawltor

LGTM

paddle-bot bot added the contributor label Dec 13, 2023

DanGuge added 16 commits December 20, 2023 22:04

init qwen inference model

a9d7c0f

fix name

3258b63

fix hidden dim

b8d715f

fix dtype

7448c07

fix length

2aeb294

fix attention_mask

9de1e79

fix up & gate dtype bug

c6a9aa6

fix ffn1 weight

69e9b04

modify codes

568954e

remote unused variable

1e826ad

remove unused code

c2d9653

add qwen weight only

a9d0149

format with black

2d184ba

format with isort

cb45b36

fix dtype

17793d0

add qwen inference model in static graph

87caabd

DanGuge force-pushed the qwen/inference_model branch from 9e07b6d to 87caabd Compare December 20, 2023 14:21

DanGuge added 2 commits December 26, 2023 12:33

add qwen unittest

a6e36d3

format with black

622b6b0

print log

f234141

ZHUI changed the title ~~[llm]support qwen in fined grained dybatch v1~~ [INFER][LLM] Support qwen in fined grained dybatch v1 Jan 2, 2024

ZHUI added the inference label Jan 2, 2024

remove print

724756b

set safetensors usage False

64731e4

DanGuge added 2 commits January 8, 2024 10:58

remove tests

2429b08

Empty-Commit

4d478e8

wj-Mcat approved these changes Jan 8, 2024

View reviewed changes

wawltor approved these changes Jan 9, 2024

View reviewed changes

wawltor merged commit 37b4fe0 into PaddlePaddle:develop Jan 9, 2024
7 of 9 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[INFER][LLM] Support qwen in fined grained dybatch v1 #7644

[INFER][LLM] Support qwen in fined grained dybatch v1 #7644

DanGuge commented Dec 13, 2023

paddle-bot bot commented Dec 13, 2023

codecov bot commented Dec 13, 2023 •

edited

Loading

wj-Mcat commented Dec 28, 2023

DanGuge commented Dec 28, 2023

DanGuge commented Jan 6, 2024

wj-Mcat left a comment

wawltor left a comment

[INFER][LLM] Support qwen in fined grained dybatch v1 #7644

[INFER][LLM] Support qwen in fined grained dybatch v1 #7644

Conversation

DanGuge commented Dec 13, 2023

PR types

PR changes

Description

paddle-bot bot commented Dec 13, 2023

codecov bot commented Dec 13, 2023 • edited Loading

Codecov Report

wj-Mcat commented Dec 28, 2023

DanGuge commented Dec 28, 2023

DanGuge commented Jan 6, 2024

qwen 推理

qwen inference model 推理

wj-Mcat left a comment

Choose a reason for hiding this comment

wawltor left a comment

Choose a reason for hiding this comment

codecov bot commented Dec 13, 2023 •

edited

Loading