Error: Module 'gguf' has no attribute 'TENSOR_NAMES' #3496

DimmNet · 2023-10-06T06:55:34Z

While converting the model I get the following error: AttributeError: module 'gguf' has no attribute 'TENSOR_NAMES'

The source model used for the conversion:
https://huggingface.co/flozi00/Llama-2-7b-german-assistant-v3

Conversion start command:
!python3 /content/convert.py /content/new_model --outfile /content/llama-2-7b-custom_q8.gguf --outtype q8_0

Server: Google colab

Execution result:
Loading model file /content/new_model/ Loading model file /content/new_model/ Loading model file /content/new_model/ params = Params(n_vocab=32000, Loading vocab file '/content/new_model Permuting layer 0
Permuting layer 1
Permuting layer 2
Permuting layer 3
Permuting layer 4
Permuting layer 5
Permuting layer 6
Permuting layer 7
Permuting layer 8
Permuting layer 9
Permuting layer 10
Permuting layer 11
Permuting layer 12
Permuting layer 13
Permuting layer 14
Permuting layer 15
Permuting layer 16
Permuting layer 17
Permuting layer 18
Permuting layer 19
Permuting layer 20
Permuting layer 21
Permuting layer 22
Permuting layer 23
Permuting layer 24
Permuting layer 25
Permuting layer 26
Permuting layer 27
Permuting layer 28
Permuting layer 29
Permuting layer 30
Permuting layer 31
model.embed_tokens.weight model.layers.0.input_layernorm.weight model.layers.0.mlp.down_proj.weight model.layers.0.mlp.gate_proj.weight model.layers.0.mlp.up_proj.weight model.layers.0.post_attention_layernorm.weight model.layers.0.self_attn.k_proj.weight model.layers.0.self_attn.o_proj.weight model.layers.0.self_attn.q_proj.weight skipping tensor blk.0.attn_rot_embd
model.layers.0.self_attn.v_proj.weight model.layers.1.input_layernorm.weight model.layers.1.mlp.down_proj.weight model.layers.1.mlp.gate_proj.weight model.layers.1.mlp.up_proj.weight model.layers.1.post_attention_layernorm.weight model.layers.1.self_attn.k_proj.weight model.layers.1.self_attn.o_proj.weight model.layers.1.self_attn.q_proj.weight skipping tensor blk.1.attn_rot_embd
model.layers.1.self_attn.v_proj.weight model.layers.10.input_layernorm.weight model.layers.10.mlp.down_proj.weight model.layers.10.mlp.gate_proj.weight model.layers.10.mlp.up_proj.weight model.layers.10.post_attention_layernorm.weight model.layers.10.self_attn.k_proj.weight model.layers.10.self_attn.o_proj.weight model.layers.10.self_attn.q_proj.weight skipping tensor blk.10.attn_rot_embd model.layers.2.self_attn.v_proj.weight model.layers.20.input_layernorm.weight model.layers.20.mlp.down_proj.weight model.layers.20.mlp.gate_proj.weight model.layers.20.mlp.up_proj.weight model.layers.20.post_attention_layernorm.weight model.layers.20.self_attn.k_proj.weight model.layers.20.self_attn.o_proj.weight model.layers.20.self_attn.q_proj.weight skipping tensor blk.20.attn_rot_embd model.layers.3.self_attn.v_proj.weight model.layers.4.input_layernorm.weight model.layers.4.mlp.down_proj.weight model.layers.4.mlp.gate_proj.weight model.layers.4.mlp.up_proj.weight model.layers.4.post_attention_layernorm.weight model.layers.4.self_attn.k_proj.weight model.layers.4.self_attn.o_proj.weight model.layers.4.self_attn.q_proj.weight skipping tensor blk.4.attn_rot_embd
model.layers.4.self_attn.v_proj.weight model.layers.5.input_layernorm.weight model.layers.5.mlp.down_proj.weight model.layers.5.mlp.gate_proj.weight model.layers.5.mlp.up_proj.weight model.layers.5.post_attention_layernorm.weight model.layers.5.self_attn.k_proj.weight model.layers.5.self_attn.o_proj.weight model.layers.5.self_attn.q_proj.weight skipping tensor blk.5.attn_rot_embd
model.layers.5.self_attn.v_proj.weight model.layers.6.input_layernorm.weight model.layers.6.mlp.down_proj.weight model.layers.6.mlp.gate_proj.weight model.layers.6.mlp.up_proj.weight model.layers.6.post_attention_layernorm.weight model.layers.6.self_attn.k_proj.weight model.layers.6.self_attn.o_proj.weight model.layers.6.self_attn.q_proj.weight skipping tensor blk.6.attn_rot_embd
model.layers.6.self_attn.v_proj.weight model.layers.7.input_layernorm.weight model.layers.7.mlp.down_proj.weight model.layers.7.mlp.gate_proj.weight model.layers.7.mlp.up_proj.weight model.layers.7.post_attention_layernorm.weight model.layers.7.self_attn.k_proj.weight model.layers.7.self_attn.o_proj.weight model.layers.7.self_attn.q_proj.weight skipping tensor blk.7.attn_rot_embd
model.layers.7.self_attn.v_proj.weight model.layers.8.input_layernorm.weight model.layers.8.mlp.down_proj.weight model.layers.8.mlp.gate_proj.weight model.layers.8.mlp.up_proj.weight model.layers.8.post_attention_layernorm.weight model.layers.8.self_attn.k_proj.weight model.layers.8.self_attn.o_proj.weight model.layers.8.self_attn.q_proj.weight skipping tensor blk.8.attn_rot_embd
model.layers.8.self_attn.v_proj.weight model.layers.9.input_layernorm.weight model.layers.9.mlp.down_proj.weight model.layers.9.mlp.gate_proj.weight model.layers.9.mlp.up_proj.weight model.layers.9.post_attention_layernorm.weight model.layers.9.self_attn.k_proj.weight model.layers.9.self_attn.o_proj.weight model.layers.9.self_attn.q_proj.weight skipping tensor blk.9.attn_rot_embd
model.layers.9.self_attn.v_proj.weight lm_head.weight model.layers.24.input_layernorm.weight model.layers.24.mlp.down_proj.weight model.layers.24.mlp.gate_proj.weight model.layers.24.mlp.up_proj.weight model.layers.24.post_attention_layernorm.weight model.layers.24.self_attn.k_proj.weight model.layers.24.self_attn.o_proj.weight model.layers.24.self_attn.q_proj.weight skipping tensor blk.24.attn_rot_embd File "/content/convert.py", line main()
File "/content/convert.py", line ftype = pick_output_type(model, File "/content/convert.py", line wq_type = model[gguf.TENSOR_NAMES[gguf AttributeError: module 'gguf' model-00001-of-00002.safetensors
model-00001-of-00002.safetensors
model-00002-of-00002.safetensors
n_embd=4096, n_layer=32, n_ctx=4096, n_ff=11008, n_head=32, n_head_kv=32, f_norm_eps=1e-06, f_rope_freq_base=None, f_rope_scale=None, ftype=<GGMLFileType.MostlyF16: 1>, path_model=PosixPath('/content/new_model'))
/tokenizer.model', type 'spm'
-> token_embd.weight | F16 | [32000, 4096]
-> blk.0.attn_norm.weight | F16 | [4096]
-> blk.0.ffn_down.weight | F16 | [4096, 11008]
-> blk.0.ffn_gate.weight | F16 | [11008, 4096]
-> blk.0.ffn_up.weight | F16 | [11008, 4096]
-> blk.0.ffn_norm.weight | F16 | [4096]
-> blk.0.attn_k.weight | F16 | [4096, 4096]
-> blk.0.attn_output.weight | F16 | [4096, 4096]
-> blk.0.attn_q.weight | F16 | [4096, 4096]
-> blk.0.attn_v.weight | F16 | [4096, 4096]
-> blk.1.attn_norm.weight | F16 | [4096]
-> blk.1.ffn_down.weight | F16 | [4096, 11008]
-> blk.1.ffn_gate.weight | F16 | [11008, 4096]
-> blk.1.ffn_up.weight | F16 | [11008, 4096]
-> blk.1.ffn_norm.weight | F16 | [4096]
-> blk.1.attn_k.weight | F16 | [4096, 4096]
-> blk.1.attn_output.weight | F16 | [4096, 4096]
-> blk.1.attn_q.weight | F16 | [4096, 4096]
-> blk.1.attn_v.weight | F16 | [4096, 4096]
-> blk.10.attn_norm.weight | F16 | [4096]
-> blk.10.ffn_down.weight | F16 | [4096, 11008]
-> blk.10.ffn_gate.weight | F16 | [11008, 4096]
-> blk.10.ffn_up.weight | F16 | [11008, 4096]
-> blk.10.ffn_norm.weight | F16 | [4096]
-> blk.10.attn_k.weight | F16 | [4096, 4096]
-> blk.10.attn_output.weight | F16 | [4096, 4096]
-> blk.10.attn_q.weight | F16 | [4096, 4096]
r> -> blk.10.attn_v.weight | F16 | [4096, 4096]
-> blk.11.attn_norm.weight | F16 | [4096]
-> blk.11.ffn_down.weight | F16 | [4096, 11008]
-> blk.11.ffn_gate.weight | F16 | [11008, 4096]
-> blk.11.ffn_up.weight | F16 | [11008, 4096]
-> blk.11.ffn_norm.weight | F16 | [4096]
-> blk.11.attn_k.weight | F16 | [4096, 4096]
-> blk.11.attn_output.weight | F16 | [4096, 4096]
-> blk.11.attn_q.weight | F16 | [4096, 4096]
r> -> blk.11.attn_v.weight | F16 | [4096, 4096]
-> blk.12.attn_norm.weight | F16 | [4096]
-> blk.12.ffn_down.weight | F16 | [4096, 11008]
-> blk.12.ffn_gate.weight | F16 | [11008, 4096]
-> blk.12.ffn_up.weight | F16 | [11008, 4096]
-> blk.12.ffn_norm.weight | F16 | [4096]
-> blk.12.attn_k.weight | F16 | [4096, 4096]
-> blk.12.attn_output.weight | F16 | [4096, 4096]
-> blk.12.attn_q.weight | F16 | [4096, 4096]
r> -> blk.12.attn_v.weight | F16 | [4096, 4096]
-> blk.13.attn_norm.weight | F16 | [4096]
-> blk.13.ffn_down.weight | F16 | [4096, 11008]
-> blk.13.ffn_gate.weight | F16 | [11008, 4096]
-> blk.13.ffn_up.weight | F16 | [11008, 4096]
-> blk.13.ffn_norm.weight | F16 | [4096]
-> blk.13.attn_k.weight | F16 | [4096, 4096]
-> blk.13.attn_output.weight | F16 | [4096, 4096]
-> blk.13.attn_q.weight | F16 | [4096, 4096]
r> -> blk.13.attn_v.weight | F16 | [4096, 4096]
-> blk.14.attn_norm.weight | F16 | [4096]
-> blk.14.ffn_down.weight | F16 | [4096, 11008]
-> blk.14.ffn_gate.weight | F16 | [11008, 4096]
-> blk.14.ffn_up.weight | F16 | [11008, 4096]
-> blk.14.ffn_norm.weight | F16 | [4096]
-> blk.14.attn_k.weight | F16 | [4096, 4096]
-> blk.14.attn_output.weight | F16 | [4096, 4096]
-> blk.14.attn_q.weight | F16 | [4096, 4096]
r> -> blk.14.attn_v.weight | F16 | [4096, 4096]
-> blk.15.attn_norm.weight | F16 | [4096]
-> blk.15.ffn_down.weight | F16 | [4096, 11008]
-> blk.15.ffn_gate.weight | F16 | [11008, 4096]
-> blk.15.ffn_up.weight | F16 | [11008, 4096]
-> blk.15.ffn_norm.weight | F16 | [4096]
-> blk.15.attn_k.weight | F16 | [4096, 4096]
-> blk.15.attn_output.weight | F16 | [4096, 4096]
-> blk.15.attn_q.weight | F16 | [4096, 4096]
r> -> blk.15.attn_v.weight | F16 | [4096, 4096]
-> blk.16.attn_norm.weight | F16 | [4096]
-> blk.16.ffn_down.weight | F16 | [4096, 11008]
-> blk.16.ffn_gate.weight | F16 | [11008, 4096]
-> blk.16.ffn_up.weight | F16 | [11008, 4096]
-> blk.16.ffn_norm.weight | F16 | [4096]
-> blk.16.attn_k.weight | F16 | [4096, 4096]
-> blk.16.attn_output.weight | F16 | [4096, 4096]
-> blk.16.attn_q.weight | F16 | [4096, 4096]
r> -> blk.16.attn_v.weight | F16 | [4096, 4096]
-> blk.17.attn_norm.weight | F16 | [4096]
-> blk.17.ffn_down.weight | F16 | [4096, 11008]
-> blk.17.ffn_gate.weight | F16 | [11008, 4096]
-> blk.17.ffn_up.weight | F16 | [11008, 4096]
-> blk.17.ffn_norm.weight | F16 | [4096]
-> blk.17.attn_k.weight | F16 | [4096, 4096]
-> blk.17.attn_output.weight | F16 | [4096, 4096]
-> blk.17.attn_q.weight | F16 | [4096, 4096]
r> -> blk.17.attn_v.weight | F16 | [4096, 4096]
-> blk.18.attn_norm.weight | F16 | [4096]
-> blk.18.ffn_down.weight | F16 | [4096, 11008]
-> blk.18.ffn_gate.weight | F16 | [11008, 4096]
-> blk.18.ffn_up.weight | F16 | [11008, 4096]
-> blk.18.ffn_norm.weight | F16 | [4096]
-> blk.18.attn_k.weight | F16 | [4096, 4096]
-> blk.18.attn_output.weight | F16 | [4096, 4096]
-> blk.18.attn_q.weight | F16 | [4096, 4096]
r> -> blk.18.attn_v.weight | F16 | [4096, 4096]
-> blk.19.attn_norm.weight | F16 | [4096]
-> blk.19.ffn_down.weight | F16 | [4096, 11008]
-> blk.19.ffn_gate.weight | F16 | [11008, 4096]
-> blk.19.ffn_up.weight | F16 | [11008, 4096]
-> blk.19.ffn_norm.weight | F16 | [4096]
-> blk.19.attn_k.weight | F16 | [4096, 4096]
-> blk.19.attn_output.weight | F16 | [4096, 4096]
-> blk.19.attn_q.weight | F16 | [4096, 4096]
r> -> blk.19.attn_v.weight | F16 | [4096, 4096]
-> blk.2.attn_norm.weight | F16 | [4096]
-> blk.2.ffn_down.weight | F16 | [4096, 11008]
-> blk.2.ffn_gate.weight | F16 | [11008, 4096]
-> blk.2.ffn_up.weight | F16 | [11008, 4096]
-> blk.2.ffn_norm.weight | F16 | [4096]
-> blk.2.attn_k.weight | F16 | [4096, 4096]
-> blk.2.attn_output.weight | F16 | [4096, 4096]
-> blk.2.attn_q.weight | F16 | [4096, 4096]
-> blk.2.attn_v.weight | F16 | [4096, 4096]
-> blk.20.attn_norm.weight | F16 | [4096]
-> blk.20.ffn_down.weight | F16 | [4096, 11008]
-> blk.20.ffn_gate.weight | F16 | [11008, 4096]
-> blk.20.ffn_up.weight | F16 | [11008, 4096]
-> blk.20.ffn_norm.weight | F16 | [4096]
-> blk.20.attn_k.weight | F16 | [4096, 4096]
-> blk.20.attn_output.weight | F16 | [4096, 4096]
-> blk.20.attn_q.weight | F16 | [4096, 4096]
r> -> blk.20.attn_v.weight | F16 | [4096, 4096]
-> blk.21.attn_norm.weight | F16 | [4096]
-> blk.21.ffn_down.weight | F16 | [4096, 11008]
-> blk.21.ffn_gate.weight | F16 | [11008, 4096]
-> blk.21.ffn_up.weight | F16 | [11008, 4096]
-> blk.21.ffn_norm.weight | F16 | [4096]
-> blk.21.attn_k.weight | F16 | [4096, 4096]
-> blk.21.attn_output.weight | F16 | [4096, 4096]
-> blk.21.attn_q.weight | F16 | [4096, 4096]
r> -> blk.21.attn_v.weight | F16 | [4096, 4096]
-> blk.22.attn_norm.weight | F16 | [4096]
-> blk.22.ffn_down.weight | F16 | [4096, 11008]
-> blk.22.ffn_gate.weight | F16 | [11008, 4096]
-> blk.22.ffn_up.weight | F16 | [11008, 4096]
-> blk.22.ffn_norm.weight | F16 | [4096]
-> blk.22.attn_k.weight | F16 | [4096, 4096]
-> blk.22.attn_output.weight | F16 | [4096, 4096]
-> blk.22.attn_q.weight | F16 | [4096, 4096]
r> -> blk.22.attn_v.weight | F16 | [4096, 4096]
-> blk.23.attn_norm.weight | F16 | [4096]
-> blk.23.ffn_down.weight | F16 | [4096, 11008]
-> blk.23.ffn_gate.weight | F16 | [11008, 4096]
-> blk.23.ffn_up.weight | F16 | [11008, 4096]
-> blk.23.ffn_norm.weight | F16 | [4096]
-> blk.23.attn_k.weight | F16 | [4096, 4096]
-> blk.23.attn_output.weight | F16 | [4096, 4096]
-> blk.23.attn_q.weight | F16 | [4096, 4096]
r> -> blk.23.attn_v.weight | F16 | [4096, 4096]
-> blk.3.attn_norm.weight | F16 | [4096]
-> blk.3.ffn_down.weight | F16 | [4096, 11008]
-> blk.3.ffn_gate.weight | F16 | [11008, 4096]
-> blk.3.ffn_up.weight | F16 | [11008, 4096]
-> blk.3.ffn_norm.weight | F16 | [4096]
-> blk.3.attn_k.weight | F16 | [4096, 4096]
-> blk.3.attn_output.weight | F16 | [4096, 4096]
-> blk.3.attn_q.weight | F16 | [4096, 4096]
-> blk.3.attn_v.weight | F16 | [4096, 4096]
-> blk.4.attn_norm.weight | F16 | [4096]
-> blk.4.ffn_down.weight | F16 | [4096, 11008]
-> blk.4.ffn_gate.weight | F16 | [11008, 4096]
-> blk.4.ffn_up.weight | F16 | [11008, 4096]
-> blk.4.ffn_norm.weight | F16 | [4096]
-> blk.4.attn_k.weight | F16 | [4096, 4096]
-> blk.4.attn_output.weight | F16 | [4096, 4096]
-> blk.4.attn_q.weight | F16 | [4096, 4096]
-> blk.4.attn_v.weight | F16 | [4096, 4096]
-> blk.5.attn_norm.weight | F16 | [4096]
-> blk.5.ffn_down.weight | F16 | [4096, 11008]
-> blk.5.ffn_gate.weight | F16 | [11008, 4096]
-> blk.5.ffn_up.weight | F16 | [11008, 4096]
-> blk.5.ffn_norm.weight | F16 | [4096]
-> blk.5.attn_k.weight | F16 | [4096, 4096]
-> blk.5.attn_output.weight | F16 | [4096, 4096]
-> blk.5.attn_q.weight | F16 | [4096, 4096]
-> blk.5.attn_v.weight | F16 | [4096, 4096]
-> blk.6.attn_norm.weight | F16 | [4096]
-> blk.6.ffn_down.weight | F16 | [4096, 11008]
-> blk.6.ffn_gate.weight | F16 | [11008, 4096]
-> blk.6.ffn_up.weight | F16 | [11008, 4096]
-> blk.6.ffn_norm.weight | F16 | [4096]
-> blk.6.attn_k.weight | F16 | [4096, 4096]
-> blk.6.attn_output.weight | F16 | [4096, 4096]
-> blk.6.attn_q.weight | F16 | [4096, 4096]
-> blk.6.attn_v.weight | F16 | [4096, 4096]
-> blk.7.attn_norm.weight | F16 | [4096]
-> blk.7.ffn_down.weight | F16 | [4096, 11008]
-> blk.7.ffn_gate.weight | F16 | [11008, 4096]
-> blk.7.ffn_up.weight | F16 | [11008, 4096]
-> blk.7.ffn_norm.weight | F16 | [4096]
-> blk.7.attn_k.weight | F16 | [4096, 4096]
-> blk.7.attn_output.weight | F16 | [4096, 4096]
-> blk.7.attn_q.weight | F16 | [4096, 4096]
-> blk.7.attn_v.weight | F16 | [4096, 4096]
-> blk.8.attn_norm.weight | F16 | [4096]
-> blk.8.ffn_down.weight | F16 | [4096, 11008]
-> blk.8.ffn_gate.weight | F16 | [11008, 4096]
-> blk.8.ffn_up.weight | F16 | [11008, 4096]
-> blk.8.ffn_norm.weight | F16 | [4096]
-> blk.8.attn_k.weight | F16 | [4096, 4096]
-> blk.8.attn_output.weight | F16 | [4096, 4096]
-> blk.8.attn_q.weight | F16 | [4096, 4096]
-> blk.8.attn_v.weight | F16 | [4096, 4096]
-> blk.9.attn_norm.weight | F16 | [4096]
-> blk.9.ffn_down.weight | F16 | [4096, 11008]
-> blk.9.ffn_gate.weight | F16 | [11008, 4096]
-> blk.9.ffn_up.weight | F16 | [11008, 4096]
-> blk.9.ffn_norm.weight | F16 | [4096]
-> blk.9.attn_k.weight | F16 | [4096, 4096]
-> blk.9.attn_output.weight | F16 | [4096, 4096]
-> blk.9.attn_q.weight | F16 | [4096, 4096]
-> blk.9.attn_v.weight | F16 | [4096, 4096]
-> output.weight | F16 | [32000, 4096]
-> blk.24.attn_norm.weight | F16 | [4096]
-> blk.24.ffn_down.weight | F16 | [4096, 11008]
-> blk.24.ffn_gate.weight | F16 | [11008, 4096]
-> blk.24.ffn_up.weight | F16 | [11008, 4096]
-> blk.24.ffn_norm.weight | F16 | [4096]
-> blk.24.attn_k.weight | F16 | [4096, 4096]
-> blk.24.attn_output.weight | F16 | [4096, 4096]
-> blk.24.attn_q.weight | F16 | [4096, 4096]
r> -> blk.24.attn_v.weight | F16 | [4096, 4096]
-> blk.25.attn_norm.weight | F16 | [4096]
-> blk.25.ffn_down.weight | F16 | [4096, 11008]
-> blk.25.ffn_gate.weight | F16 | [11008, 4096]
-> blk.25.ffn_up.weight | F16 | [11008, 4096]
-> blk.25.ffn_norm.weight | F16 | [4096]
-> blk.25.attn_k.weight | F16 | [4096, 4096]
-> blk.25.attn_output.weight | F16 | [4096, 4096]
-> blk.25.attn_q.weight | F16 | [4096, 4096]
r> -> blk.25.attn_v.weight | F16 | [4096, 4096]
-> blk.26.attn_norm.weight | F16 | [4096]
-> blk.26.ffn_down.weight | F16 | [4096, 11008]
-> blk.26.ffn_gate.weight | F16 | [11008, 4096]
-> blk.26.ffn_up.weight | F16 | [11008, 4096]
-> blk.26.ffn_norm.weight | F16 | [4096]
-> blk.26.attn_k.weight | F16 | [4096, 4096]
-> blk.26.attn_output.weight | F16 | [4096, 4096]
-> blk.26.attn_q.weight | F16 | [4096, 4096]
r> -> blk.26.attn_v.weight | F16 | [4096, 4096]
-> blk.27.attn_norm.weight | F16 | [4096]
-> blk.27.ffn_down.weight | F16 | [4096, 11008]
-> blk.27.ffn_gate.weight | F16 | [11008, 4096]
-> blk.27.ffn_up.weight | F16 | [11008, 4096]
-> blk.27.ffn_norm.weight | F16 | [4096]
-> blk.27.attn_k.weight | F16 | [4096, 4096]
-> blk.27.attn_output.weight | F16 | [4096, 4096]
-> blk.27.attn_q.weight | F16 | [4096, 4096]
r> -> blk.27.attn_v.weight | F16 | [4096, 4096]
-> blk.28.attn_norm.weight | F16 | [4096]
-> blk.28.ffn_down.weight | F16 | [4096, 11008]
-> blk.28.ffn_gate.weight | F16 | [11008, 4096]
-> blk.28.ffn_up.weight | F16 | [11008, 4096]
-> blk.28.ffn_norm.weight | F16 | [4096]
-> blk.28.attn_k.weight | F16 | [4096, 4096]
-> blk.28.attn_output.weight | F16 | [4096, 4096]
-> blk.28.attn_q.weight | F16 | [4096, 4096]
r> -> blk.28.attn_v.weight | F16 | [4096, 4096]
-> blk.29.attn_norm.weight | F16 | [4096]
-> blk.29.ffn_down.weight | F16 | [4096, 11008]
-> blk.29.ffn_gate.weight | F16 | [11008, 4096]
-> blk.29.ffn_up.weight | F16 | [11008, 4096]
-> blk.29.ffn_norm.weight | F16 | [4096]
-> blk.29.attn_k.weight | F16 | [4096, 4096]
-> blk.29.attn_output.weight | F16 | [4096, 4096]
-> blk.29.attn_q.weight | F16 | [4096, 4096]
r> -> blk.29.attn_v.weight | F16 | [4096, 4096]
-> blk.30.attn_norm.weight | F16 | [4096]
-> blk.30.ffn_down.weight | F16 | [4096, 11008]
-> blk.30.ffn_gate.weight | F16 | [11008, 4096]
-> blk.30.ffn_up.weight | F16 | [11008, 4096]
-> blk.30.ffn_norm.weight | F16 | [4096]
-> blk.30.attn_k.weight | F16 | [4096, 4096]
-> blk.30.attn_output.weight | F16 | [4096, 4096]
-> blk.30.attn_q.weight | F16 | [4096, 4096]
r> -> blk.30.attn_v.weight | F16 | [4096, 4096]
-> blk.31.attn_norm.weight | F16 | [4096]
-> blk.31.ffn_down.weight | F16 | [4096, 11008]
-> blk.31.ffn_gate.weight | F16 | [11008, 4096]
-> blk.31.ffn_up.weight | F16 | [11008, 4096]
-> blk.31.ffn_norm.weight | F16 | [4096]
-> blk.31.attn_k.weight | F16 | [4096, 4096]
-> blk.31.attn_output.weight | F16 | [4096, 4096]
-> blk.31.attn_q.weight | F16 | [4096, 4096]
r> -> blk.31.attn_v.weight | F16 | [4096, 4096]
-> output_norm.weight | F16 | [4096]
1193, in
1181, in main
args.outtype)
941, in pick_output_type
.MODEL_TENSOR.ATTN_Q].format(bid=0)+".weight"].data_type
has no attribute 'TENSOR_NAMES'

KerfuffleV2 · 2023-10-07T01:27:20Z

I'd guess this is probably a mismatch between the script and the install GGUF version. The scripts also have some special logic to check if there's a gguf module in gguf-py/gguf and will use that if it's there. That's to make it so if you check out the repo and run the scripts from the repo directory, you'll automatically import the gguf from the repo. If you're running the script with your CWD set to something else, then it'll just use whatever gguf version is installed.

cebtenzzre · 2023-10-07T16:00:50Z

See #3528. For now, you can either run convert.py from within the llama.cpp repo, or install the latest gguf package with pip install git+https://github.com/ggerganov/llama.cpp.git#subdirectory=gguf-py.

edit: gguf 0.4.0 has been released on pypi, you can now simply update it.

cebtenzzre mentioned this issue Oct 7, 2023

convert.py needs gguf 0.4.0, but latest on pypi is 0.3.3 #3528

Closed

cebtenzzre closed this as not planned Won't fix, can't repro, duplicate, stale Oct 7, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Error: Module 'gguf' has no attribute 'TENSOR_NAMES' #3496

Error: Module 'gguf' has no attribute 'TENSOR_NAMES' #3496

DimmNet commented Oct 6, 2023

KerfuffleV2 commented Oct 7, 2023

cebtenzzre commented Oct 7, 2023 •

edited

Loading

Error: Module 'gguf' has no attribute 'TENSOR_NAMES' #3496

Error: Module 'gguf' has no attribute 'TENSOR_NAMES' #3496

Comments

DimmNet commented Oct 6, 2023

KerfuffleV2 commented Oct 7, 2023

cebtenzzre commented Oct 7, 2023 • edited Loading

cebtenzzre commented Oct 7, 2023 •

edited

Loading