本文41319字,阅览时刻约5分钟,总结精简部分1分钟即可.

你将取得:

小白也能看懂操作的消费级显卡完成的在windows上本地布置chatglm的精简办法
一些布置时报错的原因和处理办法
本地有一个自己的chatglm量化模型,断网也能跑的那种~

食用前提醒:

nvidia cuda toolkit的部分本文未涉及,请活用查找引擎.
本文装备显卡1070,跑的是chatglm-6b-int4
假如你的装备比较高,比方3090或4090这些24GB显存的高端卡,能够直接上chatglm-6b,由于量化模型推理速度真的慢!(鼠鼠哭哭)

系列预告:

langchain_chatglm : 本地断网也能挂载知识库的办法(附增加输入文件格局)
量化模型推理也太慢了!本地模型怎样在数据保密的情况下加快调用云gpu?

碎碎念:

又是间歇性趾高气扬,持续性emo和混吃等死的一天!我听着前面同学一个接一个的《Attention is all your need》分享,想着自己概率论和数学基础都没补完,还有两个月就要给导师交开题报告了,我论文一点条理都没有…容我再emo一会…

好! I’m back!由于要做的工作很多,良久没有更新了,最近终于想到我能够使命导向自学习!

建了什么使命先保密,总之是想了一个需求断网推理的商业场景,所以就有了这篇chatglm在windows上布置的爬坑文~

水平有限,大佬们多喷~我心理素质和抗压性可好了~

(os:听他人讲transformer都会emo的人说这句话你自己信吗?)

总结——bug的处理和步骤详解见后文,这儿是简化的全步骤

conda create -n your_chatglm_env python=3.9
conda activate your_chatglm_env
// 假如你的cuda version >= 11.8 比方我的12.1 
pip uninstall torch torchvision torchaudio
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
// 验证cuda和torch匹配
>>> import torch
>>> torch.cuda.is_available()
True
>>>
-----------------------------------------------------------
-----------------------------------------------------------
// 代码调用：长途加载模型
from transformers import AutoTokenizer, AutoModel
>>> tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True)
>>> model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().cuda()
>>> model = model.eval()
>>> response, history = model.chat(tokenizer, "你好", history=[])
>>> print(response)
你好!我是人工智能帮手 ChatGLM-6B,很快乐见到你,欢迎问我任何问题。
>>> response, history = model.chat(tokenizer, "晚上睡不着应该怎么办", history=history)
>>> print(response)
-----------------------------------------------------------
-----------------------------------------------------------
// 代码调用：从本地调用模型
fork repo // 你要自己去github上fork
git clone your_chatglm_repo 
cd your_chatglm_repo 
pip install -r requirements.txt // 这儿默许下载的是2.0.1 torch
pip uninstall torch torchvision torchaudio
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
// 验证cuda和torch匹配
>>> import torch
>>> torch.cuda.is_available()
True
>>>
// 下载模型参数
- 完好模型  把[这儿都下载](https://huggingface.co/THUDM/chatglm-6b/tree/main)，然后拖到你clone的那个repo里
- chatglm-6b-int8 把[这儿都下载](https://huggingface.co/THUDM/chatglm-6b-int8/tree/main)，然后拖到你clone的那个repo（chatglm-6b-int8) 里
- chatglm-6b-int4 把[这儿都下载](https://huggingface.co/THUDM/chatglm-6b-int4/tree/main)，然后拖到你clone的那个repo（chatglm-6b-int4) 里
// 运转量化的预备：下载gcc all packages 并增加正确的path，留意最上面的会最早匹配
// 正式调用
from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("D:\\workspace_valeria\\ChatGLM-6b_int4",trust_remote_code=True,revision="v1.1.0")
model = AutoModel.from_pretrained("D:\\workspace_valeria\\ChatGLM-6b_int4",trust_remote_code=True,revision="v1.1.0").half().cuda()
model = model.eval()
response, history = model.chat(tokenizer, "你好", history=[])
print(response)
请将上述"D:\\workspace_valeria\\ChatGLM-6b_int4"更换为你本地的your_chatglm_repo_path

终究的输出

(chatglm_env) PS D:\workspace_valeria\ChatGLM-6B_git> python
Python 3.9.16 (main, May 17 2023, 17:49:16) [MSC v.1916 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import torch
>>> torch.cuda.is_available()
True
>>> from transformers import AutoTokenizer, AutoModel
>>> tokenizer = AutoTokenizer.from_pretrained("D:\\workspace_valeria\\ChatGLM-6b_int4",trust_remote_code=True,revision="v1.1.0")
>>> model = AutoModel.from_pretrained("D:\\workspace_valeria\\ChatGLM-6b_int4",trust_remote_code=True,revision="v1.1.0").half().cuda()
No compiled kernel found.
Compiling kernels : C:\Users\godli\.cache\huggingface\modules\transformers_modules\ChatGLM-6b_int4\quantization_kernels_parallel.c
Compiling gcc -O3 -fPIC -pthread -fopenmp -std=c99 C:\Users\godli\.cache\huggingface\modules\transformers_modules\ChatGLM-6b_int4\quantization_kernels_parallel.c -shared -o C:\Users\godli\.cache\huggingface\modules\transformers_modules\ChatGLM-6b_int4\quantization_kernels_parallel.so
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libmingwthrd.a when searching for -lmingwthrd
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libmingwthrd.a when searching for -lmingwthrd
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libmingw32.a when searching for -lmingw32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libmingw32.a when searching for -lmingw32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libkernel32.a when searching for -lkernel32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libkernel32.a when searching for -lkernel32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libmoldname.a when searching for -lmoldname
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libmoldname.a when searching for -lmoldname
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libmingwex.a when searching for -lmingwex
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libmingwex.a when searching for -lmingwex
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libmsvcrt.a when searching for -lmsvcrt
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libmsvcrt.a when searching for -lmsvcrt
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libkernel32.a when searching for -lkernel32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libkernel32.a when searching for -lkernel32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libadvapi32.a when searching for -ladvapi32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libadvapi32.a when searching for -ladvapi32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libshell32.a when searching for -lshell32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libshell32.a when searching for -lshell32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libuser32.a when searching for -luser32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libuser32.a when searching for -luser32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libkernel32.a when searching for -lkernel32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libkernel32.a when searching for -lkernel32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libmingwthrd.a when searching for -lmingwthrd
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libmingwthrd.a when searching for -lmingwthrd
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libmingw32.a when searching for -lmingw32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libmingw32.a when searching for -lmingw32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libkernel32.a when searching for -lkernel32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libkernel32.a when searching for -lkernel32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libmoldname.a when searching for -lmoldname
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libmoldname.a when searching for -lmoldname
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libmingwex.a when searching for -lmingwex
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libmingwex.a when searching for -lmingwex
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libmsvcrt.a when searching for -lmsvcrt
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libmsvcrt.a when searching for -lmsvcrt
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libkernel32.a when searching for -lkernel32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libkernel32.a when searching for -lkernel32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: i386 architecture of input file `C:/MinGW/lib/../lib/dllcrt2.o' is incompatible with i386:x86-64 output
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: warning: cannot find entry symbol DllMainCRTStartup; defaulting to 00000002b4091000
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: C:/MinGW/lib/../lib/dllcrt2.o:(.text+0x39): undefined reference to `_free'
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: C:/MinGW/lib/../lib/dllcrt2.o:(.text+0x4f): undefined reference to `_fflush'
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: C:/MinGW/lib/../lib/dllcrt2.o:(.text+0x83): undefined reference to `_DllMain@12'
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: C:/MinGW/lib/../lib/dllcrt2.o:(.text+0xb8): undefined reference to `_malloc'
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: C:/MinGW/lib/../lib/dllcrt2.o:(.text+0xd1): undefined reference to `___dyn_tls_init_callback'
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: C:/MinGW/lib/../lib/dllcrt2.o:(.text+0xee): undefined reference to `__pei386_runtime_relocator'
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: C:/MinGW/lib/../lib/dllcrt2.o:(.text+0xf3): undefined reference to `___main'
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: C:/MinGW/lib/../lib/dllcrt2.o:(.text+0x107): undefined reference to `_DllMain@12'
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: C:/MinGW/lib/../lib/dllcrt2.o:(.text+0x131): undefined reference to `__errno'
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: C:/MinGW/lib/../lib/dllcrt2.o:(.text+0x16b): undefined reference to `___dllonexit'
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: C:/MinGW/lib/../lib/dllcrt2.o:(.text+0x19b): undefined reference to `___dllonexit'
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: ertr000001.o:(.rdata+0x0): undefined reference to `_pei386_runtime_relocator'
collect2.exe: error: ld returned 1 exit status
Compile default cpu kernel failed, using default cpu kernel code.
Compiling gcc -O3 -fPIC -std=c99 C:\Users\godli\.cache\huggingface\modules\transformers_modules\ChatGLM-6b_int4\quantization_kernels.c -shared -o C:\Users\godli\.cache\huggingface\modules\transformers_modules\ChatGLM-6b_int4\quantization_kernels.so
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libmingw32.a when searching for -lmingw32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libmingw32.a when searching for -lmingw32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libkernel32.a when searching for -lkernel32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libkernel32.a when searching for -lkernel32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libmoldname.a when searching for -lmoldname
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libmoldname.a when searching for -lmoldname
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libmingwex.a when searching for -lmingwex
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libmingwex.a when searching for -lmingwex
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libmsvcrt.a when searching for -lmsvcrt
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libmsvcrt.a when searching for -lmsvcrt
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libkernel32.a when searching for -lkernel32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libkernel32.a when searching for -lkernel32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libadvapi32.a when searching for -ladvapi32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libadvapi32.a when searching for -ladvapi32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libshell32.a when searching for -lshell32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libshell32.a when searching for -lshell32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libuser32.a when searching for -luser32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libuser32.a when searching for -luser32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libkernel32.a when searching for -lkernel32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libkernel32.a when searching for -lkernel32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libkernel32.a when searching for -lkernel32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libmoldname.a when searching for -lmoldname
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libmoldname.a when searching for -lmoldname
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libmingwex.a when searching for -lmingwex
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libmingwex.a when searching for -lmingwex
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libmsvcrt.a when searching for -lmsvcrt
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libmsvcrt.a when searching for -lmsvcrt
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib/libkernel32.a when searching for -lkernel32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/MinGW/lib/../lib\libkernel32.a when searching for -lkernel32
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: i386 architecture of input file `C:/MinGW/lib/../lib/dllcrt2.o' is incompatible with i386:x86-64 output
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: warning: cannot find entry symbol DllMainCRTStartup; defaulting to 00000003307e1000
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: C:/MinGW/lib/../lib/dllcrt2.o:(.text+0x39): undefined reference to `_free'
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: C:/MinGW/lib/../lib/dllcrt2.o:(.text+0x4f): undefined reference to `_fflush'
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: C:/MinGW/lib/../lib/dllcrt2.o:(.text+0x83): undefined reference to `_DllMain@12'
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: C:/MinGW/lib/../lib/dllcrt2.o:(.text+0xb8): undefined reference to `_malloc'
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: C:/MinGW/lib/../lib/dllcrt2.o:(.text+0xd1): undefined reference to `___dyn_tls_init_callback'
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: C:/MinGW/lib/../lib/dllcrt2.o:(.text+0xee): undefined reference to `__pei386_runtime_relocator'
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: C:/MinGW/lib/../lib/dllcrt2.o:(.text+0xf3): undefined reference to `___main'
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: C:/MinGW/lib/../lib/dllcrt2.o:(.text+0x107): undefined reference to `_DllMain@12'
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: C:/MinGW/lib/../lib/dllcrt2.o:(.text+0x131): undefined reference to `__errno'
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: C:/MinGW/lib/../lib/dllcrt2.o:(.text+0x16b): undefined reference to `___dllonexit'
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: C:/MinGW/lib/../lib/dllcrt2.o:(.text+0x19b): undefined reference to `___dllonexit'
D:/TDM-GCC-64/bin/../lib/gcc/x86_64-w64-mingw32/10.3.0/../../../../x86_64-w64-mingw32/bin/ld.exe: ertr000001.o:(.rdata+0x0): undefined reference to `_pei386_runtime_relocator'
collect2.exe: error: ld returned 1 exit status
Compile default cpu kernel failed.
Failed to load kernel.
Cannot load cpu kernel, don't use quantized model on cpu.
Using quantization cache
Applying quantization to glm layers
>>> model = model.eval()
>>> response, history = model.chat(tokenizer, "你好", history=[])
The dtype of attention mask (torch.int64) is not bool
>>> print(response)
你好！我是人工智能帮手 ChatGLM-6B，很快乐见到你，欢迎问我任何问题。
>>>

完成环境提示

-   OS:Windows11
-   Python:3.9.0
-   Transformers:4.27.1
-   PyTorch:2.0.1+cu118
-   CUDA Support (`python -c "import torch; print(torch.cuda.is_available())"`) :True
-   gcc: 6.3.0

创立虚拟环境

conda create -n chatglm_env python=3.9

conda activate chatglm_env

(chatglm_env) PS C:\Users\godli> pip list
Package                 Version
----------------------- ------------
accelerate              0.20.3
aiofiles                23.1.0
aiohttp                 3.8.4
aiosignal               1.3.1
altair                  5.0.1
astroid                 2.15.1
async-timeout           4.0.2
attrs                   23.1.0
autopep8                1.6.0
coloredlogs             15.0.1
cpm-kernels             1.0.11
dataclasses-json        0.5.8
dill                    0.3.6
docstring-to-markdown   0.12
ffmpy                   0.3.0
filelock                3.12.1
flake8                  6.0.0
frozenlist              1.3.3
fsspec                  2023.6.0
future                  0.18.3
google-search-results   2.4.2
gradio                  3.35.2
gradio_client           0.2.7
greenlet                2.0.2
huggingface-hub         0.15.1
humanfriendly           10.0
isort                   5.12.0
itchat                  1.2.32
jedi                    0.18.2
jsonschema              4.17.3
langchain               0.0.198
langchainplus-sdk       0.0.8
latex2mathml            3.76.0
lazy-object-proxy       1.9.0
linkify-it-py           2.0.2
lxml                    4.9.2
markdown-it-py          2.2.0
marshmallow             3.19.0
marshmallow-enum        1.5.1
mccabe                  0.7.0
mdit-py-plugins         0.3.3
mdtex2html              1.2.0
mdurl                   0.1.2
multidict               6.0.4
mypy-extensions         1.0.0
numexpr                 2.8.4
openai                  0.27.8
openapi-schema-pydantic 1.2.4
orjson                  3.9.1
packaging               23.1
parso                   0.8.3
pip                     23.1.2
platformdirs            3.2.0
pluggy                  1.0.0
psutil                  5.9.5
pycodestyle             2.10.0
pydantic                1.10.9
pydocstyle              6.2.3
pydub                   0.25.1
pyflakes                3.0.1
pylint                  2.17.1
pypdf                   3.9.1
pypdfium2               4.15.0
pypiwin32               223
pypng                   0.20220715.0
PyQRCode                1.2.1
pyreadline3             3.4.1
pyrsistent              0.19.3
python-dotenv           1.0.0
python-lsp-jsonrpc      1.0.0
python-lsp-server       1.7.1
pytoolconfig            1.2.5
pywin32                 306
PyYAML                  6.0
qrcode                  7.4.2
requests-toolbelt       1.0.0
rope                    1.7.0
semantic-version        2.10.0
sentencepiece           0.1.99
setuptools              67.8.0
snowballstemmer         2.2.0
SQLAlchemy              2.0.16
tenacity                8.2.2
toml                    0.10.2
tomli                   2.0.1
tomlkit                 0.11.7
typing_extensions       4.5.0
typing-inspect          0.9.0
uc-micro-py             1.0.2
ujson                   5.7.0
whatthepatch            1.0.4
wheel                   0.38.4
wxpy                    0.3.9.8
yapf                    0.32.0
yarl                    1.9.2

很显然，conda没有帮咱们装置pytorch以及其他的包，需求咱们手动下载

装置module并处理冲突

请forkchatglm-6b的repo 后clone到本地，进入该文件夹后执行：

pip install -r requirements.txt

这时咱们看一下环境里的包列表

(chatglm_env) PS D:\workspace_valeria\ChatGLM-6B_git> pip list
Package                 Version
----------------------- ------------
accelerate              0.20.3
aiofiles                23.1.0
aiohttp                 3.8.4
aiosignal               1.3.1
altair                  5.0.1
anyio                   3.7.0
astroid                 2.15.1
async-timeout           4.0.2
attrs                   23.1.0
autopep8                1.6.0
certifi                 2022.12.7
charset-normalizer      2.1.1
click                   8.1.3
colorama                0.4.6
coloredlogs             15.0.1
contourpy               1.1.0
cpm-kernels             1.0.11
cycler                  0.11.0
dataclasses-json        0.5.8
dill                    0.3.6
docstring-to-markdown   0.12
exceptiongroup          1.1.1
fastapi                 0.97.0
ffmpy                   0.3.0
filelock                3.12.1
flake8                  6.0.0
fonttools               4.40.0
frozenlist              1.3.3
fsspec                  2023.6.0
future                  0.18.3
google-search-results   2.4.2
gradio                  3.35.2
gradio_client           0.2.7
greenlet                2.0.2
h11                     0.14.0
httpcore                0.17.2
httpx                   0.24.1
huggingface-hub         0.15.1
humanfriendly           10.0
idna                    3.4
importlib-metadata      6.6.0
importlib-resources     5.12.0
isort                   5.12.0
itchat                  1.2.32
jedi                    0.18.2
Jinja2                  3.1.2
jsonschema              4.17.3
kiwisolver              1.4.4
langchain               0.0.198
langchainplus-sdk       0.0.8
latex2mathml            3.76.0
lazy-object-proxy       1.9.0
linkify-it-py           2.0.2
lxml                    4.9.2
Markdown                3.4.3
markdown-it-py          2.2.0
MarkupSafe              2.1.2
marshmallow             3.19.0
marshmallow-enum        1.5.1
matplotlib              3.7.1
mccabe                  0.7.0
mdit-py-plugins         0.3.3
mdtex2html              1.2.0
mdurl                   0.1.2
mpmath                  1.2.1
multidict               6.0.4
mypy-extensions         1.0.0
networkx                3.0
numexpr                 2.8.4
numpy                   1.24.1
openai                  0.27.8
openapi-schema-pydantic 1.2.4
orjson                  3.9.1
packaging               23.1
pandas                  2.0.2
parso                   0.8.3
Pillow                  9.3.0
pip                     23.1.2
platformdirs            3.2.0
pluggy                  1.0.0
protobuf                4.23.3
psutil                  5.9.5
pycodestyle             2.10.0
pydantic                1.10.9
pydocstyle              6.2.3
pydub                   0.25.1
pyflakes                3.0.1
Pygments                2.15.1
pylint                  2.17.1
pyparsing               3.0.9
pypdf                   3.9.1
pypdfium2               4.15.0
pypiwin32               223
pypng                   0.20220715.0
PyQRCode                1.2.1
pyreadline3             3.4.1
pyrsistent              0.19.3
python-dateutil         2.8.2
python-dotenv           1.0.0
python-lsp-jsonrpc      1.0.0
python-lsp-server       1.7.1
python-multipart        0.0.6
pytoolconfig            1.2.5
pytz                    2023.3
pywin32                 306
PyYAML                  6.0
qrcode                  7.4.2
regex                   2023.6.3
requests                2.28.1
requests-toolbelt       1.0.0
rope                    1.7.0
semantic-version        2.10.0
sentencepiece           0.1.99
setuptools              67.8.0
six                     1.16.0
sniffio                 1.3.0
snowballstemmer         2.2.0
SQLAlchemy              2.0.16
starlette               0.27.0
sympy                   1.11.1
tenacity                8.2.2
tokenizers              0.13.3
toml                    0.10.2
tomli                   2.0.1
tomlkit                 0.11.7
toolz                   0.12.0
torch                   2.0.1
tqdm                    4.65.0
transformers            4.27.1
typing_extensions       4.5.0
typing-inspect          0.9.0
tzdata                  2023.3
uc-micro-py             1.0.2
ujson                   5.7.0
urllib3                 1.26.13
uvicorn                 0.22.0
websockets              11.0.3
whatthepatch            1.0.4
wheel                   0.38.4
wxpy                    0.3.9.8
yapf                    0.32.0
yarl                    1.9.2
zipp                    3.15.0

咱们看到 torch 2.0.1, 这儿有个问题，torch设置的是torch≥1.10，但并不一定和cuda匹配，这样其实是会报错的。

这儿涉及到cuda和torch版别匹配的问题

处理办法：

检查你的torch是否支撑cuda：

import torch 
torch.cuda.is_available()
# 假如匹配会输出True，但我现在是false

假如输出false怎么办？

检查cuda版别

能够运用命令行检查

nvidia-smi

能够看到我的CUDA版别是12.1

虽然pytorch官网上现在只给出了11.8的Cuda支撑，可是社区明确表明晰兼容高版别Cuda。

对应的pytorch，应是最新版别

 pip uninstall torch torchvision torchaudio
 pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
 // 你也能够运用
 `pip install torch==2.0.1+cu118 torchvision==0.15.2+cu118 torchaudio===2.0.2+cu118 -f [https://download.pytorch.org/whl/torch_stable.html](https://download.pytorch.org/whl/torch_stable.html)`

现在的包如下:

torch                   2.0.1+cu118
torchaudio              2.0.2+cu118
torchvision             0.15.2+cu118

验证:

import torch
torch.cuda.is_available()
>> True

下载模型

墙裂引荐手动下载模型参数！！！

主动下载模型参数的话，你只需求在本地跑：

 >>> from transformers import AutoTokenizer, AutoModel
>>> tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True)
>>> model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().cuda()
>>> model = model.eval()
>>> response, history = model.chat(tokenizer, "你好", history=[])
>>> print(response)
你好!我是人工智能帮手 ChatGLM-6B,很快乐见到你,欢迎问我任何问题。
>>> response, history = model.chat(tokenizer, "晚上睡不着应该怎么办", history=history)
>>> print(response)
晚上睡不着可能会让你感到焦虑或不舒服,但以下是一些能够协助你入眠的办法:
1. 制定规则的睡觉时刻表:坚持规则的睡觉时刻表能够协助你树立健康的睡觉习气,使你更简单入眠。尽量在每天的相同时刻上床,并在同一时刻起床。
2. 发明一个舒适的睡觉环境:保证睡觉环境舒适,安静,黑暗且温度适合。能够运用舒适的床上用品,并坚持房间通风。
3. 放松身心:在睡前做些放松的活动,例如泡个热水澡,听些轻柔的音乐,阅览一些有趣的书籍等,有助于缓解紧张和焦虑,使你更简单入眠。
4. 防止饮用含有咖啡因的饮料:咖啡因是一种刺激性物质,会影响你的睡觉质量。尽量防止在睡前饮用含有咖啡因的饮料,例如咖啡,茶和可乐。
5. 防止在床上做与睡觉无关的工作:在床上做些与睡觉无关的工作,例如看电影,玩游戏或工作等,可能会搅扰你的睡觉。
6. 测验呼吸技巧:深呼吸是一种放松技巧,能够协助你缓解紧张和焦虑,使你更简单入眠。试着慢慢吸气,坚持几秒钟,然后缓慢呼气。
假如这些办法无法协助你入眠,你能够考虑咨询医生或睡觉专家,寻求进一步的建议。

可是一般来说网络欠好，所以引荐你手动下载并从本地加载模型！

我这儿运用git lfs下载会报错~

你能够在 (这儿)找到你需求的参数

完好模型把这儿都下载，然后拖到你clone的那个repo里
chatglm-6b-int8 把这儿都下载，然后拖到你clone的那个repo（chatglm-6b-int8) 里
chatglm-6b-int4 把这儿都下载，然后拖到你clone的那个repo（chatglm-6b-int4) 里

但只有这些参数还不行,没有model_config.json等必要信息。所以其实你真的应该下载的地址是这个！

完好模型把这儿都下载，然后拖到你clone的那个repo里
chatglm-6b-int8 把这儿都下载，然后拖到你clone的那个repo（chatglm-6b-int8) 里
chatglm-6b-int4 把这儿都下载，然后拖到你clone的那个repo（chatglm-6b-int4) 里

运转量化模型的预备

官网文本：

环境装置
运用 pip 装置依靠：pip install -r requirements.txt，其间 transformers 库版别引荐为 4.27.1，但理论上不低于 4.23.1 即可。
此外，假如需求在 cpu 上运转量化后的模型，还需求装置 gcc 与 openmp。大都 Linux 发行版默许已装置。关于 Windows ，可在装置 TDM-GCC 时勾选 openmp。 Windows 测验环境 gcc 版别为 TDM-GCC 10.3.0， Linux 为 gcc 11.3.0。在 MacOS 上请参考 Q1。

下载gcc

jmeubank.github.io/tdm-gcc/

一般挑选10.3.0版别，挑选中间的最大的那个tdm64-gcc-10.3.0-2.exe 就能够了

挑选装置all packages版别。

这儿默许是现已增加到path了，但仍是请你double check一下，是否有重复的gcc path，有可能上一次你装置的时分并没有挑选all packages哦~假如有的话，把之前的那个删掉。

现在咱们能够代码调用了！

从本地加载代码:

from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("D:\\workspace_valeria\\ChatGLM-6b_int4",trust_remote_code=True,revision="v1.1.0")
model = AutoModel.from_pretrained("D:\\workspace_valeria\\ChatGLM-6b_int4",trust_remote_code=True,revision="v1.1.0").half().cuda()
model = model.eval()
response, history = model.chat(tokenizer, "你好", history=[])
print(response)
# 请留意 D:\\workspace_valeria\\ChatGLM-6b_int4 是我自己电脑上的repo方位，你要替换成你自己的
# 假如你的途径过错，没有运用\\双反斜杠，比方D:\workspace\chatglm_6b_int4 ，它会把它当成huggingface的途径去长途下载，并报错：
huggingface_hub.utils._validators.HFValidationError: Repo id must use alphanumeric chars or '-', '_', '.', '--' and '..' are forbidden, '-' and '.' cannot start or end the name, max length is 96: 'D:\workspace\chatglm_6b_int4'.

处理bug

huggingface_hub.utils.validators.HFValidationError: Repo id must use alphanumeric chars or ‘-‘, ‘‘, ‘.’, ‘–‘ and ‘..’ are forbidden, ‘-‘ and ‘.’ cannot start or end the name, max length is 96: ‘D:\workspace\chatglm_6b_int4’.

这个错会报在

tokenizer = AutoTokenizer.from_pretrained("YOUR_REPO_ABS_PATH",trust_remote_code=True,revision="v1.1.0")这儿。

原因：

途径过错，没有运用\双反斜杠，比方D:\workspace\chatglm_6b_int4 ，它会把它当成huggingface的途径去长途下载，并报错

处理办法：

正确运用本地途径：D:\workspace_valeria\ChatGLM-6b_int4

[BUG/Help] Windows环境下运用GPU加载INT-4模型报错

报错如下:

>>> model = AutoModel.from_pretrained("D:\\workspace_valeria\\ChatGLM-6b_int4",trust_remote_code=True,revision="v1.1.0").half().cuda()
No compiled kernel found.
Compiling kernels : C:\Users\godli\.cache\huggingface\modules\transformers_modules\local\quantization_kernels_parallel.c
Compiling gcc -O3 -fPIC -pthread -fopenmp -std=c99 C:\Users\godli\.cache\huggingface\modules\transformers_modules\local\quantization_kernels_parallel.c -shared -o C:\Users\godli\.cache\huggingface\modules\transformers_modules\local\quantization_kernels_parallel.so
c:/mingw/bin/../lib/gcc/mingw32/6.3.0/../../../../mingw32/bin/ld.exe: cannot find -lpthread
collect2.exe: error: ld returned 1 exit status
Compile default cpu kernel failed, using default cpu kernel code.
Compiling gcc -O3 -fPIC -std=c99 C:\Users\godli\.cache\huggingface\modules\transformers_modules\local\quantization_kernels.c -shared -o C:\Users\godli\.cache\huggingface\modules\transformers_modules\local\quantization_kernels.so
Load default cpu kernel failed:
Traceback (most recent call last):
  File "C:\Users\godli/.cache\huggingface\modules\transformers_modules\local\quantization.py", line 178, in __init__
    kernels = ctypes.cdll.LoadLibrary(kernel_file)
  File "D:\Python\Python39\lib\ctypes\__init__.py", line 452, in LoadLibrary
    return self._dlltype(name)
  File "D:\Python\Python39\lib\ctypes\__init__.py", line 374, in __init__
    self._handle = _dlopen(self._name, mode)
OSError: [WinError 193] %1 不是有效的 Win32 应用程序。
Failed to load kernel.
Cannot load cpu kernel, don't use quantized model on cpu.
Using quantization cache
Applying quantization to glm layers

终究处理方案（能够直接看这儿,当然下面也写了原因和处理方案）

其实你在下载gcc时应该下载all packages版别

并留意把path中的32位C:\MinGW\bin去除 ,保留D:\TDM-GCC-64\bin

原因：

Compiling gcc -O3 -fPIC -pthread -fopenmp -std=c99 C:\Users\godli\.cache\huggingface\modules\transformers_modules\local\quantization_kernels_parallel.c -shared -o C:\Users\godli\.cache\huggingface\modules\transformers_modules\local\quantization_kernels_parallel.so

这行日志表明，程序正在测验运用GCC编译器来编译一个C语言的扩展库。然而，这个编译命令失败了，由于链接器找不到-lpthread库。这是由于在Windows环境下，GCC编译器默许不支撑-pthread选项。

然后，程序测验运用默许的CPU内核代码来编译这个扩展库，可是这个测验也失败了。最后，程序测验加载这个扩展库，可是这个测验也失败了，过错信息是[WinError 193] %1 不是有效的 Win32 应用程序。这个过错通常表明测验加载的文件不是一个有效的可执行文件或许动态链接库。

处理：

装置和装备GCC编译器，或许在一个支撑GCC和-pthread选项的环境（例如Linux）中运转你的代码。

在Windows环境下，怎样让GCC编译器支撑-pthread选项。

在Windows环境下，GCC编译器默许不支撑-pthread选项，由于Windows并不直接支撑POSIX线程（Pthreads）。然而，有一些第三方库能够在Windows上供给Pthreads的支撑，例如pthreads-w32。

以下是在Windows环境下装置和运用pthreads-w32的步骤：

下载pthreads-w32。你能够从以下链接下载：www.sourceware.org/pthreads-wi…
这个页面供给的是ftp链接，是美国的链接，你能够运用镜像站mirrors.tuna.tsinghua.edu.cn/sourceware/…
挑选最新版2.9.1 pthreads-w32-2-9-1-release.zip
解压下载的文件。你会得到一个包括pthread.h、sched.h、semaphore.h等头文件的目录，以及一个包括pthreadGC2.dll和pthreadVC2.dll等动态链接库的目录。
将头文件的目录增加到你的包括途径（Include Path）中。你能够经过修正环境变量C_INCLUDE_PATH来完成这一点。
包括途径（Include Path）：这是编译器在查找头文件（例如 #include <pthread.h>）时会查找的目录列表。你能够经过修正环境变量 C_INCLUDE_PATH 来增加新的目录到包括途径中。
多个途径，你能够运用分号（;）来分隔它们。
将动态链接库的目录增加到你的库途径（Library Path）中。你能够经过修正环境变量LIBRARY_PATH来完成这一点。
库途径（Library Path）：这是链接器在查找库文件（例如 -lpthreadGC2）时会查找的目录列表。你能够经过修正环境变量 LIBRARY_PATH 来增加新的目录到库途径中。
多个途径，你能够运用分号（;）来分隔它们。
在你的GCC编译命令中，运用-lpthreadGC2选项替代-pthread选项。

gcc -O3 -fPIC -lpthreadGC2 -fopenmp -std=c99 C:\Users\godli\.cache\huggingface\modules\transformers_modules\local\quantization_kernels_parallel.c -shared -o C:\Users\godli\.cache\huggingface\modules\transformers_modules\local\quantization_kernels_parallel
c:/mingw/bin/../lib/gcc/mingw32/6.3.0/../../../../mingw32/bin/ld.exe: cannot find -lpthreadGC2
c:/mingw/bin/../lib/gcc/mingw32/6.3.0/../../../../mingw32/bin/ld.exe: cannot find -lpthread
collect2.exe: error: ld returned 1 exit status

又试了一些办法卡住了，预备测验wsl的时分现已很晚了，但后来交流了一下是重复下载了gcc，之前的同伴gcc没有勾选pthread率先增加到path了，path又是从上往下读的，所以会形成这个bug

我把path中的32位C:\MinGW\bin去除 ,保留D:\TDM-GCC-64\bin(all packages)

现在咱们能够成功地跑通 model = model.eval()了~可喜可贺！

AttributeError: ‘Logger’ object has no attribute ‘warning_once’

gcc -O3 -fPIC -lpthreadGC2 -fopenmp -std=c99 C:\Users\godli\.cache\huggingface\modules\transformers_modules\local\quantization_kernels_parallel.c -shared -o C:\Users\godli\.cache\huggingface\modules\transformers_modules\local\quantization_kernels_parallel
c:/mingw/bin/../lib/gcc/mingw32/6.3.0/../../../../mingw32/bin/ld.exe: cannot find -lpthreadGC2
c:/mingw/bin/../lib/gcc/mingw32/6.3.0/../../../../mingw32/bin/ld.exe: cannot find -lpthread
collect2.exe: error: ld returned 1 exit status

原因

transformer的版别不是4.27.1 , 这时的版别是4.26.1

处理

把transformer晋级为4.27.1处理问题！

pip install protobuf transformers==4.27.1 cpm_kernels

>>> response, history = model.chat(tokenizer, "你好", history=[])
The dtype of attention mask (torch.int64) is not bool
>>> print(response)
你好！我是人工智能帮手 ChatGLM-6B，很快乐见到你，欢迎问我任何问题。
>>> response, history = model.chat(tokenizer, "你好", history=[])
>>> print(response)
你好！我是人工智能帮手 ChatGLM-6B，很快乐见到你，欢迎问我任何问题。
>>> response, history = model.chat(tokenizer, "你是谷歌开发的", history=[])
>>> print(response)
我不是谷歌开发的。我是一个名为 ChatGLM-6B 的人工智能帮手，是由清华大学 KEG 实验室和智谱 AI 公司于 2023 年一起训练的语言 模型开发的。我的使命是针对用户的问题和要求供给恰当的答复和支撑。
>>>

完结撒花!

参考资料：

zhuanlan.zhihu.com/p/620455056

github.com/THUDM/ChatG…

blog.csdn.net/AiTanXiing/…

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

chatglm在windows上部署 | 零基础小白爬坑

总结——bug的处理和步骤详解见后文,这儿是简化的全步骤

完成环境提示

创立虚拟环境

装置module并处理冲突

这儿涉及到cuda和torch版别匹配的问题

下载模型

运转量化模型的预备

下载gcc

现在咱们能够代码调用了！

处理bug

huggingface_hub.utils.validators.HFValidationError: Repo id must use alphanumeric chars or ‘-‘, ‘‘, ‘.’, ‘–‘ and ‘..’ are forbidden, ‘-‘ and ‘.’ cannot start or end the name, max length is 96: ‘D:\workspace\chatglm_6b_int4’.

原因：

处理办法：

[BUG/Help] Windows环境下运用GPU加载INT-4模型报错

终究处理方案（能够直接看这儿,当然下面也写了原因和处理方案）

原因：

处理：

原因

处理

参考资料：

近期文章

近期评论