讨论广场 讨论详情
最新的量化框架很多,ipex-llm的性能相对于其他的量化框架对比怎么样?
像素26 2024-04-12 17:09:41
128 评论 分享
python

最新的量化框架很多,ipex-llm的性能相对于其他的量化框架对比怎么样?IPEX-LLM 是一个用于在英特尔 CPU 和 GPU 上运行大型语言模型(LLM)的 PyTorch 库。它是基于 Intel Extension for PyTorch(IPEX)以及 llama.cpp、bitsandbytes、vLLM、qlora、AutoGPTQ、AutoAWQ 等优秀工作的构建。它提供了与 llama.cpp、ollama、Text-Generation-WebUI、HuggingFace transformers、HuggingFace PEFT、LangChain、LlamaIndex、DeepSpeed-AutoTP、vLLM、FastChat、HuggingFace TRL、AutoGen、ModelScope 等的无缝集成。IPEX-LLM 优化并验证了 50 多个模型,包括 LLaMA2、Mistral、Mixtral、Gemma、LLaVA、Whisper、ChatGLM、Baichuan、Qwen、RWKV 等  。ipex-llm地址:https://github.com/intel-analytics/ipex-llm/

 

128 评论 分享
写讨论
全部评论(1)

Ipex-llm 跟 OpenVINO NNCF 我们都是推荐的

2024-05-20 11:17:08