维护啦：提供专业网站维护服务，以实惠、方便、快捷著称！一次服务，终身朋友！

网站维护热线：

网站维护：

网站建设：

当前位置：网站维护 > 行业动态 > 行业动态

阿里魔搭社区开源推理引擎 DashInfer

来源：网站维护

作者：www.weihula.com

人气：

2024-5-24


	内容提示：ModelScope 推出了预训练大语言模型（LLM）推理引擎 DashInfer，支持 C++ 和 Python 语言接口，可在多种 CPU 架构上高效推理大模型。

ModelScope 推出了预训练大语言模型（LLM）推理引擎 DashInfer，支持 C++ 和 Python 语言接口，可在多种 CPU 架构上高效推理大模型。

DashInfer 采用 C++ Runtime 编写，支持连续批处理和多 NUMA 推理，能充分利用服务器级 CPU 的算力，为推理14B 及以下的 LLM 模型提供更多硬件选择。该引擎已开源，提供轻量级架构，高精度实现，优化的计算 Kernel，以及行业标准 LLM 推理技术。DashInfer 支持主流 LLM 开源模型和 PTQ 量化技术。

此外，引擎还提供多语言 API 接口，支持多种硬件和数据类型，包括 x86CPU 和 ARMv9CPU，以及 FP32、BF16、InstantQuant 等数据类型。关于模型支持，DashInfer 可以加载和序列化模型，执行推理过程，并采用 DLPack 格式的 tensor 与外部框架交互。在单 NUMA 架构下，推理引擎使用多线程和线程池进行调度;而在多 NUMA 架构下，引擎采用多进程 client-server 架构，实现 tensor parallel 的模型推理。

性能测试结果表明，DashInfer 在 ARM 和 x86CPU 上具有良好的推理性能，能够有效提升大模型推理效率。

代码开源地址:

https://github.com/modelscope/dash-infer

推理体验地址:

https://www.modelscope.cn/studios/modelscope/DashInfer-Demo

【声明】本文章系本站编辑转载，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容！


	上一篇：李彦宏：AI应用可以推动基础模型创新促进数据生成
	下一篇：拼多多上线自动跟价功能，抖音电商宣布小规模内测“自动改价”功能
	返回行业动态

网站维护套餐介绍


	·入门型网站维护服务	申请>>
	·标准型网站维护服务	申请>>
	·经济型网站维护服务	申请>>
	·商务型网站维护服务	申请>>
	·豪华型网站维护服务	申请>>
	·专业型网站维护服务	申请>>
	·订制型网站维护服务	申请>>

网站维护案例


	积木人展览展示
	海德睿工程
	创际门窗
	天津雷公
	利君云商

网站维护知识


	·域名知识	·空间知识
	·网页知识	·程序知识
	·数据库知识	·邮件知识
	·安全知识	·优化知识
	·营销知识	·其他知识

网站维护申请点此进入

反馈意见

返回顶部