如何基于一台MacBook搞定企业级大模型常识库部署

2024-11-15

1、为什么要在 MacBook 上搭建常识库？

最外围最关键的是咱们手上的文档资料出于安保需要，不能随意上行到云服务，也就无法实践验证常识库的实践成效。另外关于 IT 同窗来说，自己亲手搭建一个完整的打算、能灵敏调整和对接各种不同的模型、评测各种模型不同的体现，也是出于对技术的探求天性使然。

经常使用的 MacBook 性能如下，对大模型经适量化处置（比如：int8）后，可以流利运转。

2、常识库的架构设计

基于一台 MacBook 搭建部署的架构设计如下图，在这套架构设计中，咱们驳回了实力排抢先、并且对企业和学术都友好的国产开源大模型 ChatGLM3-6B。

并驳回了基于 m3e-base 模型的 embedding search RAG 打算。基于这两个模型封装和 ChatGPT 兼容的 API 接口协定；经过引入 One API 接口治理 & 散发系统，构成一致 LLM 接口渠道治理平台规范，并把封装好的接口协定注册出来；搭建与 Dify.ai 齐名开源大模型常识库平台治理系统 FastGPT，成功集私有常识数据源预处置、嵌入检索、大模型对话一体的完整常识库运行流程。

麻雀虽小五脏俱全，最终构成一套既满足商用规范、又能在 MacBook 跑起来的的打算。只管自动水平和实践需求还有必定差距，但至少咱们在不用额外购置显卡或云服务的状况下，以最小老本部署运转、并且能导入实践业务数据（如：设计文档、业务流程文档、名目治理文档、技术分享文档等等）启动实操验证，值得每位工程师都来入手尝试一下。

3、常识库的部署设计

基于 MacBook 的部署打算分为四个关键过程、14个详细步骤，只需一步步实操下去，每位 IT 同窗都可以在自己的 MacBook 上领有属于自己的私有大模型常识库系统，步骤清单如下：

局部步骤可以便捷地经过 Docker 镜像一键部署成功，但本着对细节一杆子插究竟的部署思绪，还是采取了纯手上班业的方法。

原文链接：

<<如何选用适宜企业需求的大言语模型

最强图像大模型Phi>>

如何基于一台MacBook搞定企业级大模型常识库部署

1、为什么要在 MacBook 上搭建常识库？

2、常识库的架构设计

3、常识库的部署设计

您可能还会对下面的文章感兴趣：

随便看看