大模型运行开发环节中干流架构形式

2024-11-14

“架构是灵敏多变的，切勿钻牛角尖”

但大模型在工程化落地中依然面临着很多疑问，比如说老本疑问，技术疑问，以及才干疑问，毕竟大模型并不是万能的，某些模型只管在某些方面表现较强，但并不是无所不能的。

因此，该怎样处置这个疑问呢？

这时通用大模型+多个垂直小模型的处置打算就产生了。

大家看到大模型+多个小模型，会不会就以为大模型就是参数量庞大的模型，多个小模型就是参数量较小的模型？

其实这里说的大模型+多个小模型并不是从咱们传统意义从技术角度了解的模型，而是从业务角度上的模型。

这里的大模型指的是你们公司关键业务依赖的模型，比如一家做AIGC业务的企业，它的大模型必需是以生成业务为主；但生成式范畴那么大，无法能有一家公司能保养如此多的模型，必需是以一两个业务方向为主，其它的为辅。

比如说一家公司做AI音乐生成业务，但假设它还想做视频处置和文字处置的业务，这时它或者就没有那么多资金，技术和期间来保养如此多的模型。

而多个垂直小模型也并不是说必定是体量小的模型，而是那种非关键业务的模型；或者是自己保养的小模型，也或者是调用第三方的大模型服务。

大模型+小模型的性能形式细分来说还有很多实用场景，比如下面说的主业务模型+边缘业务模型；再比如，一特性能弱小的视频生成模型+多个不同格调的垂下小模型，经过大+小的形式来处置不同场景的疑问，以及浪费企业老本。

不论是学习还是实践的企业运行，千万要明确没有人能做处置一切的疑问，也没有人能实现一切的义务，因此协作才是最好的选用，而大模型+垂直小模型的形式就是最好的协作表现——协作共赢。

团体或企业只有要关注于自身的外围业务，而不用把期间和精神糜费在一些自己基本有力实现的义务上，这就是要做报答率最高，最有性价比的事件。

很多人都青睐做一条龙，集研发，消费，开售为一体，但对大局部中小企业来说成为产业链条上的一环或者是更好的选用。

而在往年上半年，360CEO周鸿祎也不止一次性的提过，不要过火谋求大模型的才干和性能，经常使用多特性能弱小的垂直小模型或者会比一个大模型做的更好，更强。

前面可以说是经常使用大模型+多个小模型的好处，那么经常使用这种打算有没有什么坏处呢？

凡事都有两面性，经常使用大模型+小模型只管能带来很多好处但雷同也面临着很多疑问。

只管很多时刻因为业务的多元性造成咱们不得不经常使用多个模型，但经常使用多个模型最大的疑问就是要适配不同的模型，每个模型都有其不同的输入和输入，而且不同模型的才干不一而足。

咱们要在兼容不同模型的基础之上，还要同时统筹多种模型的复杂性和稳固性。

就相似于传统业务系统架构中，因为业务须要或其它要素造成咱们不得不引入一些两边件，但有过名目阅历的人应该都知道，每引入一个两边件都会给名目带来一些不确定的潜在危险。

万一两边件不稳固怎样办，万一两边件宕机了怎样办等等，怎样做容错处置等。

总之，没有原封不动的架构，也没有白璧无瑕的系统，咱们须要依据实践状况基本不同的业务场景，选用适合的处置打算，而不是想着靠一个架构处置一切疑问。

最后，最最最关键的事就是，面对疑问必定要灵敏多变，切记无法钻牛角尖。

原文链接：