大模型运行通常 AIGC探求之旅

2024-11-15

随着OpenAI推出ChatGPT，AIGC迎来了史无前例的开展时机。大模型技术曾经不只仅是技术趋向，而是深上天塑造着咱们交流、上班和思索的方式。本文引见了笔者了解的大模型和AIGC的亲密咨询，从历史沿革到实践运行案例，再到面临的技术应战和伦理监管疑问，讨论这一技术浪潮如何引领咱们进入一个智能化的未来。

一、前言

引言：AI时代，未来已来

2022.11月30号OpenAI推出ChatGPT后随即爆火，五天注册用户数过百万，2个月用户破1亿，成为史上增长最快的消费者运行。随后各大厂也纷繁卷入AIGC畛域，迎来国产GPT大模型发布潮（百度"文新一言"、阿里"通义千问"、商汤"商量 SenseChat"等）及AI守业公司成立潮（王小川、李开复等）。

大模型代表一个新的技术AI时代的来临，大模型展现出的弱小的 语义了解，内容生成以及泛化才干 正在逐渐扭转咱们的上班与生存方式（AI+）、上班方式和思想方式。正如《陆奇的大模型观》所讲咱们正迎来新范式的新拐点，从消息系统到模型系统过渡，"模型"常识无处不在。人工智能的浪潮正在引领新的技术反派，或容许称为第五次工业反派。

（【注】介绍大家去阅读《陆奇的大模型观》。剧烈倡导间接看陆奇演讲视频奇绩创坛| 陆奇最新演讲完整视频｜大模型带来的新范式：演讲涵盖陆奇对大模型时代的微观思索，包括拐点的外在动因、技术演进、守业公司结构性时机点以及给守业者的倡导。）

在人工智能的新时代，大模型技术正成为推进AIGC（人工智能生成内容）前沿的关键力气。本文将经过引见咱们的AIGC名目，来深化讨论这一技术的开发、实施与运行。因团体才干限度，文章中或者存在一些了解或表述失误的中央，宿愿各位大佬能及时批判和斧正。

AIGC简介与开展历程

在与业务等交谈环节中，经常会听大家提到AIGC、ChatGPT、大模型、XX等许多概念，但也发现局部内容混杂。首先来处置下当下最火概念AIGC、ChatGPT、大模型究竟是什么？

AIGC是一个更宽泛的概念，包括多种类型的内容生成；ChatGPT则是一个详细的产品。便捷可以这么了解：AIGC是平台，ChatGPT是平台上的某个软件。

联合人工智能的演进历程，AIGC开展大抵分三个阶段[人工智能行业生成内容（AIGC）白皮书（2022年）（地址：）]：

早期萌芽阶段（1950s－1990s）

早期萌芽阶段（1950s－1990s），受限于过后的科技水平，AIGC仅限于小范围实验。

积淀积攒阶段（1990s－2010s）

积淀积攒阶段（1990s－2010s），AIGC从实验性向适用性逐渐转变。

极速开展阶段（2010s至今），深度学习模型始终迭代，AIGC打破性开展。

大模型与AIGC的关联

大模型（Large Models）与AIGC（人工智能生成内容）之间存在亲密的关联，AIGC依赖于大型的人工智能模型来生成高品质的内容。它们是人工智能技术开展的两个关键方面。便捷来说：

总的来说，大模型和AIGC相互促成、共同开展，构成了一个严密咨询的技术生态系统。在这个系统中，大模型提供了底层的技术支持，而AIGC则代表了一种实践的运行方式。

二、大模型概述

大模型的定义和特点

大模型（Large Models）在人工智能（AI）和机器学习（ML）畛域，通常指的是具有少量参数的(通常蕴含数百万到数十亿甚至更多的参数)、复杂计算结构和强泛化才干的机器学习模型。这类模型往往是基于神经网络，尤其是深度神经网络，包括但不限于深度卷积神经网络（CNNs）、循环神经网络（RNNs）、长短期记忆网络（LSTMs）和Transformer架构。

其关键特点包括：

典型大模型举例

国际：

组织	模型/运行	备注
GPT-1/GPT-2/GPT-3
微软	Windows Copilot

国际：

组织	模型/运行	备注
复旦大学
阿里	通义千问
清华大学
华为	盘古
商汤	“商量”SenseChat
腾讯	混元
科大讯飞	星火认知
百川智能	Baichuan-7B、Baichuan-13B
百度	文心一言 2023.10.17 文心大模型4.0正式发布

【注】更多模型可从huggingface模型平台检查；

huggingface国际镜像（地址：）

总结来看：

【附】中文才干上10月 SuperCLUE 评测排名

三、AIGC运行探求

业务背景

笔者所在业务存在多国度多语种的 千万级别 的海外特征供应，因多语种翻译、商品消息无余、供应商才干等疑问造成少量 商品属性缺失、图片素材品质低 ；造成用户了解难、转化低、万求高。面对极大品量，经营手动仅可补全大批头部商品，不可全量优化。在AI技术成熟的背景下，思索驳回AIGC的方式对商品的属性、卖点、素材图片、场景图等消息启动补全及优化。

AIGC技术落地环节

作为一名业务技术开发，必定时辰围绕处置业务虚际疑问、技术翻新驱动业务开展、极速照应市场变动等方面思索。在名目启动初期，咱们首先基于探物香水标品场景2000个品批量AIGC素材，验证AIGC消费可行性。并经过屡次脑暴探求，明白要做能够带来业务价值的、能够规模化的、能够突出国际垂类长处的AIGC运行。不做炫技的，落不了地的，没有业务感知的，不做通用的模型，算力(资源不准许)。

因此技术指标：搭建可复用可扩展、嵌入产供投链路的AIGC工程引擎；辅佐业务极速落地AIGC场景。技术选型外围三步：1、模型底层选用；2、言语&框架选用；3、全体架构设计。

模型选用

生文模型：初期咱们驳回GPT4、GPT3.5，前面也逐渐引入了通义千问、vertex-PaLM2、claude2等。

生图模型：Stable Diffusion

老本方面预算：关于英文，1个token大约为4个英文字符或0.75个英文单词；关于中文，1中文约1-3个token。前期实验上去，探东西 cost=0.12元/品，是在业务可接受的范围。

测算token数网站：

技术框架选用

综合开源社区生动、牢靠性，以及前期咱们驳回GPT模型适配度等多方面思索，在模型层咱们驳回LangChain框架构建。

特点	Llama-Index	Semantic Kernel（微软）
言语	Python ；Js/Ts	TypeScript
可组合性	是	是	是
LLMs和Prompt治理	是	是	是
Chains（编排才干）	是	否	是
数据索引处置	是	是	是
义务治理（agents）	是	否	是
形态治理	是	否	是
Evaluation	是	否	是
文档

【注】这些框架的目的是为 LLM 交互创立一个底层编排引擎

LangChain是一个基于大型言语模型（LLMs）构建运行的框架。它的外围思想是定义 规范接口 （可以自定义成功）& 可以将不同的组件“链接”起来，创立更初级的LLMs运行，相似spring全家桶。它可以协助你成功聊天机器人、生成式问答、文本摘要等配置。

langchain-python	langchain-java
生态兴盛度和牢靠性	高，社区生动，github 4.7W+star	低，团体外部团队自建
扩展工具多样性	高度丰盛的组件才干	极少
团体两边件兼容	和团体外部对接都须要启动框架层开发，比如hsf调用、数据库对接、服务化的才干	支持
团体容器兼容	支持	支持
团体LLM接口兼容	须要启动框架层对接，开发老本较低	有对接老本
开发老本	python数据处置(爬取、荡涤、标注)、大模型交互python性价比更高，可极速搭建试错	跟数据处置和大模型交互更重，试错周期长
文档	langchain官方：

【言语选用】：python+java联合的方式：

全体架构设计

数据层：弹内/弹外数据->人造言语文本处置->国际自营行业向量数据库

模型层：依赖团体外部/国际自营大模型才干

工程引擎：横向通用才干视角（生文、生图、会话等），撑持下层业务场景&嵌入消费投放链路

局部通常案例

树立批量文生文AIGC工程引擎，具有prompt模板揭示&智能填充、义务试跑预览、费用预估、批量化AIGC消费等才干。已运行素材文生文、商品咨询FAQ消费等场景。

树立图生图AIGC工程引擎，成功图片的超分处置、AI二创等工程树立，支持业务优化商品图片素材品质。已运行探物标品素材图生图等场景。

其余运行场景

上方是自己搜集的一些运行场景case，宿愿给大家更多的思索启示。

外部公司运行场景更广，这里便捷罗列下：

四、AIGC的通常应战

笔者在AIGC运行的初探，技术应战与时机并存。上方给大家分享下AIGC的通常应战以及局部处置思绪。

技术应战

疑问

形容

处置打算及思绪

常识量有限

比如GPT 4，21年前训练样本&通用语料训练，实时数据、垂直畛域的数据&专属常识不可了解

不可"在外部环球执行"，不论是搜查网页、调用 API 还是查找数据库

打算1.LLM+检索增强：LLM的基础上经过检索等额外提供畛域数据消息；关于用户输入Query，联合业务数据中检索到的结果一同输入给LLM，则可以失掉更精准的回答。

打算2.构建行业数据集对LLM启动微调，使模型自身具有输入行业消息的才干。（老本高且成果不佳）

【处置打算】：LLM+检索增强：OpenAI提出了chatgpt-retrieval-plugin、WebGPT，开源社区提出了DocsGPT、ChatPDF、基于langchain的检索增强chatbot等等一系列处置打算

成果疑问

局部场景成果不迭预期

复杂逻辑推理才干不佳

对未见过的常识语料回答成果差

1、大模型+高低文学习技术（In-Context Learning），设计正当的prompt模版

2、大模型+思想链揭示（Chain-of-Thought Prompting），引入推理门路作为揭示，激起大模型依照这种推理的形式生成出正当的结果

3、大模型+高品质标注样本+指令微调，提高模型对特定义务的泛化才干

提前疑问

一次性完整问答大略 10s+ （用户200ms会有体感）

提前关键受两个起因影响：模型和生成的令牌数量。

1、流式传输。恳求中的设置stream: true使模型在令牌可用时立刻开局前往令牌，而不是等候生成完整的令牌序列。它不会扭转失掉一切令牌的期间，但它会缩小咱们想要显示局部进展或将中止生成的运行程序的第一个令牌的期间。这可以是更好的用户体验和 UX 改良，因此值得尝试流式传输。

2、基础设备。openai 美国。存在跨国网络延时

3、减小token 。例如经常使用更短的揭示。

4、缓存：经过存储经常访问的数据，可以缩短照应期间，而无需重复调用 API。但在增加新消息时使缓存有效。

资源和性能

训练&微调都须要不少机器资源，目前GPU资源匮乏

部署资源，尤其是C端投放有高并发低延时要求，须要投入渺小老本在线serving

1、不训练基座模型，微调选用的基座模型选几B~几十B左右的LLM （如ChatGLM-6B）

2、曲线救国，线上不间接经常使用大模型serving，一种是应用大模型的embedding，另一种是应用大模型来启动更多样本标注，来辅佐小模型学习

伦理和监管疑问

随着大模型在AIGC中的宽泛运行，它们引发了关于数据隐衷、版权、内容监管和成见等疑问的讨论。因此，大模型的经常使用不只触及技术层面，还触及伦理和法律层面。

疑问

形容

处置打算及思绪

安保与合规

如政治敏感、违法立功、伦理品德等疑问，尤其是LLM间接面向C端场景

1、树立安保校验模块才干2、B端：生成素材数据荡涤&人工检查

3、C端：生成式大模型必定经过SFT、RLHF等微调技术对大模型做适配微调，对齐人类的价值观；

政策疑问

关于类GPT才干作为C端运行的开明水平需受限于政策

1、上线前需安保评价

【附】网信办411发布《生成式人工智能服务治理方法》征求意见稿，规范生成式人工智能产品（AIGC，如 ChatGPT）的开发和经常使用方式、行业的定义、抵消费者的要求和责任等方面。意见稿中尤其提出：“应用生成式人工智能产品向群众提供服务前，应当依照《具有言论属性或社会发动才干的互联网消息服务安保评价规则》 向国度网信部门申报安保评 估，并依照《互联网消息服务算法介绍治理规则》 实行算法备案和变卦、注销备案手续 。

C端运行上线须要过“双新评价”：

五、AIGC的未来展望

业务侧布局：基于业务场景继续翻新，扩展战果。更多还是聚焦基建和业务场景运行。

技术等候：AI大势浩浩大荡，顺之者昌逆之者亡。YY几个未来的等候场景

六、附录

七、团队引见

出口技术作为阿里巴巴完整的电商生态环境中的关键一环，是阿里经济体5年2000亿美金出口承诺的主力担当。咱们附丽淘系电商生态，努力于在环球的品牌和商家同中国庞大的消费者市场之间构建高效率、有温度的消费平台，经过数据和技术才干，为品牌、商家和消费者提供优质服务。

原文链接：

<<落地文旅生成式AI 还能玩出多少新花招

大模型落地运行指北>>