Meta官宣深化AI大战 推出先进大型言语模型

扎克伯格在社交媒体上称,Facebook AI Research研发的LLaMA是“目前水平最高的”大型言语模型,指标是协助钻研人员推动他们在人工智能(AI)畛域的上班。

“大型言语模型”(LLM)可以消化少量的文本数据,并推断文本的单词之间的相关。随着计算才干的提高,以及输入数据集与参数空间的始终扩展,LLM的才干也相应提高。

目前,LLM曾经被证实能高效地口头多种义务,包含文本生成、疑问回答、书面资料总结等。扎克伯格称,LLM在智能证实数学定理、预测蛋白质结构等更复杂的方面也有很大的开展前景。

值得一提的是,近期大火的ChatGPT就是驳回LLM构建的聊天机器人。ChatGPT由GPT3.5提供允许,而GPT3.5是一款基于OpenAI 175B参数基础模型训练的LLM,175B是它从训练数据中所学习、积淀上去的内容。

Meta在官方引见中称,LLaMA有7B、13B、33B和65B四个基础模型,在大少数基准测试中都优于GPT3.5的前身GPT3-175B,而LLaMA-65B可与业内最佳的Chinchilla-70B和PaLM-540B竞争。

您可能还会对下面的文章感兴趣: