IBM重磅颁布Granite 3.0秒杀同级别大模型

2024-11-14

大模型畛域的开展突飞猛进，每天都有许多幽默的论文值得深化品读。上方是本期感觉比拟无心思的论文：

1、大模型要"断粮"了？最新综述提醒AI数据困境与包围之道

2、IBM重磅颁布Granite 3.0：8B参数秒杀同级别大模型，还能随意商用！

3、世界首个39言语多模态大模型开源，告别"英语霸权"

人工自动畛域有一个幽默的悖论：模型越来越大，但优质数据的增长速度却远远跟不上。就像一个始终长大的孩子，却发现食物供应越来越弛缓。最新宣布的一篇综述论文深化讨论了这个迫在眉睫的疑问，并为咱们指明了打破的方向。

面对这个困境，钻研人员提出了两种处置打算：数据增强和数据分解。便捷来说，就是让AI学会"变废为宝"和"无事生非"。数据增强就像是把一份食材烹饪成多种美味佳肴，而数据分解则是让AI自己发明出新的"食材"。这些方法不只能处置数据充足的疑问，还能协助AI学习得更好、更片面。

但这个畛域并非善报多磨。就像复制的食物或者缺少营养一样，分解数据也面临着品质、伦理和牢靠性等多重应战。如何确保分解数据的实在性？如何防止发生有害信息？如何评价这些数据的成果？这些都是亟待处置的疑问。

这篇综述初次片面梳理了大言语模型在数据分解和增强方面的最新停顿，从模型的预训练、微调到详细运行等全生命周期启动了系统剖析。更关键的是，它为未来钻研指明了方向，让咱们看到了AI打破"数据天花板"的宿愿。这就像为正在生长的AI预备了一份可继续开展的营养打算，让它能够肥壮、继续地生长。

论文题目：A Survey on>论文链接：

在大模型竞争强烈的当下，IBM带来了一个重磅信息：颁布了全新的Granite 3.0模型系列。这个系列最大的亮点是，在仅有8B参数的状况下，性能居然逾越了广受欢迎的Llama 3.1-8B和Mistral-7B模型，可谓轻量级模型中的性能王者！

更让人兴奋的是，Granite 3.0驳回了Apache 2.0容许证，这象征着企业可以毫无顾忌地将其用于商业用途。不同于市面上诸多限度重重的开源模型，Granite 3.0给企业提供了充沛的经常使用自在，可认为所欲为地启动定制和部署。

这个模型系列共推出了四个版本，既有传统的dense模型（2B和8B参数），也有翻新的专家混合模型（实践仅需激活M到800M参数）。每个版本都通过了海量数据训练（高达12万亿个token！），并且原生允许多言语、编程、函数调用等配置，在企业级义务上体现杰出。

论文题目：GRANITE 3.0 LANGUAGE MODELS

论文链接：

构想一下，一个印度农民用母语向AI征询作物病虫害，一个非洲在校生用外地言语求教数学题，一个中国老人用个别话和AI聊天......这不再是科幻，由于PANGEA的降生让这一切成为事实！这个打破性的多言语多模态大模型允许39种言语，让AI真正走进了世界各个角落。

与以往"英语至上"的AI模型不同，PANGEA特意器重文明多样性和言语容纳性。钻研团队精心打造了一个蕴含600万条多言语指令的训练数据集，不只蕴含高品质的多言语翻译，更融入了丰盛的文明元素。这就像给AI装置了一个"文明翻译器"，让它能够真歪了解并尊重不同文明背景用户的需求。

试验结果令人振奋！在14个数据集的片面测试中，PANGEA在英语义务上上游其余开源模型7.3分，在多言语义务上更是遥遥上游10.8分。它不只能看懂图片、回答疑问，还能了解不同文明背景下的纤细差异，在某些义务上甚至能与GPT-4和Gemini这样的商业巨头模型一较上下。

更让人兴奋的是，钻研团队选用齐全开源这个模型，包括训练数据、评价基准和代码所有地下。这象征着，一个愈加容纳、偏心的AI时代行未来到，让世界每个角落的用户都能对等地享用AI带来的便利。

论文题目：Pangea: A Fully Open Multilingual Multimodal LLM for 39 Languages

论文链接：

本文转载自，作者：

<<什么是多模态大模型