浅谈
当天给大家带来知乎朋友@ybq一篇对于如何启动畛域模型训练的文章,关键内容是对post,pretrain阶段启动剖析,后续的Alignment阶段就先不提了,留意好老生常谈的,数据品质,和,数据多样性...
小模型 大模型 VS
首先,我们思索一个疑问,为什么qwen2基本上是当下最受欢迎的开源模型,说瞎话,相比于deepseek、llama、minicpm这些诚意满满的技术报告,qwen2的技术报告稍显一些,小家子气,,并没...
预料之外的成果 GLM4模型开源 预料之中的尺寸
当天智谱开了GLM,4,9B的模型,不是6B,是9B,一共开源了四个模型,Base版本模型,GLM,4,9B,、Chat版本模型,GLM,4,9B,Chat和GLM,4,9B,Chat,1M,和多模态...
Llama3.1系列模型正式开源 最大405B 闭源模型的统治时代将迎来完结
Meta开源了Llama3.1系列模型,最大参数规模为405B,开源也是好起来了,榜单目的直逼GPT4,o,开源追上闭源模型不再是梦!Llama系列模型确实是开源界的头部,真金白银砸进去的就是不一样,...
GLM4模型开源 预料之中的尺寸 预料之外的成果
写在前面当天智谱开了GLM,4,9B的模型,不是6B,是9B,一共开源了四个模型,Base版本模型,GLM,4,9B,、Chat版本模型,GLM,4,9B,Chat和GLM,4,9B,Chat,1M,...
浅谈大模型开源和闭源 开源闭源争执不休
写在前面前一阵子的开源和闭源之争炒的比拟炽热,之前不时想写点什么,由于太懒就没写,然而最近开源模型真的太火爆了,前有Grok,1、Mistral,8x22、Llama3,后有Yi,1.5、Deepse...