首页>TAG列表
浅谈

浅谈

当天给大家带来知乎朋友@ybq一篇对于如何启动畛域模型训练的文章,关键内容是对post,pretrain阶段启动剖析,后续的Alignment阶段就先不提了,留意好老生常谈的,数据品质,和,数据多样性...

小模型 大模型 VS

小模型 大模型 VS

首先,我们思索一个疑问,为什么qwen2基本上是当下最受欢迎的开源模型,说瞎话,相比于deepseek、llama、minicpm这些诚意满满的技术报告,qwen2的技术报告稍显一些,小家子气,,并没...

预料之外的成果 GLM4模型开源 预料之中的尺寸

预料之外的成果 GLM4模型开源 预料之中的尺寸

当天智谱开了GLM,4,9B的模型,不是6B,是9B,一共开源了四个模型,Base版本模型,GLM,4,9B,、Chat版本模型,GLM,4,9B,Chat和GLM,4,9B,Chat,1M,和多模态...

Llama3.1系列模型正式开源 最大405B 闭源模型的统治时代将迎来完结

Llama3.1系列模型正式开源 最大405B 闭源模型的统治时代将迎来完结

Meta开源了Llama3.1系列模型,最大参数规模为405B,开源也是好起来了,榜单目的直逼GPT4,o,开源追上闭源模型不再是梦!Llama系列模型确实是开源界的头部,真金白银砸进去的就是不一样,...

GLM4模型开源 预料之中的尺寸 预料之外的成果

GLM4模型开源 预料之中的尺寸 预料之外的成果

写在前面当天智谱开了GLM,4,9B的模型,不是6B,是9B,一共开源了四个模型,Base版本模型,GLM,4,9B,、Chat版本模型,GLM,4,9B,Chat和GLM,4,9B,Chat,1M,...

浅谈大模型开源和闭源 开源闭源争执不休

浅谈大模型开源和闭源 开源闭源争执不休

写在前面前一阵子的开源和闭源之争炒的比拟炽热,之前不时想写点什么,由于太懒就没写,然而最近开源模型真的太火爆了,前有Grok,1、Mistral,8x22、Llama3,后有Yi,1.5、Deepse...