首页>TAG列表
没有等来Qwen2.5 但等来了Qwen2

没有等来Qwen2.5 但等来了Qwen2

Qwen2又出新作Math大模型,你值得领有,我没有等来Qwen2.5,但等来了Qwen2,Math,在数学推理才干上大幅度提高,先来一张图阵阵场子,72B模型超越GPT4,o、Claude,3.5,...

浅谈

浅谈

当天给大家带来知乎朋友@ybq一篇对于如何启动畛域模型训练的文章,关键内容是对post,pretrain阶段启动剖析,后续的Alignment阶段就先不提了,留意好老生常谈的,数据品质,和,数据多样性...

小模型 大模型 VS

小模型 大模型 VS

首先,我们思索一个疑问,为什么qwen2基本上是当下最受欢迎的开源模型,说瞎话,相比于deepseek、llama、minicpm这些诚意满满的技术报告,qwen2的技术报告稍显一些,小家子气,,并没...

预料之外的成果 GLM4模型开源 预料之中的尺寸

预料之外的成果 GLM4模型开源 预料之中的尺寸

当天智谱开了GLM,4,9B的模型,不是6B,是9B,一共开源了四个模型,Base版本模型,GLM,4,9B,、Chat版本模型,GLM,4,9B,Chat和GLM,4,9B,Chat,1M,和多模态...

Llama3.1系列模型正式开源 最大405B 闭源模型的统治时代将迎来完结

Llama3.1系列模型正式开源 最大405B 闭源模型的统治时代将迎来完结

Meta开源了Llama3.1系列模型,最大参数规模为405B,开源也是好起来了,榜单目的直逼GPT4,o,开源追上闭源模型不再是梦!Llama系列模型确实是开源界的头部,真金白银砸进去的就是不一样,...

GLM4模型开源 预料之中的尺寸 预料之外的成果

GLM4模型开源 预料之中的尺寸 预料之外的成果

写在前面当天智谱开了GLM,4,9B的模型,不是6B,是9B,一共开源了四个模型,Base版本模型,GLM,4,9B,、Chat版本模型,GLM,4,9B,Chat和GLM,4,9B,Chat,1M,...