标签页_萌爵百货商业网

浅谈

2024-11-15 796

当天给大家带来知乎朋友@ybq一篇对于如何启动畛域模型训练的文章，关键内容是对post，pretrain阶段启动剖析，后续的Alignment阶段就先不提了，留意好老生常谈的，数据品质，和，数据多样性...

2024-11-15 909

首先，我们思索一个疑问，为什么qwen2基本上是当下最受欢迎的开源模型，说瞎话，相比于deepseek、llama、minicpm这些诚意满满的技术报告，qwen2的技术报告稍显一些，小家子气，，并没...

2024-11-15 372

当天智谱开了GLM，4，9B的模型，不是6B，是9B，一共开源了四个模型，Base版本模型，GLM，4，9B，、Chat版本模型，GLM，4，9B，Chat和GLM，4，9B，Chat，1M，和多模态...

2024-11-15 294

Meta开源了Llama3.1系列模型，最大参数规模为405B，开源也是好起来了，榜单目的直逼GPT4，o，开源追上闭源模型不再是梦！Llama系列模型确实是开源界的头部，真金白银砸进去的就是不一样，...

2024-11-15 444

写在前面当天智谱开了GLM，4，9B的模型，不是6B，是9B，一共开源了四个模型，Base版本模型，GLM，4，9B，、Chat版本模型，GLM，4，9B，Chat和GLM，4，9B，Chat，1M，...

2024-11-15 269

写在前面前一阵子的开源和闭源之争炒的比拟炽热，之前不时想写点什么，由于太懒就没写，然而最近开源模型真的太火爆了，前有Grok，1、Mistral，8x22、Llama3，后有Yi，1.5、Deepse...