标签页_萌爵百货商业网

讨论

2024-11-15 282

以chatgpt为起始节点的大模型技术经过了两年左右的开展，大抵积淀了一些较为确定的钻研畛域，首先是基座大模型的钻研，关键是国际外大厂集中少量财力、人力、算力启动大模型军备比赛，希图将大模型的基础才干...

2024-11-15 906

当天突然发现腾讯开源混元大模型，十分震惊，腾讯也来挤开源赛道了，只能说大模型开源越来越冷落了，这次开源的重要是MoE模型，有Base模型和Instruct模型，总参数量389B，激活参数52B，允许最...

2024-11-15 827

面壁不时都在做端侧大模型，之前有文本系列MiniCPM，2B模型，还有多模态系列的MiniCPM，V系列模型，当天又开源了MiniCPM3，4B模型，真是端侧一路走到低，这次MiniCPM3，4B也是...

2024-11-15 533

通过了数据搜集、挑选、去重，马上就可以开局训练试验了，然而在试验之前，咱们还须要先失掉一个言语模型的基石，分词器，Tokenizer，Tokenizer的作用是对一条文本数据启动切分、词表映射，失掉这...

2024-11-15 516

大家好，我是刘聪NLP，大模型曾经展现出了较强的文本生成才干，但随着经常使用场景变得越加复杂和严厉，除了防止生成误导或不当舆论内容外，往往还宿愿可以满足用户的不凡需求，而可控文本生成就是为了在坚持文本...

2024-11-15 568

早上起来发现，MetaAI又开源模型，文本模型开源了端侧小模型1B和3B模型，也是初次开源了多模态大模型11B和90B两个版本；同时还开源了一个LlamaStack名目，Blog，https，ai.m...