首页>TAG列表
纯MLP模型到达新SOTA 基于序列

纯MLP模型到达新SOTA 基于序列

当天给大家引见最近的一篇探求如何在更好地建模通道,channel,之间的相关性的多元期间序列文章,文章旨在处置通道独立,channelindependent,方法不足对通道之间相关性的应用,以及通道依...

SHAP 参数搜查战略在轴承缺点诊断中的运行 模型可视化

SHAP 参数搜查战略在轴承缺点诊断中的运行 模型可视化

前言本文基于凯斯西储大学,CWRU,轴承数据,经常使用特色提取和机器学习方法启动缺点识,而后基于XGBoos模型引见一种参数搜查战略,并经过SHAP模型可视化技术对结果启动剖析,可视化结果图,十分类混...

实测腾讯开源的Hunyuan

实测腾讯开源的Hunyuan

当天突然发现腾讯开源混元大模型,十分震惊,腾讯也来挤开源赛道了,只能说大模型开源越来越冷落了,这次开源的重要是MoE模型,有Base模型和Instruct模型,总参数量389B,激活参数52B,允许最...

将端侧大模型启动究竟

将端侧大模型启动究竟

面壁不时都在做端侧大模型,之前有文本系列MiniCPM,2B模型,还有多模态系列的MiniCPM,V系列模型,当天又开源了MiniCPM3,4B模型,真是端侧一路走到低,这次MiniCPM3,4B也是...

LLM通常系列

LLM通常系列

通过了数据搜集、挑选、去重,马上就可以开局训练试验了,然而在试验之前,咱们还须要先失掉一个言语模型的基石,分词器,Tokenizer,Tokenizer的作用是对一条文本数据启动切分、词表映射,失掉这...

11B和90B多模态模型 Llama3.2开源 Meta颁布1B和3B端侧模型

11B和90B多模态模型 Llama3.2开源 Meta颁布1B和3B端侧模型

早上起来发现,MetaAI又开源模型,文本模型开源了端侧小模型1B和3B模型,也是初次开源了多模态大模型11B和90B两个版本;同时还开源了一个LlamaStack名目,Blog,https,ai.m...