其他货源

AI架构系列去其形而留其意

2024-11-15 789

最近很多的咨询都在问我相反的疑问，如何将LLM集成到垂直畛域的业务场景，这里提到的场景当然这些场景不再是生成式运行，而是较为专业的畛域，我翻了一篇三月份的论文，以这篇论文来回答读者的疑问，其实就是要将...

2024-11-14 196

当蠢才享GoogleResearch的一篇文章，或者OpenAIo1也驳回了相似的技术，题目是STaR，BootstrappingReasoningWithReasoning，这篇文章提出了一种应用言...

2024-11-14 307

1.最强开源模型要易主了，2天前，英伟达颁布了其最弱小言语模型Nemotron，4340B模型家族，包括Nemotron，4，340B，Base、Nemotron，4，340B，Instruct和Ne...

2024-11-14 509

学习机器学习的人大局部都知道怎样设计并训练一个模型，但开发模型的目标是为了处置业务疑问，所以怎样经常使用大模型也是重中之重，刚训练好的大模型理想上只管可以用，但因为没有用户接口，所以只能自己用，不可对...

2024-11-14 200

论文链接，https，arxiv.org，pdf，2410.18035低秩顺应，LoRA，及其专家混合，MOE，变体是十分有效的参数高效微调，PEFT，方法，但是，由于在Transformer层中增加...

2024-11-14 265

本文提出了mllm，NPU，这是第一个有效应用设施上神经处置单元，NPU，卸载的LLM推理系统，mllm，NPU的关键设计指标是缩小预填充提前和能耗，它针对干流的仅解码器的变压器架构的LLM，例如Ll...