产品

MemLong 用于长文本建模的记忆增强检索

2024-11-14 310

一、论断写在前面论文题目，MemLong，Memory，AugmentedRetrievalforLongTextModeling论文链接，https，arxiv.org，pdf，2408.1696...

2024-11-14 641

1、LLM训练的保密危机，1%的分解数据或致模型解体在LLM极速开展的当天，一个令人担心的现象正悄悄发生——模型解体，钻研发现，即使在训练数据中仅蕴含1%的分解数据，也或者造成LLM模型功能重大降低，...

2024-11-14 522

一、论断写在前面论文题目，Smaller，Weaker，YetBetter，TrainingLLMReasonersviaCompute，OptimalSampling论文链接，https，arx...

2024-11-14 557

一、论断写在前面论文题目，ModelMerginginLLMs，MLLMs，andBeyond，Methods，Theories，ApplicationsandOpportunities论文链接，...

2024-11-14 702

技术的外围只要两点，一个是把技术做好，一个是把技术用好，在之前的文章中曾经说过，预训练和微调是为了打造一个更好用的大模型，而揭示学习是为了更好的经常使用大模型，激起大模型的潜能，而基于揭示学习开展起来...

2024-11-14 622

2022年底，ChatGPT上线，同时引爆了一个新的名词，提醒工程，PromptEngineering，简而言之，提醒工程就是寻觅一种编辑查问，query，的方式，使得大型言语模型，LLM，或AI绘画...