其他货源

竟在拖LLM后腿 ChatGPT LeCun联手开怼RLHF！ Karpathy 秘方

2024-11-15 568

昨天，AndrejKarpathy又发了长推，不过用了一句很有争议的话扫尾——，RLHF只是勉强的RL，这条推特堪称，一石激发千层浪，，瞬间扑灭了LLM社区的探讨激情，毕竟RLHF作为刚提出没几年的方...

2024-11-15 527

当天给大家引见一篇清华大学宣布于NIPS2024中的大模型期间序列预测上班AutoTimes，经常使用大模型启动自回归方式的期间序列预测，并结合In，ContextLearning优化预测成果，论文题...

2024-11-15 612

当天给大家引见一篇清华大学的期间序列预测最新上班，提出了一致的Transformer时序预测模型，能同时处置单变量和多变量时序预测，并将时序预测的高低文长度初次扩大到千级别，论文题目，TIMER，XL...

2024-11-15 272

这篇文章给大家引见一下阿里宣布的多模态大模型上班mPLUG，Owl，共2篇文章，建设在前序图像表征对齐预训练大言语模型的思绪，提出了不同的参数训练模式、多模态解耦映射等优化方法，在多项义务取得了SOT...

2024-11-15 869

1.为什么要提出LightRAG，检索增强生成，Retrieval，AugmentedGeneration，RAG，经过整合外部常识源来加弱小型言语模型，这种整合使LLM能够生成更准确和与高低文相关的...

2024-11-15 912

最近，Meta宣布了两篇和介绍系统关系的大模型上班，这类上班不是讲NLP等畛域的大模型运行到介绍系统，而是间接经常使用介绍系统的数据训练大模型，不时以来，阻碍CTR预估等模型朝大模型开展的一个阻碍是，...