首页>TAG列表
Arctic

Arctic

高品质数据关于言语模型的有效预训练至关关键,但是,,高品质,的准确定义仍未失掉充沛探求,聚焦于代码畛域,论文引入了Arctic,SnowCoder,1.3B,这是一个数据高效的基础代码模型,经过三个阶...

多token预测 Meta等最新钻研 优化大模型推理效率

多token预测 Meta等最新钻研 优化大模型推理效率

GPT,4、Gemini系列、Llama,3等开闭源大模型,理论经常使用的是下一个token预测,Next,tokenPrediction,的损失函数启动预训练,这种方法只管弱小,但有很多局限性,例如...

模型 像人一样操控电脑 更新版 3.5 Anthropic Claude Sonnet

模型 像人一样操控电脑 更新版 3.5 Anthropic Claude Sonnet

在人工智能的翻新之路上,Anthropic公司再次成为焦点,其推出的更新版Claude3.5Sonnet模型引发了宽泛关注与热议,一个外围疑问摆在咱们背地,它真的能够像人一样操控电脑吗,一、模型开展与...

优化大规模并行训练效率的方法 LLM

优化大规模并行训练效率的方法 LLM

一、论断写在前面论文来自阿里巴巴,论文题目,BoostingLarge,scaleParallelTrainingEfficiencywithC4,ACommunication,DrivenAppro...

数据分解方法

数据分解方法

写在前面大家好,我是刘聪NLP,大模型时代,数据至上,如何应用大模型分解更多高品质数据也备受关注,当天给大家分享一个无心思的大模型分解数据方法,MAGPIE,在不须要种子数据和额外人工干预的状况下,开...

缩小多模态模型幻觉 对比调优 谷歌经过数据增强

缩小多模态模型幻觉 对比调优 谷歌经过数据增强

随着Gemini、GPT,4o等模型的产生,具有看、听、说的多模态大模型成为了新的干流,因为训练数据复杂、模型架构过于复杂,在生成、识别内容时很容易产生失误形容也称为,幻觉,,例如,当看到一张蕴含刀、...