首页>TAG列表
1024特意直播 AI新职人生活指南

1024特意直播 AI新职人生活指南

主题,AI新职人生活指南期间,10月23日嘉宾,云问科技首席算法架构师刘聪中科院初级工程师EagleAI作者李明宇掌管人,薛彦泽51CTI媒体主编话题,1、AI让岗位变得更容易跨界了吗,2、这一波AI...

大幅降低区分度低的复杂多文档RAG的幻觉疑问 先进的多文档问答 框架HiQA MDQA

大幅降低区分度低的复杂多文档RAG的幻觉疑问 先进的多文档问答 框架HiQA MDQA

背景检索增强生成,RAG,迅速推动了言语模型畛域,特意是在问答,QA,系统,经过在照应生成阶段集成外部文档,RAG清楚提高了言语模型的准确性和牢靠性,这种方法提高了照应的品质,并降低了幻觉的频率,其中...

MoE HunYuan 计算量和 LLM 参数量 MFU 等 聊一聊

MoE HunYuan 计算量和 LLM 参数量 MFU 等 聊一聊

一、背景最近在看腾讯最新混元大模型的Paper时,[2411.02265]Hunyuan,Large,AnOpen,SourceMoEModelwith52BillionActivatedParame...

Text2SQL 新一代处置打算Tool

Text2SQL 新一代处置打算Tool

​在互联网时代,数据迸发式增长,假设高效的剖析数据成为一个亟待处置的疑问,SQL是数据剖析师的罕用工具,编写高效的SQL须要用户具有必定的IT基础,关于个别人员来说存在必定门槛,Text,to,SQL...

一文读懂LoRA 优雅谈大模型

一文读懂LoRA 优雅谈大模型

Microsoft于2021年推出的LoRA是一种经济型微调模型参数的方法,如今大模型的参数规模动不动都在10亿级别以上,微调大模型,微调这里代表着SFT,例如读者将某个大模型拿到自身畛域,想经常使用...

一文详解MHA MQA原理 GQA LLM

一文详解MHA MQA原理 GQA LLM

前言本文回忆一下MHA、GQA、MQA,具体解读下MHA、GQA、MQA这三种经常出现留意力机制的原理,图1MHA、GQA、MQA一览self,attentionself,attention在自留意力...