首页>TAG列表
逾越GPT4的Agent 我用代码成功了!

逾越GPT4的Agent 我用代码成功了!

Agent开发的四种设计形式在吴恩达传授的演讲中,他提到了四种可以清楚优化AI智能体功能的设计形式,反思,Reflection,的深度解析在吴恩达传授提出的AI智能体上班流中,反思,Reflectio...

在消费级GPU上奔跑的 瘦子 WordLlama

在消费级GPU上奔跑的 瘦子 WordLlama

DavidMiller示意该模型的指标很明白,弥合尖端AI钻研和实践运行之间的差距,他意识到,许多现有NLP模型须要少量的计算资源,并且通常局限于专有系统,从而限度了它们的可访问性,作为回应,Word...

1.5开源来袭 Jamba前生今世

1.5开源来袭 Jamba前生今世

Jamba算是环球上第一款基于Mamba的消费级别的模型,近日AI21Labs颁布Jamba1.5系列开明模型,包含Jamba1.5Mini和Jamba1.5Large,这些模型建设在陈腐的SSM,T...

多模态大模型 基础架构

多模态大模型 基础架构

大模型技术论文一直,每个月总会新增上千篇,本专栏精选论文重点解读,主题还是围绕着行业通常和工程量产,若在某个过程发生卡点,可以回到大模型必备声调或许LLM面前的基础模型从新阅读,而最新科技,Mamba...

深化留意力机制 LLM基础模型系列

深化留意力机制 LLM基础模型系列

大模型技术论文始终,每个月总会新增上千篇,本专栏​​精选论文​​​重点解读,主题还是围绕着行业通常和工程量产,若在某个环节发生卡点,可以回到​​大模型必备声调​​​或许​​LLM面前的基础模型​​​新...

MLC vLLM AI架构系列 LMDeploy

MLC vLLM AI架构系列 LMDeploy

训练大型言语模型以及微调的教程亘古未有,但关于在消费环境中部署它们并监控其优惠的资料相对稀缺,上章节提到了未来云原生的AI是趋向,但是触及到云原生会比拟偏技术,而在此之前为了处置大模型部署量产的疑问,...