RAG真正的难点不是向量数据库 而是实时企业数据管道!这家公司做到了

编辑 | 言征

出品 | 技术栈(微信号:blog51cto)

企业部署GenAI须要RAG,而RAG须要向量数据库,向量数据库曾经成为企业部署人工智能的外围要素。但这还远远不够,企业级别的RAG要复杂得多。

1.向量数据库并非真正的难点

克里斯·拉蒂默(Chris Latimer)是初创公司Vectorize的首席执行官兼联结开创人,他曾在DataStax上班数年,时期协助指导了该数据库供应商的云端上班。他重复遇到的一个疑问是,关于成功企业RAG而言,向量数据库并非真正的难点所在。疑问的难点在于,如何将以各种模式存在的非结构化数据优化并导入向量数据库,以便为生成式人工智能(AI)提供良好的支持。

正因如此,拉蒂默仅在十个月前创立了Vectorize,旨在协助处置这一应战。

如今,该公司宣称在由True Ventures领投的种子轮融资中筹集了360万美元。与此同时,该公司还发表其企业RAG平台已正式推出。Vectorize平台能够实现代理式RAG方法,提供近乎实时的数据才干。

Vectorize专一于AI的数据工程方面。该平台协助公司为在向量数据库和大型言语模型中经常使用数据做好预备并启动保养。Vectorize平台还经过直观的界面,使企业能够极速构建RAG数据管道。另一项外围性能是RAG评价性能,它准许企业测试不同的方法。

“咱们始终看到人们在他们的生成式AI名目开发周期完结时发现,名目并未取得良好成果,”Vectorize的联结开创人兼首席执行官克里斯·拉蒂默在接受VentureBeat独家采访时示意。“他们为向量数据库失掉的高低文对大型言语模型来说并非最有用的,它仍在发生幻觉或曲解数据。”

2.Vectorize如何融入企业RAG架构

Vectorize自身并不是一个向量数据库。雷同,它是一个将非结构化数据源衔接到现有向量数据库(如Pinecone、DataStax、Couchbase和Elastic)的平台。

拉蒂默解释说,Vectorize会排汇并优化来自不同源的数据,以供向量数据库经常使用。该平台将提供一个消费就绪的数据管道,担任数据摄取、同步、失误处置以及其余数据工程的最佳通常。

Vectorize自身也不是一种向量嵌入技术。将数据(无论是文本、图像还是音频)转换为向量的环节,就是向量嵌入的所有内容。Vectorize协助用户评价不同的嵌入模型和数据分块方法,以确定最适宜企业特定用例和数据的性能。

拉蒂默解释说,Vectorize准许用户从恣意数量的不同嵌入模型中启动选用。这些不同的模型或者包含OpenAI的ada,甚至是Snowflake正在驳回的Voyage AI嵌入。

“咱们确实会思索将数据向量化的翻新方法,以确保您取得最佳结果,”拉蒂默说,“但最终,咱们以为其价值在于为企业和开发人员提供一个消费就绪的处置打算,让他们不用再担忧数据工程方面的疑问。”

3.应用代理式AI驱动企业RAG落地

Vectorize的一项关键翻新是其“代理式RAG”方法。该方法将传统的RAG技术与AI代感性能相结合,使运行程序能够更自主地处置疑问。

代理式RAG也并非一个假定性的概念。Vectorize的早期用户之一、AI推理硅芯片初创公司Groq就曾经在经常使用它。Groq最近筹集了6.4亿美元资金。Groq正在应用Vectorize的代理式RAG性能来驱动一个AI支持代理。该代理可以自主应用Vectorize数据管道提供的数据和高低文来处置客户疑问。

“假设客户的疑问之前曾经被问过并失掉了回答,那么咱们宿愿这个代理能够处置客户的疑问,而无需人类介入,”拉蒂默说,“但假设代理不可处置疑问,咱们宿愿有一团体类介入的环节,以便启动更新处置。因此,代理能够经过推理来处置疑问的理念,正是AI代理架构面前的全体理念。”

4.为什么实时数据管道对企业RAG至关关键

企业经常使用检索增强生成的一个关键要素是衔接到其自身的数据源。但雷同关键的是确保数据的实时性。

“古老的数据会造成古老的决策,”拉蒂默说。Vectorize提供了实时和近乎实时的数据更新才干,客户可以依据自身对数据古老度的容忍度启动性能。

“咱们实践上准许用户依据对数据古老度的容忍度和对实时数据的需求来性能平台,”他说,“因此,假设您只有要将管道设置为每周运转一次性,咱们可以满足您的需求;而假设您须要实时运转,咱们也可以满足,并且您可以在数据可用时立刻取得实时更新。”

参考链接:

本文转载自​ ​技术栈​ ​,作者:言征

您可能还会对下面的文章感兴趣: