国际大模型代理商的骚操作
“环球就是一个渺小的草台班子,而很多看起来矮小上的场景,面前就是一个low的不能再low的处置模式”
对大模型有过了解的人应该都知道,全体来说国外的大模型要比国际的强;但由于封禁的要素造成国际无法间接经常使用国外的大模型,因此对一些做大模型运行的人和企业来说,要想经常使用国外的大模型只要一个方法,那就是找一些两边商,经过他们的转发服务来调用国外大模型。
假设是那种反常的国外大模型服务商还比拟好对接,但其中有这么一种服务商,那就是他们自己是做大模型产品的,自己做产品,自己做模型;因此这类的服务商有一个疑问就是由于他们是齐全敞开式的产品,因此他们不会对外提供API接口,但由于他们产品做的还不错,因此有些人就想经常使用他们的服务。但前面说了,他们又不对外提供API接口,这个该怎样办?
两边商是怎样调用国外大模型的
或者这里有人曾经有不懂了,既然他们不提供API接口,哪些两边服务商为什么可以提供这种服务?
想到这里,你就曾经发现了疑问的所在;俗话说,有需求就有市场,为了处置这个疑问有一些两边商就想到了一些“鬼点子”也就是骚操作。
那他们是怎样做的呢?
既然你们不提供API,但你们提供产品啊;所以,这些两边商就经过模拟失罕用户的操作,比如登陆那些模型服务商的系统,而后模拟用户设置条件,模拟点击,最后把失掉的结果前往给调用方。
说到这里有些人应该就曾经明确了,这就是典型的爬虫技术,只不过经常使用的是比拟便捷的,也是最费事的无头阅读器+智能化爬虫工具去模拟用户的操作。
说到这里或者有些对爬虫不了解的人还是一脸懵逼;所以这里就便捷解释一下。
比如说咱们想经常使用chatGPT的配置,但咱们又不想花钱,这时该怎样办呢?
既然你chatGPT的接口都要不要钱,然而他们的网页版配置局部是不要钱的;因此,我就可以经过经常使用阅读器启动操作,比如关上chatGPT的官方地址,点击创立会话,输入揭示词,失掉结果等等一系列流程。
这种模式齐全就是个别用户的反常操作行为,因此chatGPT也不会对这种操作启动监管。
然而人的期间和精神都是有限的,总不能两边商在自己的系统中接纳调用方的揭示词,然前人工输入到chatGPT的聊天框中,这是无法能的,而且也忙不上来。
因此,这时智能化爬虫工具的作用就表现进去了,这种工具可以经过设置参数来模拟用户的行为。
技术原理就是,阅读器的面前是一段html和js, css代码,不论是输入框还是提交按钮等都有其节点id;因此智能化爬虫工具就可以经过解析网页代码,去失掉这些关键的节点数据,而后再模拟鼠标和键盘的操作,使得其像一个反常人启动操作。
而且,由于是程序智能口头,也就处置了人工处置的速度和效率疑问。因此反常状况下,相似于这种网页不会有大的变化,比如无法能当天输入框在这里,明日在哪里。
这样,等这些大模型服务商的服务启动照应时,两边商再经过节点失掉到照应结果前往给调用方。
这也是网页爬虫比拟干流的操作模式之一,这种模式相对比拟便捷,由于不须要对接口启动逆向破解等操作。只要要模拟反常的用户操作就可以了。
而为了加极速度,由于这些智能化工具不会配合反常的阅读器启动经常使用,由于这种模式太费事,而且资源占用率高,效率低;因此,他们会经常使用另一种无头阅读器启动操作,所谓的无头阅读器就是没有页面的阅读器,用户看不到操作环节,但它又确实可以像阅读器一样去访问网站。
这也是为什么这些两边商的服务特意不稳固的要素,由于哪些模型服务商他们也会采取一些反爬措施,比如两边商不能启动高频访问,比如一团体无法能再一秒中操作几十个义务,但智能化工具却可以。
其次,两边商经常使用的账号也须要经常改换,毕竟失罕用户也无法能一天二十四小时,每天大中午的还在操作。
当然,除了爬虫之外还有一些相似于RPA(机器人流程智能化)的系统来模拟这些流程化的操作;但实质上都是经过爬虫技术来成功这种模式。
所以说,环球是个草台班子,咱们认为的矮小上的物品,理想上面前是一些构想不到的骚操作。
原文链接: