但Anthropic正在成为新宠 OpenAI离不开微软
编辑 | 言征
出品 | 技术栈(微信号:blog51cto)
不久前,OpenAI 和 Microsoft仿佛是无法打败的。但是,如今,他们的竞争对手正在迎头赶上。
巨头支持方面,Anthropic 的 Claude 模型一点都不弱,甚至隐隐有了逾越ChatGPT的趋向。
前不久,Microsoft 支持的 GitHub 已将 Claude 参与到 Copilot,而Amazon一早就已将 Claude 参与到 Q Developer (Code Whispherer)中。
此外,Meta 的 Llama 如今在用户方面可与 ChatGPT 相媲美,是开源及其余畛域众所周知的名字。
相比之下,OpenAI 早些颁布的 o1反应确是喜忧参半。就连 OpenAI 首席口头官Sam Altman都不得不虚心地将该模型称为“用于推理的 GPT-2”,同时称其“存在重大毛病”。
1.Anthropic优先思考工程,OpenAI更关注用户
除了推理才干之外,OpenAI 仿佛更关注语音配置,特意是迎合其最终用户。相比之下,Anthropic仿佛优先思考工程和 API 方面。OpenAI 最近推出了富裕体现力的可控语音,用于语音转语音体验,并经过提醒缓存降低老本。文本输入折扣 50%,音频输入折扣 80%。此举使初级实时 AI 更容易取得。
与此同时,Anthopric 还在尝试在 Claude 移动运行上为特定用户提供语音听写配置,最长可录制 10 分钟。
OpenAI 在 AI 编码方面也面临着来自 Anthropic 的日益强烈的竞争。该公司正在改良自己的工具来处置复杂的编码义务和智能化代码生成等操作,虽然Anthropic 最近推出的“计算机经常使用”配置使其具备好处。“AI 编码还不能齐全取代工程师,须要'一些指点',”Anthropic 联结开创人Daniela Amodei分享道。她还指出,他们的 Claude 形式清楚提高了消费劲,有或许重塑招聘战略。
随着两家公司都在推进 AI 主导位置,OpenAI 行将颁布的版本或许会影响市场,或许会对GitHub Copilot、Cursor和其余编码助手等产品构成应战。
2.用户屏幕交互
Anthropic 经过专一于屏幕导航来增强用户与 AI 的交互。上周,该公司推出了使AI 能够控制计算机屏幕的配置,使其能够代理用户启动阅读网页或打字。
“计算机操作员”是一项试验性的地下测试版配置,经过该配置,Claude 3.5 Sonnet 如今可以以相似于人类用户的方式导航计算机界面。这象征着 AI 可以检查屏幕、移动光标、单击按钮和键入文本,从而准许它口头各种义务。
还有更多。Anthropic 还在 Claude 中推出了其剖析工具。它准许用户经过运转 JavaScript 代码间接在平台中口头数据剖析。仰仗这一点,Anthropic 在 AI 用户体验畛域取得了成功。
此配置在预览形式下也可用,使 Claude 能够处置复杂的义务,例如数据清算和 CSV(逗号分隔值)文件的具体剖析。它旨在经过提供准确的洞察来协助各个职能的团队,旨在协助营销人员剖析客户行为,并协助财务团队创立仪表板。
上个月,Anthropic 向 iOS 和 Android 上的一切用户提供了 Claude Artifacts,使任何人都可以轻松创立运行程序,而无需编写任何代码。
Anthropic 无疑将人类与 AI 的交互方式优化到了一个新的水平。
“虽然 Anthropic 构建了一些依然须要计算机作为界面的物品,但在未来,咱们很或许会分开屏幕,经常使用一种新的设施或界面与 AI 代理启动交互。”
OpenAI 也没有丢弃。在伦敦举行的 OpenAI DevDay 2024 上,该公司的开发人员体验主管Romain Huet展现了 o1 预览版演示,提醒了宿愿和曲折。
经过三次尝试后,Swift 地图运行程序编码停滞不前,但起初,一个演示 o1-mini 和 Cursor 的演示成功地控制了一架无人机,并实现了令人印象深入的后空翻。
OpenAI 还在ChatGPT 桌面运行程序上颁布了一项初级语音配置,不久前,它颁布了一项配置,如今准许用户从ChatGPT 上之前对话中搜查内容。
此外,OpenAI 昨天推出了其搜查引擎。ChatGPT 搜查如今提供改良的网络搜查配置,以取得及时、准确的答案,将人造言语交互与体育、资讯、股票报价等中的最新数据相结合。
3.Masters Voice 配置
最近,OpenAI 为开发人员推出了实时API,使他们能够为其运行程序参与初级语音和人造语音转语音对话配置。此 API 使公司能够构建语音驱动的客户服务系统,这些系统可以处置复杂的义务,从预订游览到经过软件指点用户。
OpenAI 必需正在扼杀它。这个新 API 是ChatGPT 的视觉初级语音形式的裁减,在 API 降级前几天颁布。它提供了六种不同的声响,以及流利的音频输入和输中选项。
例如,用户如今可以经过展现冰箱的照片向 ChatGPT 征询食谱创意,或许经过火享疑问自身的图片来取得数学识题的协助。
此降级相似于Google 的对话式 AI 助手Gemini Live。它宣称可以协助其用户方案优惠、寻求倡导、探讨历史事情,甚至探求新的本地话题和想法。
无须置疑,OpenAI 的 API 降级与依赖多个模型启动语音转录和照应的传统方法构成显明对比。它经常使用 WebSocket 衔接到 OpenAI 最新的 GPT-4o 模型,准许开发人员治理配置并依据用户恳求做出照应。
肥壮公司Healthify Me是早期驳回者之一,他们经过他们的 AI 教练 Ria 经常使用 API 启动实时营养指点。它经常使用OpenAI 的 GPT-4 Turbo和名为Whisper的语音机器学习模型。
目前,Realtime API 依据文本和音频令牌定价。音频输入的多少钱为每 100 万个代币 100 美元,输入的多少钱为每 100 万个代币 200 美元。OpenAI 还在 API 中构建了弱小的安保配置,包括智能滥用检测和人工检查机制。
OpenAI 方案在未来裁减 API 的配置。它旨在支持其余方式,如视频和视觉输入。
与 Anthropic 的 Claude Sonnet 3.5 Artifacts 同样,OpenAI 最近推出了canvas。这是一个与 ChatGPT 一同编写和编码名目的新界面。
并不奇异。OpenAI 用于 ChatGPT 的新画布界面在编码方面与 Anthropic 的 Claude Sonnet 3.5 相差无几,开发人员不时青睐 Claude 在极速生成、调试和学习代码方面的才干。
Flexpa 首席技术官Joshua Kelly说:“按需软件就在这里,”他与 Claude 一同在几秒钟内创立了一个自定义运行程序,强调了 Claude Artifacts 如何经常使用户能够极速开发定制的运行程序,并推进每团体作为潜在运行程序开发人员的愿景。
同时,GitHub 还经过其多模型阵容在编码畛域建立了新规范——Claude 3.5 Sonnet、Gemini 1.5 Pro 以及 OpenAI 的 o1-mini 和 o1-preview。这为 VS Code、Xcode 等带来了无可比较的多配置性和开发人员选用,将 GitHub 定位为满足当今代码生成需求的终极工具包。
4.有钱能使鬼推磨
虽然与去年相比,OpenAI 和 Anthropic 的用户都产生了清楚增长,但它们的创收战略提醒了一模一样的方法。
依据上述剖析,OpenAI 的大局部支出增长来自其 AI 模型(如 ChatGPT)的付费订阅,而 Anthropic 的大局部支出是经过 API 服务取得的。
实时 API 以及语音和语音控制等翻新使 OpenAI 的支出在 2024 年飙升至 40 亿美元,比去年增长 580%。他们的预测收益更令人印象深入,预测标明他们在2025 年或许到达 116 亿美元。
关于 Anthropic 来说,可用性的飞跃促成了支出增长,往年到达 10 亿美元,增长了 1000%,大局部支进去自 API 访问,迎合寻求无缝 AI 集成的开发人员(这一点跟OpenAI往年在开发人员方面发力的做法是相相似的)。
假设没有 Microsoft,OpenAI 简直无法生活。这家科技巨头与 OpenAI 积重难返的协作同伴相关,包括迄今为止投资超越 130 亿美元,如今估量季度盈余将到达 15 亿美元。Microsoft 将这一老本归因于其在 OpenAI 中的股权,由于后者面临不时参与的费用以维持其极速增长。
想了解更多AIGC的内容,请访问:
AI.x社区