首页 纸飞机账号购买内容详情

目前市场上似乎只有三类真正可行的 AI 产品

2026-03-13 6 纸飞机账号购买

今天我们为大家带来这样一篇文章,文章的作者作出一个判断,这个判断既犀利又冷静,其内容是,在AI热潮处于喧嚣状态的背后,当下真正能够产生实际效果的大语言模型产品。仅仅只有三类,分别是Chatbots,还有智能补全产品,以及智能体。

文章对这三种产品形态的生存逻辑以及潜在困境展开了深入剖析,作者表明,Chatbots尽管受众最为广泛,然而却遭遇了“与模型本体竞争”这般尴尬的情形,并且在特定场景当中,其聊天界面的交互效率相较于传统UI要逊色许多;智能补全产品(就像GitHub Copilot)凭借“无感嵌入”工作流程收获了成功,这证实了不改变用户习惯才是最为理想的赋能途径;而身为新秀的智能体,目前正在编码等领域借助自主规划以及执行展露出来巨大的潜能。另外,作者还具有前瞻性地对那作为未来形态的AI生成的信息流以及AI游戏的可能性展开了探讨,并且极为犀利地指出了当下行业存在的大量资源仍旧消耗于同质化竞争范畴内的现状。

作者 | Sean Goedecke

编译 | 岳扬

首款以大语言模型作为基础所在依托的产品GPT,其承载具备的功能仅仅只是和模型自身本身展开对话交流:也就是说,是一个完完全全纯粹质的聊天机器人程序。直到如今这个时候,它始终一直保持是最受大众欢迎喜爱的大语言模型产品,而且远远地处于领先的位置状态。

事实上,鉴于该行业所投入资金规模,存在一点极为让人惊愕,居然会有这般多“新AI产品”仅仅只是chatbot罢了。依我所知,当下真正行得通的AI产品仅有三类。

01 Chatbots

AI热潮开始兴起时的头几年,所有大语言模型产品,本质上都是chatbots。它们被贴上了各种各样的标签,也许这个LLM能够读取你的邮件,那个可以处理公司的客服文档,但其核心功能一直都没有改变:用自然语言与模型进行聊天。

chatbots面临的困境是,最好的chatbots产品,实际上是模型本体。用户想要与LLM对话,绝大多数需求是通用的,比如问个问题,比如求点建议,比如倾诉心事,又或者做其他一百种和你这个具体产品毫无关联的事。

用另外的话来讲,你的使用者会很快扭头去选用GPT^2。AI实验室相较于你存在两个具有决定性的优势:其一,他们总是能够比你更早地运用上最为前沿的模型;其二,他们在训练模型之际,能够同步对配套的聊天框架进行打磨(就如同Anthropic会专门针对Claude Code的使用场景来对模型进行微调,OpenAI也会为Codex做诸如这般的适配)。

1.1 露骨的、成人向的角色扮演

要想让你的chatbots产品超越GPT,存在一条途径:去开展OpenAI不想触碰的事情,像是扮演AI男友,又或是生成成人内容。当下这类产品已然构建起了一个有着可观利润的小众市场,它们一般借助能力稍逊但限制更少的开源模型。

这类产品,自然也是存在着我先前说过的那一些问题的。然而,关键之处在于:当你的需求属于露骨的、成人向的AI角色扮演,并且GPT和Claude又果断不涉及这一方面的时候,即便它们的能力稍微弱一些,那也是没有关系的 —— 只要你能够使用上,那就已经足够了。

在我个人看来,这类产品有着严重的伦理方面的争议。然而话又讲回来,就算把道德这一层面摆到一边去,仅仅从商业层面的角度来讲,随着大型AI实验室在成人内容边界这一问题上越来越“不拘谨”,这个细分的领域极有可能逐步被它们给侵占。Grok Companions已经朝着这个方向开展探索了,并且Sam Altman也公开表明,未来OpenAI的模型对于生成成人内容会持有更加开放的态度。

1.2 带工具的 Chatbots

有一个 chatbots 的变体,这种变体给模型配置“工具”,如此一来,你不只是能够和日历进行闲聊,还可以让 chatbots 帮你去安排会议等事项,这类产品一般被称作“AI 助手”。

然而,这样的产品常常在效果方面不太理想,这是由于那些精明的用户总是能够依靠自己寻找途径实施“诱导”行为,使得 chatbots 去调用工具,所以你始终都会处于一种不敢给予客服 chatbots 真正类似于客服操作权限的状态,就好像“给客户退款”这种权限,一旦你进行了这样的操作,那成千上万的人马上便能摸索出能够越出限制的讲话方式,最终促使机器人顺从地给那些人转账打钱。最终,你能够配备给chatbots的,仅仅是那些用户自身也能够去完成的操作,然而这般做的话,你的chatbots实际上是在与你自家产品的原生体验展开竞争,并且很有可能会输掉这场竞争。

为何你的聊天机器人会失败呢?原因在于聊天自身并非是个便于使用的交互方式呀。当用户只需按下“Ctrl+加号”或者点击 button3 便能将字体放大时,他们确实是懒得去敲上一句“嘿,能帮我把字体调得更大一些吗”。

我觉着这对于工程师而言是个颇难接纳的教训,我们极易滋生出一种错觉,即既然chatbots的能力提升了一百倍,那么在诸多任务上理应已然是最佳的交互方式了,是这样吗?可事实却是,它们在起始阶段比传统用户界面差了二百倍,故而即便进步极为迅速,如今依旧差劲一倍。

02 智能补全产品

第二款具有真正意义的 AI 产品,实则比 GPT 问世的时间更早,它就是 GitHub Copilot。当初,Copilot 产品,以及所有类似的模仿者,像 Cursor Tab,其核心理念是:运用一个快速的 LLM 来充当智能自动补全工具。把用户实时输入的代码投喂给模型,代码编辑器能够给出自动补全建议,甚至直接帮用户写完剩余的函数,或者文件。

此类产品的巧妙之处在于,使用者根本用不着跟模型进行对话。就像我之前讲的那样,那种把纯文本对话当作核心交互形式的产品界面,可不是一种好用的用户界面。借助LLM生成的补全内容,能让使用者在不改变现有工作流程任何一个环节的情况下,就能够享受到AI模型的能力:他们所看到的仅仅是编辑器原本就会给出的自动补全建议,只是要强大许多。

让我略微感到诧异的是,于编程范畴之外,基于补全的产品并未火爆起来,在编程领域,它们可是瞬间就缔造了一个价值达数十亿美元的市场,Google Docs以及Microsoft Word均具备类似的功能,为何这一事物没有引发更多的轰动呢?

03 智能体

是编码智能体(coding agent),它属于第三款真正意义上的 AI 产品。这个概念众人已讨论好些年,然而直至 2025 年,支撑编码智能体的技术才切实变得可行(这得益于 Claude Sonnet 3.7,以及后续的 GPT-5-Codex)。

智能体于交互形式方面有些类似chatbots,用户是以输入自然语言的方式跟它开展沟通的。然而关键的区别是,你仅仅下达一回指令,模型便会携着你的初始需求离去,能够自主去完成需求实现、测试等一整套流程。

体能跑通能实现智能化,然而“带有工具的聊天机器人”却常常遭遇挫折,其核心差异在于:前者是促使语言模型自主进行规划,进而执行一整套繁杂的操作,后者仅仅是让它协助你去点击一个按钮。尽管单独的操作对于人类而言更易于施行,可是如今的智能体语言模型已然足够聪慧,可以接手涵盖全部进程。

编码智能体可以成为 AI 智能体的理想应用场景,它存在着两个缘由:

我觉得,当前这个价值高达数十亿美元的问题在于,AI智能体可不可以在编程之外的任务里发挥功效呢?要记住,Claude Sonnet 3.74发布到现在还不到九个月。在这段时期内,科技行业已经围绕行业内的工作成功打造出了智能体产品。然而,面向其他任务的智能体产品,才刚刚启动。它们最终能不能成功,又会以怎样的形态呈现,仍然有待去观察。

3.1 研究智能体(research agent)

有另外一类并不牵涉编码的智能体,这就是研究智能体,LLM在处理诸如“快速浏览十页搜索结果”,包括“在海量数据集中借助关键词检索某一主题的相关信息”这类任务方面格外擅长,我自己常常运用这个功能去处理各类事情。

当前,是存在着一些借助此能力构建而成的AI产品的,像Perplexity即是这样。于大型AI实验室的内部环境之中,这类功能常常是被融入到chatbots产品线里的:举例来说,OpenAI的“深度研究”,它从原本独立的功能,转变成为了GPT - 5 - Thinking能够自动去执行的操作。

按照我的想法,就特定垂直领域那儿,像医疗或者法律这些,去打造专属的研究智能体,基本上必定是蕴含潜力的逗号且是那样的标点句号。

04 信息流

倘若讲智能体是近期取得成功的AI产品,那么AI所生成的信息流或许便是即将出现的那一个,各大AI实验室当下正致力于为用户塑造无限滚动、高度个性化的内容流。

虽说当下这些人工智能信息流产品尚未做成,不过鉴于大家原本就热衷于刷手机,因而只要这条路能够走通,那么前景便是颇为广阔的。在我看来,五年之后,绝大多数互联网用户会耗费大量时间去刷人工智能生成的信息流,这绝对是存在可能性的。

一类鉴于智能补全等的产品与之相像,信息流具备的优势是,用户不必和chatbots进行交互。模型的输入源自用户跟信息流的互动形式,像点赞、滚动速度以及在某条内容上停留的时长等。用户不用改变任何消费习惯,就能够去体验运用LLM生成信息流能得到的好处,要是存在这种好处的话。

幕后支撑当下人类创作型无尽信息流的技术,其自身乃是前沿机器学习的成熟运用表现。在于当自己刷 Twitter 或者 LinkedIn 之际,实际上已然处于和一个模型来往交互的状态之中——只不过它所生成的并非文本,而是产出涵盖他人帖子的列表情形。也就是说,现有的信息流系统已然能够精确构造出个人偏好的高维嵌入(embedding)情况。从“运用该嵌入表征来推荐相关内容”转变至“运用该嵌入表征去生成相关内容”,这样的一步或许极为简短。

我怀揣着对AI生成的无限视频信息流抱有着相当程度怀疑的态度,不过我的确是觉得其他类别的无限信息流是一种尚未被充分探索的产品形态。实际上,我自己做了一个基于信息流的业余项目,把它称作Autodeck5。它的理念是借助AI生成的信息流创建间隔重复卡片以用于学习。效果是颇为不错的!直至如今依旧有不少用户通过我的博客寻找到它并且持续使用(当然,还有我跟我伴侣自身也在使用)。

05 游戏

有一种被讨论了很长时间的 AI 生成的产品状态,它属于基于 AI 的视频游戏。于这方面最为大胆的尝试是打造完整的世界仿真系统。比如说 DeepMind 的 Genie。然而也存在些人去探索运用 AI 来生成游戏的局部内容。像纯文本冒险游戏 AI Dungeon。又或是给《上古卷轴》添加 AI 生成对话的模组。更多游戏开发者选取把,AI生成的美术素材,融入自身作品里,同时还选择将AI生成的音频素材,也融入自己所创作的作品之中。

究竟有没有一种可能性,会诞生出一款游戏产品,它能真正把LLM深度融合进游戏玩法里,进而带来变革呢?我觉得《ARC Raiders》不能仅仅因为使用了AI配音,就被算作是“AI产品”。而那些有着更大野心的项目,到现在实际上也还没有真正开始运行。这其中的原因是什么呢?

首先,第一个缘由或许是,游戏自身的开发周期长得超乎想象。当2016年《星露谷物语》在全球范围内掀起热潮时,我曾认定会马上涌现出数量众多的像素风农场模拟游戏,然而这类作品真正集中出现实际上是在2018年以及2019年的时候,制造一款游戏,耗费的时间就是如此之长!所以,即便当下有人已然拥有了极为出色的LLM游戏创意,我们大概依旧需要再等待一两年才能够玩到。

第二个原因在于,有不少玩家对于AI实际上是颇为反感的,在游戏之中加入生成式AI,差不多必定会引发争议,虽说看似不一定会造成致命影响,《ARC Raiders》取得商业成功便是证明,要是有游戏开发者干脆认定“为AI创意去冒这个风险是不值得的”,我对此丝毫不会感到意外。

第三个原因大概是,生成式内容自身跟游戏机制不太契合,的确,GPT式的对话放到多数游戏里都会显得很不协调,AI聊天机器人也不太善于“挑战用户”,它们的后训练目标全都是“尽快让用户满意”,然而,我并不觉得这是不能攻克的技术难题,你完全能够朝着另一个方向对语言模型进行后训练,只是游戏公司可能还没有获取到做这件事所需要的资源。

06 总结

据我统计,目前真正跑通的大语言模型产品只有三类:

除此之外,存在着两类基于 LLM 的产品,当下尚未完全达成顺畅运行的状态,不过,极有可能在短时间内有着重大的突破发生:

市面上近乎所有的AI产品,根本上依旧是chatbots(像是AI客服这类)。这类产品面临着两个困境,其一,要有和GPT这个更为通用的“全能选手”直接展开竞争的情况;其二,没办法安心赋予强大的工具权限,原因在于用户能够轻易地越狱模型。

那种智能体类别的产品,至今仍旧相对新颖,然而在编码范畴之内,已然收获了极为显著的成就。至于它们于别的范畴里将会展现出怎样的形态,当下还难以确切表述,不过大致能够确定,有望在像法律这类垂直范畴当中,目睹专属的研究型智能体现身。实则,在编码领域内的研究智能体,业已存在一些成功实例(诸如代码审查或者自动化安全扫描类型的产品)。

当前,无限滚动的AI生成信息流未有切切实实取得真正成功的情况,然而,已有数亿美元资金向着这个方向蜂拥而入。OpenAI的Sora会变为Twitter或者是Instagram的旗鼓相当有力竞争对手吗?又或者是这些平台会推出属于各自的AI生成信息流产品呢?

游戏基于AI生成内容听起来是个蛮好的主意,然而究竟该如何将LLM融入游戏玩法之中,当前还不存在清晰的能够施行的路径。纯粹的世界模型,也就是整个游戏每一帧都由AI来生成,要是仅仅当作技术演示的话确实是挺酷的,不过距离变成产品而言还有相当长的一段路要走。

这儿还有个事儿我没讲,也就是图像生成。它到底是 chatbots 产品里的一部分,还是一个单独的工具?说实话,我感觉 AI 图像生成现在更像是玩具而并非产品,然而确实有好多用户在使用它。要是能有产品成功地和 GPT 所内置的图像生成功能区分开来,那这儿说不定还有值得去挖掘探寻的机遇。

从整体上去看,这样的一种感觉,特别像是互联网处于早期阶段的那个时候。LLM所具备的潜力是非常巨大的,然而,我们在大多数的时间里面,依旧是在重复制造同样的轮子。必定是有着一些极为简单的产品的创意,等这些创意出现以后,我们就会回过头去发出感慨:“这样的道理是多么的明显呀,为什么当初就没有任何人立刻去做呢?”。

在Hacker News上,这篇文章收到了好些评论。有读者觉得我进行的分类太过宽泛,这个批评相当中肯,也就是好比说“电力产品”仅有两类,一类是能让电机转动的,另一类是能让导线发热的。

曾有读者指出,存在文本摘要、便捷翻译以及语音转文字这些产品被我遗漏了。然而,我对此看法并不认同:试问,你自己可曾专门购买过某一款基于LLM的,专门用来做摘要、翻译或者转录的软件呢?大概率并非如此吧 —— 实际上,你直接借助chatbots便能够将这些事情妥善搞定了,难道不是这样吗?所以依我之见,这些应当是chatbots产品所具备的功能特性,而绝非独立的产品。

另外有一位读者讲了,也许存在着数量众多的“零热度”产品,它们正静静地进行发展,尚未被大众所留意。这番表述确实是有一定道理的!我不晓得的,我的确是不晓得。

当然,这里“不过是”一词的背后,实际上包含了训练更强模型的许多进展,以及 RLHF 方面的切实创新,正是这些进展和创新,才让与纯 LLM 对话得以实现。

2,这属于大多数AI企业里,项目走向失败的一个关键缘由。按照我的观察所得,我听闻了好多针对企业所定制的chatbots的不满之声,众人一心只想使用GPT!

3,若是你不信,随意选取一个用着顺遂的器械,这器械比如是你的电话、比如是你的汽车、比如是你的微波炉,去想象一下,得将每一条指令通通打出来才行。或许极为出色的语音识别能够把这类问题给解决掉,然而我针对此持有怀疑态度。

我一开始错误地书写成了“3.5 Sonnet”,得益于一位读者给予的指正。

5 我在这里写过相关介绍,顶部导航栏里也有链接。

不过,这有可能会被另外一种力量给抵消掉,原因在于我十分确定高管们会施加强烈的压力,要求插入局中,去“用AI做点什么”。

7,要是你曾经尝试着让GPT给你充当DM,你就会有着切身体会,模型会在瞬间试图向你展现很酷的事物,由此跳过了那些营造紧张感以及真实感所必不可少的枯燥铺垫。

目前市场上似乎只有三类真正可行的 AI 产品

相关标签: # AI产品 # Chatbots # 智能补全 # 智能体 # 信息流