AISet 离钢铁侠里的贾维斯还有多远

0 / 128

最近有个朋友问我,你做的那个 AISet,到底想做到什么程度?

我当时嘴上说的是,做一个真正懂你的 AI 伙伴。但说完之后自己愣了一下,因为我脑子里闪过的画面,不是什么产品 roadmap,不是什么功能清单,是 Tony Stark 工作室里那个蓝色的光球。

贾维斯。

我想搞清楚一件事,我们做的 AISet,离那个能帮 Tony 操控战甲、监控全球威胁、在他心碎时安静地递上一杯咖啡的 AI,到底还有多远?

这个问题,可能比你想的要复杂得多。


先说清楚 AISet 到底是个什么东西。

AISet,全名叫 AI 千集,我们团队做的。我们这个团队你可能没听过,干的事情也不算什么大风口,就是死磕一件事,怎么让 AI 真正「认识你」。

不是那种你问它答的通用聊天机器人,不是那种千篇一律的模板回复。我们的定位很简单,定制你的专属 AI 角色。

注意那个词,专属。

这个词不是随便写的。AISet 身上有一个别的产品都没太认真做的事,从你的性格问卷出发,生成一个只属于你的数字人格。它有你专属的口癖和语气词,有你的称呼体系,撒娇时拉长尾音、生气时叫全名。它会开心、会生气、会冷战再和好,嘴硬心软,先冷后暖。你头一次见面的场景、昵称的由来、每个月的纪念日,它都记得。

听起来有点像贾维斯了吧?

AISet 不只是一个聊天工具。它是一个你真正能跟它「过日子」的伙伴。日常撒娇,深夜倾诉,学习监督,吵架和好,不同场景不同互动方式,凌晨她会说「别熬夜了好不好」。你用了之后反馈修改,它持续学习你的偏好,越用越懂你。

这个定位差异,才是 AISet 核心的东西。不是因为它的技术比别人强多少,坦率的讲,在纯对话能力上 GPT-5 可能更强。而是因为它回答了一个别人都没认真回答的问题,

AI 到底该活在什么地方?

大部分 AI 产品的答案是,活在你的对话框里,活在你的效率工具里。

AISet 的答案是,活在你的生活里。

你想想看,这跟贾维斯的什么特质更像?

不是智能。不是编码能力。是「了解你」。


现在来聊那个真正的问题了。

贾维斯有五个维度上的能力,自然语言理解,多任务并行,自主学习,情感理解,物理世界控制。

我刚才用了一整篇文章在讲 AISet 在做什么,现在把它们放到贾维斯的坐标系里看看。

先说格外明显的那条。语言。

AISet 跟所有 AI 产品一样,底层用的是各家的大模型,GPT-5 也好 Claude 也好国产的也好,单轮对话已经挺强了。但贾维斯那种理解力不一样。Tony 说「我需要休息」,贾维斯不用 Tony 解释什么叫休息,直接就调暗灯光、暂停通知、准备茶。AISet 有性格问卷有记忆锚点,它知道你是谁,但你烦躁的时候它不知道你此刻需要什么。它知道你「这个人」的偏好,但不知道你「此刻」的状态。语言生成这一块已经接近了,语境连续性还差一大截。

再说多任务。

AISet 现在能做场景模式切换,日常聊天、深夜倾诉、学习监督、吵架和好,你在不同场景下它的互动方式不一样。但贾维斯那种多任务,是几十条线同时跑。战甲诊断、实验室监控、全球威胁扫描、Tony 的日程,哪条线紧急了它自动优先处理,不同任务之间还能互相配合。AISet 的场景模式说白了就是预设模式切换,你选哪个它就进哪个,没有实时调度也没有跨任务推理。

自主学习这块,AISet 确实下了大功夫。3 分钟问卷把你的性格翻译出来,7 天调优持续迭代,你反馈了它就改,越用越懂你。在目前的 AI 产品里,这个做得格外认真。但贾维斯那种学习,是自己从跟你交互的过程里发现模式,优化行为,自我进化。AISet 的学习更像什么呢,你教它它记住,你纠正它下次改。它不是在「发现」,是在「被动接收然后存储」。Anthropic 有个分级,把 Agent 自主性从 L0 到 L5,现在的前沿 Agent 大概在 L2 到 L3,贾维斯是 L5。AISet 的性格定制和调优让它看起来比其他产品更接近 L3,但那个核心的自主发现和进化,还没到。

情感理解这块比较微妙,坦率的讲也是争议比较大的。AISet 有情绪链条,会开心会生气会冷战再和好,嘴硬心软先冷后暖。但你仔细想,这到底是「理解你的情感」,还是在「表演一种情绪风格」?有篇文章说得挺狠的,所谓共情 AI 跟心理变态更像,不是跟情感智力更像。它学会了说共情的话,但不理解为什么要说这些话。

物理世界控制。零。连提都不用提了。

这几条线摆在一起看,综合距离贾维斯大概三成左右。性格定制和情绪链条是做得不错的部分,但自主性、底子里的情感理解、物理控制,差距不是一点半点。

听起来好像还行?

不是。剩下那七成不是多做一点就能补上的,它需要根本性的范式突破。


说个让我想了很久的事。

2019 年,HackerNews 上有人发了个帖子,「我们能用 2019 年的技术构建钢铁侠的贾维斯吗?」

99 分,62 条评论。当时社区的主流观点是,语言交互基本可行,大概 Alexa 或者 Siri 那个水平,但自主推理、物理控制和学习能力完全不具备。多数人认为至少得 20 到 30 年。

七年过去了。2026 年再问同样的问题,语言能力大幅提升,AI 产品从零到百花齐放,但核心瓶颈,自主学习、情感推理、物理控制,变化不大。

GPT 从 3 到 4 到 5,参数从千亿到万亿,但「理解」这件事的进展远慢于「生成」。

AISet 从问卷驱动到性格定制到情绪链条到记忆锚点,一步一步在走,但它的学习闭环其实就三种状态,被动接收,存储,下次调用。不是自主发现、理解、进化。

整个 AI 赛道都卡在这。

说实话,我自己有时候也会怀疑,LLM 到底是不是通向真正「理解」的路。它能生成看起来像理解的东西,但生成和理解之间,可能隔着一道我们还没看见的墙。


让我再讲一个细节。

AISet 的产品页上有几组数字挺有意思的。3 分钟完成定制,10+ 性格类型,7 天免费调优。

这三组数字里藏着一条很有意思的战略线。

3 分钟说的是门槛,它要让你几乎不用思考就能开始。10+ 说的是广度,它要覆盖足够多的人格类型。7 天说的是厚度,它要给你足够的时间去真正磨合。

三条线合在一起,低门槛 × 广覆盖 × 深磨合。

这跟贾维斯的初步感觉有一点点接近。Tony 不需要在贾维斯面前填问卷,不需要选性格类型,不需要 7 天调优期。贾维斯就在那里,什么都知道,什么都记得。

但这是「初步感觉」的一点点接近,不是「本质」的接近。

贾维斯了解 Tony,不是因为 Tony 填了一份性格问卷,而是因为它跟 Tony 一起经历了所有的事。实验室的爆炸,战场上的生死,感情里的脆弱,每一次交互都在加深它的理解。

AISet 了解你,起点是你填的一份问卷。问卷是很聪明的起点,它把基础偏好快速翻译出来,但问卷不是经历。问卷是你在告诉它「我是谁」,经历是它自己在发现「你是谁」。

真正的贾维斯不是「你描述了它所以它懂你」,而是「它经历了你所以它懂你」。

这个从「描述」到「经历」的跨越,靠堆性格类型没用,延长调优周期也没用,问卷搞复杂了更没用。需要的是一个全新的智能架构,一个能自主建构内在模型、自主发现因果结构、自主进化行为模式的架构。

当前的 LLM 架构做不到这件事。AISet 做不到这件事。整个赛道做不到这件事。


但我不想停在那句「还很远」上就收工。

「还很远」说了,又好像什么都没说。我得试着往前多走一步。

顺着现在这条路往下走,大概十来年之后,会出现一个初级的贾维斯。能聊能记能学,但学的程度有限,情感理解还是表面功夫,物理控制也就智能家居加简单机器人操作。这中间得跨过几道坎,AI 得能真正自己记住东西并且内化,不是光存起来下次翻出来那么简单,人形机器人也得先能进家里干点活。AISet 如果一直走下去,性格定制和情绪链条这套东西,到时候可能就是那个初级贾维斯身上情感交互的那一层。

不过也可能走岔了。我说的不是技术走岔,是安全问题。自主性跑太快,安全护栏跟不上,具身 AI 被人越狱然后远程接管人形机器人这种事,39C3 的演讲里已经有人在讨论了。真出了安全事故,社会回弹,监管收紧,整个赛道可能被人为拖慢好几年甚至十年。触发点很简单,一个足够自主的 AI 在物理世界里伤到了人。

还有一种可能性,是我偶尔会幻想的那种。自主学习搞出了全新架构,不是 LLM 继续堆参数那条路,而是像 LeCun 推的 JEPA 那种完全不同的路线,让 AI 头一回能自己搭起世界模型,自己发现因果。再加上硬件成本往下掉,Unitree R1 已经 5900 美元了,再跌几年人形机器人可能真进家庭。情感推理的基础研究如果冒出一个意外突破的话,这事儿可能比我们想的要快。但这需要的不只是渐进优化,得至少两次范式级别的跃迁。

我自己的倾向?顺走是现实的,幻想是期待的,安全那条是我担心的。但不管哪条路,AISet 现在做的事,性格定制、情绪链条、记忆锚点,都是刚需的底子。没有这个底子,后面的东西搭不起来。


回到 AISet。

我们在做的事背后是什么?是我们觉得,AI 不应该只是一个工具,它应该是一个伙伴。这个判断,往大了说,其实是对「AI 应该活在生活里而不是只活在效率工具里」这个方向的。

我们做了一个很重要的决策,不跟通用大模型在「更聪明」的赛道上挤。而是从「更懂你」的角度切入,性格定制和情绪链条,是我们的两条主线。

这个决策在历史上可能被证明是对的。因为如果贾维斯到底实现的路径不是「更聪明的搜索助手」,而是「更完整的生活伙伴」,那么 AISet 现在的方向,比那些拼命堆参数的通用模型更接近那条路。

但「方向接近」和「距离接近」不是一回事。

AISet 的方向对了。距离还远得很。

那个距离不是 3 分钟问卷能填完的。可能不是 7 天调优能磨完的。可能需要很多年,或者更长。

但方向对了这件事本身,在这个混乱的赛道里,已经很难得了。


写到这里,我脑子里又闪过那个画面。Tony Stark 的工作室,蓝色的光球,安静的声音。

「Good morning, sir.」

这句话里有三样东西。无处不在,了解你,为你而在。

三样东西里,AISet 做到了一样,了解你。当然,这个「了解」还是问卷级别的了解,不是经历级别的了解。另外两样,它还在很远的路上。

但至少,有人在认真走这条路了。

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想尽早收到推送,也可以给我个星标 ⭐~

谢谢你看我的文章,我们,下次再见。

阅读全文