来源:Kindergarten Green© 时间:2023-06-16 12:35:07
如果你是一个互联网产品爱好者,或许曾看到过李奇在知乎、即刻上关于互联网、科技、产品设计领域的分享,甚至订阅过他的付费专栏。
李奇早期在知乎做了6年产品设计,之后在UC国际担任产品经理。两年前,出于兴趣,他设计了一款面向创作者的一站式工具——竹白,帮助创作者触达更多紧密且忠实的读者,自己也持续在上面更新着对头部科技公司、Web3、内容产品以及商业市场的观点认知,客观且深思,令我们印象深刻。
作为李奇的即刻关注者,Kindergarten Green的伙伴们发现他最近也在关注AI,还尝试做了一个AI助理demo。我们好奇这位明星级产品经理究竟如何理解AI助理的价值,以及AI产品真正的需求场景。于是有了这次交流。
(资料图片)
一、用户界面可能是被忽略的语料
Q:在AI兴起前,你用过哪些个人助理型产品/应用?体验如何?
印象中就两波,一波是iPhone的Siri,还有一波是天猫精灵之类的音箱。效果大家都懂,比较挫,问问时间、天气,最多播放个音乐。
Q:据你观察,广大用户在过往使用助理型应用中,有哪些普遍痛点?
痛点取决于预期。
如果把助理当成虚拟的人,可以分为几类:一类是内容型的,技术其实没那么重要,重在服务内容,比如柳夜熙;另一类就是功能型的,比如 Siri;再就是角色型的,对标真人。
当我们在讨论助理时,会预期它是个能做很多事情的人,能听懂你说话,有基本知识和认知。比如你提出一个需求,说:“帮我买一张明天飞北京的机票”,它会根据“机票”这个关键词,调取相应系统,结果发现还需要细化起飞地、目的地、起飞时间等具体指令。
这时它会进一步问你“明天什么时候到?”“什么时候走?”“从哪里起飞?”等问题。假如你从上海飞,它为你选择了一张落地北京大兴机场的机票,你说太远了,能不能换成首都机场的,它就不理你了。因为在它的系统结构里,落地机场不可选,对话就此终结。
这是之前产品的主要问题,你只能提一些完全没有任何歧义且完整的需求,比如:“今天天气怎么样?”“现在几点了?”而大家在提需求时,通常不会一次说得很完整,于是反馈和预期不相符,大家慢慢觉得这东西没用,就算了。
iPhone里的Siri对话界面
Q:目前市面上各种形态的AI助理很多,比如Siri语音助手、企业RPA、营销/客服机器人、各类AI copilot等等。你出于什么动机demo了一个AI助理?
对我们这些产品从业者来说,有新技术来了,总想试试看它到底能做什么,做到什么程度。用户界面可能是被忽略的一种语料,因为它通常被认为无法训练,我就好奇能不能试着搞一搞。
Q:效果达到你的预期了吗?
问题还挺多的。现在国内市面上基本没什么公司在做web产品,API跟你也没什么关系,用户手机的界面信息似乎也拿不到。落地没有想象中容易。
我对它的预期是能解决实际问题,给出一个指令,AI助理能直接给到闭环的服务,而不是一堆建议。做闭环就两个方向,要么调用第三方服务,要么自建服务体系。前者很难搞,因为调取接口牵扯到已有公司的壁垒和数据;自建的话,一般小公司也做不来。
二、AI助理擅长提效,但非高频刚需
Q:短期内,用户使用AI助理存在哪些门槛?
我先把AI助理限定在提升效率这个方向上。在这个范围内,你大概知道一件事是怎么做的,希望有一个稍微聪明的人帮你来搞定,你负责检查结果的质量。如果不考虑AI能力,不同的人面临的门槛不大一样。
第一个是能力问题,你需要判断AI解决的是0-1的问题,还是1-10的问题。短期看,大部分0-1的问题还得自己做,AI能帮你提升的是1-10的效率。并且AI对你的要求是清晰明确的目标,你得把任务拆分得足够细,以及把活派出去。大部分人可能会高估自己这方面的能力——你其实想得没那么明白,也不清楚问题是什么、该如何解决。
再就是程度问题,就是“到底有没有那么多事情需要被提效?”想象一下,你每天要做的事情中,有多少是目标清晰、实现手段明确,单纯需要提效的。除了极少数人,大多数人没有那么多事情要完成和需要提效。如果程度不强,频次就低,助理的意义就不大。
第三个是成本问题,就是你自己处理这些事要耗费的时间和精力,与使用AI助理带来的成本,在不同人眼里的ROI肯定不一样。短期内,也许调取GPT还不如自己上手做划算。
如果不把AI助理拟人化,单纯当作工具来看,大家使用它的门槛和不愿意学习新东西的原因类似,要么能力不够,要么没那么痛,要么太“贵”。
在AI对话过程中一步步明确需求
Q:以外卖app为例,你认为它是一种GUI助理吗?
这取决于目标。比如我想要买个东西,有两种方案,一种是告诉我的小弟买东西的需求,让他替我跑腿,另一种是自己去买。选择前者取决于我是追求效率,还是不想亲自跑一趟。
Q:当我们打开外卖APP开始搜索,其实就像我在询问小弟商品相关信息。
差不多。可能小弟恰好知道你过往的购买信息、习惯偏好,不需要你再刷APP或做额外操作,直接就帮你搞定了,相当于替你决策。
Q:所以AI copilot/助理会进化成一个更了解我的小弟吗?
要看具体场景。比如我现在想找一个宠物友好的日料餐馆吃饭,它附近500米内有酒吧,我想饭后去喝一杯。现有的产品是做不到这个需求的,对于大众点评来讲,它太长尾了。平台如果需要照顾这么长尾的数据,界面无法承载。而copilot也许能实现这个场景需求。
Q:从解决问题出发,抛开技术局限,你还看好哪些AI应用?
一是效率工具,比如写邮件的助手;第二个是语言学习的copilot,提供定制化学习方案;第三个是虚拟陪伴,配合其他模态,为人们提供个性化陪伴和情绪价值,在服务层面更有扩展性。
Q:我们内部讨论过“如何让更多人用上AI”的问题,移动互联网时代的big thing分别有社交、信息分发和电商,且时间轴上看来社交会比较早出现,你认为社交可能是这次 AI 革命最大规模和高频的入口吗?
社交变成入口的前提,是大多数人需要一个全天候的 AI 助理,来替代你做很多你不想做的事情。现在看来它更偏生产力或效率提升,而不是社交。
从经验上看,这类产品最终在使用上都不太高频。外加前面提到的门槛问题,大部分情况下,它可能是在大家常用的产品里加入了一个copolit,而没有创造全新的东西。
除非真的出现一个所有人都在用的copolit,它知道关于你的所有信息,那可能社交会成为那个入口。
三、社交对话需求都发生在场景中
Q:这一波AI可能带来什么新能力?
比较明显的是内容生成从0到1的门槛变低了,但如果要做1到10怎么办?这个事还不清楚。其次就是前面提到的个性化和扩展性可并存。还有一个自然语言对话。
这和之前的Web3很像,大家想不明白做什么产品/应用,就去做底层、中间件、ToB服务。但比较怕的是只有这些东西,永远没有产品,就比较难往下发展了。
Q:AI助理对个人需求的理解依赖于个人数据。你觉得未来是各私有化模型能拿到一部分你的数据,还是会有类似微信这样的应用来掌握你的所有数据?
这可能取决于那个最终表现出来的产品是什么。比如微信明显有很强网络效应,那可能最后只有它一个,但电商有三五个。
假设和AI助理的对话不是发生在像微信这样的通用IM,而是嵌在某些产品里,比如说打开淘宝,想买某件东西,AI就直接推荐给你了,你的大部分购物数据会沉淀在淘宝上。如果想买某个垂类产品,相关数据可能会在另一个常用的垂类产品里。
Q:Character.AI在巅峰时期DAU超过百万,Glow也近百万。社交生态会以类似方式被重构吗?
从需求上说,大家总是想复制自己,从个人头像、捏脸到语音合成,都想体验做上帝的感觉。但在具体落地的时候,过去的技术只能实现外形复制,对话还需要人类完成。这也是门槛最低的、能让人快速知道对方智力程度的交互方式。所以之前的虚拟人产品看起来都有点“傻”,要么背后有真人,要么不让虚拟人说话、只能写字。
但这一波AI让我们看到了对话的可能性,但下一步是什么?把社交拆分得更细致一些,也许要思考的是人机之间能不能有感情?如果每个人都有属于自己的分身,ta知道你的各种信息,也能和其他人对话,那如何定义你和ta的关系?ta和其他真人的关系是什么?ta和其他真人的分身到底是什么关系?
这些问题需要琢磨清楚,才会有下一步。否则Character.AI、Glow就可能只是一种过渡形态,最终会被打包到一个具体的产品里。比如在相亲的场景,有优势的一方可能会要求你先和ta的AI分身聊,没问题了再进入到真人交流环节。
核心在于社交场景,对话和需求都发生在具体场景中。
Glow介绍
Q:Siri是大众熟悉度最高的AI助理,但使用率和效率都很低。如果苹果公司开放接口,Siri会成为大家使用AI的最大入口吗?
苹果可能只能做接口,需要服务商接入。现在Siri其实也开放了一些接口,但大家不使用。除非苹果能证明,人类就是喜欢语言交互,否则这事儿就不成立。
Q:我们觉得自然语言交互相比图形界面交互更普遍,但有人认为前者会替代后者,你怎么看?
我不赞同替代。放到具体场景中,我很难想象刷抖音的时候,想为某个视频点赞,还得先进入一个对话界面说点赞,这太奇怪了。自然语言交互可能在不断细化需求阶段可能更有效,一旦你明确目标,自然语言交互的优势就不突出了。
Q:终极形态下,AI助手的能力边界是什么?
AI作为一种没有实体的新技术,对提供服务的人来说比较重要,但对大多数人生活的改变是没什么声息的,他们只会觉得工具越来越好用了、过去很贵的东西变便宜了、电商客服没那么傻了。面向大众的产品,大概率不是生产力或效率工具,肯定是偏娱乐的产品。
四、希望人类早日实现“机械飞升”
Q:你设想AI助理未来在人们生活中的角色是什么?对用户的行为习惯、思维模式会产生哪些影响?
我觉得有两种思路,一种是人类只管享受,活都给AI做,自己躺着就行;另一种是限制AI的能力,能人类做的还是自己做。
我做了一些粗糙的猜想,比如你可以完全自己决定孩子的教育,未来AI能帮助人类做很多复杂计算了,你的孩子今后如果不以数学为生,还需要接受基础数学教育吗?再比如如果一个人记忆力很强,可以熟练背诵古诗词、文章,但有了搜索引擎,你什么都能找到,那背诵的意义是什么?
我也还没答案,但肯定和个人选择有关。假设AI是个工具的话,它肯定会改变人,极少数人能抵御它,但是好是坏还得等待时间来判断。
Q:真人助理有自己的性格特质,你认为AI助理需要有性格和情感吗?
这可能取决于AI助理有了性格和情感,能不能帮助我更好地完成任务。比如有些长辈容易被卖保健品的骗钱,这时AI助理如果能晓之以情、动之以理地劝说ta,可能更容易成功。基于这个原则,有的话比较好。但如果这些性格和情感只是为了满足一些情绪价值,那可能属于 nice to have,没有也无所谓。
Q:你理想中的人机交互关系是怎样的?
我会希望在AI加持下,人类能早点“机械飞升”,和机器更进一步融合。现在大家还是通过接口或界面来操作实现人机交互,如果人类身体的某些部分可以换成机械的,我愿意把胳膊换成一个更厉害的东西,对,很酷,哈哈哈。
第二个就是不太希望人类社会遭受到太大冲击。人类发展的历史都是先污染后治理,先关心技术的天花板在哪里,等付出了巨大代价之后,才考虑树立边界。在这个过程中,大家的关心点仅限于“我不是那个代价”。新技术进入到人类社会大概率不会严丝合缝,中间重叠的部分,可能是重大灾难、动荡、摇摆、妥协、牺牲……这个过渡期需要政府、媒体共同努力,作为个人、组织、公司,都得考虑怎么应对。
电影《复仇者联盟》中,冬兵的机械臂
End
虽然对话的起点是AI助理,但聊到最后,又转向了AI生成版权和伦理的讨论,这是最近每每和朋友们聊起AI革命时,几乎绕不开的话题。
比尔·盖茨预言AI助理将颠覆甚至替代搜索,但别说AI助理,就连搜索本身都属于“精英化”的信息获取方式,你得先明白自己的需求,并能清楚地描述它。而作为普通人,我们对需求的提炼和描述都是模糊的。这与李奇提到的用户门槛不谋而合。未来AI助理会朝什么方向发展,我们暂时也还不知道。
我们大胆假设,技术变革带来了大量新增信息以及新交互方式,其中也包含着新的人人、人机关系,如何理解这些变化,并根据我们不变的需求识别新的场景,是构建AI原生应用的必由之路。