首页 > 人工智能 > OpenAI 为什么没敢推AI搜索
2024
05-13

OpenAI 为什么没敢推AI搜索

AI 搜索的商业前景:成本低于 5 美分就能盈利

极客公园:传统的搜索引擎,用户免费使用而 B 端投放广告,形成了成熟的商业模式。AI 搜索中,用户直接得到搜索结果,会不会改变商业模式?能够盈利吗?

方汉:上个时代的搜索成本,它首先有个固定开销,就是你的爬虫集群的开销,这个爬虫集群,如果索引全球的网页的话,那基本上在 3, 000 台服务器到 1 万台服务器之间,这是个固定开销。

另外一部分成本就是做 page rank(网页排名),这个服务器规模是更为庞大的,且是动态开销。你的用户越多,你这个集群就需要越大。

在这两个开销之外,还有人员成本,还有保护费的成本——比如说谷歌每年要给苹果交钱,让苹果保留使用谷歌作为默认搜索。

所有这些都加起来之后,谷歌每年搜索引擎查询次数是 3.3 万亿次,单次搜索的成本是 0.2 美分。然后整个谷歌搜索广告的收入是 1, 500 亿美金左右,去年可能是 1, 600 亿差不多,可以算出来差不多一次搜索产生的收入是 5 美分左右。

然后再跟大家说一个数字,OpenAI 早期的成本,注意不是现在的成本,早期的成本,一次对话的成本是 36 美分,就是你可以看到这里面有几个数字差,36 美分、 5 美分、 0.2 美分。可以看出来,推理成本,是 AI 搜索商业模式中非常关键的因素。

我再跟大家分享另外一个数据,文生图有一个开源模型,叫 Stable Diffusion。我记得非常清楚,在 2022 年的时候我开始使用它,当时一张 4090 的卡平均是跑 3 分钟出一张图。今天我用 4090 还是同一张卡,我一秒钟能出 100 张图。可以看出,推理的优化速度非常快。我认为跟摩尔定律是有点像的,推理成本的下降速度跟摩尔定律是一样的,非常快。

甚至未来,端侧推理变得足够成熟之后,在端侧去做这件事情,几乎不存在推理成本了。我认为 AI 搜索商业模式应该很快就可以打正,这只是一个时间问题。

在商业模式上来说,最基础的 AI 搜索的商业模式,一定是靠广告信息流,那么这个商业模式也是非常成熟的。实际上国内的单个搜索,能够收到的钱比国外高很多,但基本上也是在 5 美分或者是几十美分这种量级,我们认为这个东西短期内也不会有太大的变化,所以我们也在一直优化,一定要把我们的推理成本打到 5 美分以下,整个商业模式才会成立。

我认为这个现在也不是特别难的事,这一天迟早会到来。

我们还会做智能体,智能体实际上属于 VIP 服务了,还可以收到更高的费用。

傅盛:在商业模式的问题上,首先每次搜索成本的价格必须降下来。

Transformer 那种大架构,如果你千亿参数,你每一个网页你都送进去喂一把,来一下上下文,那最后它就是很贵,搜索成本不降下来,你找用户收钱,每月收你 100 块钱,我还得限制你用多少次呢,商业模式就是算不过来账。

秘塔搜索的创始人是猎豹移动以前专门负责 NLP 的首席科学家。秘塔搜索特别值得一提的是,他们做产品的时候,思路非常清晰,搜索成本一定不能高。

秘塔在搜索背后的这个模型,大概也就是百亿参数,是自己训的一个模型,所以使得秘塔搜索的每次的搜索成本是非常低的。现在有的大模型,几百万字上下文,可能一次搜索的成本要几十块钱。

OpenAI 为什么没敢推AI搜索
秘塔搜索的深入模式(共有简洁、深入和研究三个模式)|图片来源:截图

我觉得由于需求的这个场景越来越明确,然后大家如果在这个网络框架或者算法上去发力,整个行业一起努力,我觉得成本会降得很快,可能最后降到一个和传统搜索成本差不多,或者稍微高一点点的水平,这是我个人一个判断。

而真正未来的商业模式,也许是一个复合模式。比如秘塔搜索里面,有个功能叫深度分析,可能以后那种深度分析的功能就是会员享受的。具体的秘塔商业模式会怎么发展,我不能替创始人回答,只是一个想法。去年秘塔这个团队都是盈利的,它没有像 AI 公司一样去烧钱,是非常务实的团队。

极客公园:AI 搜索是创业者的好机会吗?

傅盛:AI 搜索,我们叫大搜索创业,肯定不适合大部分创业者。竞争对手都是巨头,压力很大。

其实 AI 出现对搜索大厂本身是增强的。

为什么大家现在开始用小红书搜索一些娱乐内容,讲难听点,就是因为今天百度不好意思公开地去抓人家不让抓的数据。但有了 AI,大厂可以偷偷抓,变成自己的内容吐出来,像是洗稿,那其实是增强了它的能力。

而且大厂其实不是没有 AI 的能力,AI 的能力是传统搜索团队的覆盖范围之内的。传统的搜索引擎公司,想做 AI 搜索,核心是成本问题,不是能力问题。创业者尽量不要去打人家火力范围内的事情。

对于大厂来说,它不着急。这波人工智能下,我认为即使英伟达的股价泡沫破灭了,谷歌可能都是比较稳的。它只要不断地做 Gemini,等到整个商业模式变好了,再开始大力推。

只要大厂不犯重大错误,大搜索格局上,很难有大的变化。

但是我觉得 AI 搜索的这个模式,对于很多垂类来说,是可以做的。随着一些基础技术和 AI 的普及,比起以前,创业者做一个垂类搜索的速度快了非常多。

搜索可以无处不在,它不一定要以一个大搜的形式存在,所以创业者可以考虑在你的各种产品当中去加一些 AI 搜索模块。因为 AI 搜索它整个的能力已经上来了,成本也降下来了。做模块可能比以前要简单得多、也会多得多。

方汉:首先我认为 AI 搜索不是创业者一个好的方向。很简单,AI 搜索,如果你要想做到成本最低,你一定要自建搜索引擎索引库,这个成本是非常高的,我不觉得一个小创业者能解决这个问题。

我们公司做这个事情是因为我们原来在海外做 Opera News 这个新闻推荐产品的时候,从 16 年开始就自建了一个比较小的一个搜索引擎,我们当时每天大概索引 5, 000 万个新闻网站,我们整个 AI 搜索的引擎团队是一脉相承的,也就是说我们做这个搜索引擎的集群已经做了有七八年了。

索引库实际上就是爬虫集群和存储集群。比如有做个人站的,你能看到的个人站上,有几个网站带着 bot 的标志来爬虫你的个人站了,你就知道有哪几个公司是有自己的爬虫集群的。

这一块其实是一个比较大的成本,因为如果你没有的话,你就得去买第三方的服务,比如调用 Google 的或者是 Bing 的索引库,给他们钱。那基本上,购买第三方服务就可以把你所有的利润都吃完了。谷歌自己的成本是 0.2 美分,那你觉得它会卖你多少钱它觉得合适?

这个成本远比你的推理成本要高,而且推理成本在迅速地下降。

看未来的话,AI 搜索最后可能不会取代市场上的老大,但它有可能把市场上的老二老三给挤下来。

即使现在有谷歌搜索,其实同时仍然还有很多的搜索引擎。垂类的搜索引擎活得很好,比如 DuckDuckGo。我认为这种引擎反而是未来受到威胁最大的。

另外我反复强调智能体,你的智能体如果能够满足一部分垂类用户的需要,那你这个 AI 搜索就能够长期存在,而这些特定领域,搜索巨头未必能覆盖的到。举个例子,搜论文,谷歌做了一个学术搜索,但是在中国有知网,然后在海外还是有 Arxiv,垂类领域我们认为 AI 搜索通过智能体的赋能空间还是非常大的。

OpenAI 为什么没敢推AI搜索
天工 AI 的智能体广场 | 图片来源:截图

极客公园:未来搜索这个形态本身,还有搜索的市场格局,会发生变化吗?

方汉:一个比较少被讨论的点是,在现在的搜索格局下,谷歌和百度这两个搜索巨头,都在自建内容闭环。谷歌给 Wikipedia 捐了很多钱,20% 的流量落在 Wikipedia 上。百度有百度百科、问答等等。

大模型可能会完全颠覆内容闭环这件事。Wikipedia、百科都需要人工编辑,只要需要人工编辑,维护成本就非常高,而目前看到,大模型是有机会自己去生成 Wikipedia 的。我觉得下一段时间 AI 搜索都会聚焦的一个方向,是内容生成。

包括我们看到,微软的新模型,是使用 GPT-4 生成的教科书来训练的。大模型现在已经可以生成教科书了,虽然这个教科书用来训练模型,我们实际看到其实效果不太好,但仍然可以侧面说明,我们离生成合成数据越来越近了。

传统意义上的搜索,它只是一个很长一段时间最适合我们获取信息的一种方式。然后随着大模型的进步,随着 AI 的进步,我们认为我们有能力给用户提供更方便、更直接的这样一个体验。只要你能够让用户真正的省时间,真正的能提高准确性,变方便,那么你的使用率自然会上升,你的留存自然会变好。

大家都现在都在卷模型的指标。以后当技术进步放缓的时候,我认为产品就会介入。现在这一波 AI 创业中,产品的话语权是远远低于技术的,我认为这个情况是不太正常的,长期来看一定是改变世界的是产品。

未来的搜索市场份额,我认为新产品一定是能拿到的。谷歌这样的大公司,沉没成本太高了,行动速度一定是比新产品慢的。但是能不能守住这个市场份额,以及能不能颠覆这个市场,是不一定的。

OpenAI 为什么没敢推AI搜索

2023 年搜索引擎市场份额 |图片来源 YouTube Data Wrap可能颠覆市场的是做操作系统的,或者是做别的产品的公司,一下子降维打击,把搜索引擎的市场搞没了。端侧推理和智能体,都可能带来颠覆创新。

傅盛:五年之内,搜索的形态可能会发生一些变化,可能真的会从一个纯服务端的变成本地化的。意思是,我真的不再去打开一个网站了,我就在手机上问我的 Siri 就行了,每个回答给我 20 字,直接满足我 90% 的需求。

我不知道这件事会不会真正发生。但是端上运行的大模型,将变成一个非常重要的变量。像我刚才讲的,搜索市场本身,在原来的格局下,我看不到第一名被颠覆会有很大可能性发生。234 名可能会有些变化,谁在这个 AI 上怼的快,可能市场份额就上去了。

但是我觉得,明年我们可能会看到一个结果,就是端侧推理,会不会给整个搜索形态带来重大的变化。苹果六月份就要发布他们涉及到端上模型的方案。当时财报会,有人问苹果公司,你这么大一个公司,买 GPU、卡买的不够多。

苹果的回答是我们是混合模型,大模型我们用合作伙伴的,端侧本地模型我们自己研发。它对本地模型是极度重视的。行业里现在已经分两派了。

OpenAI 那派推 7 万亿 GPU 小镇,在扩云端模型。而另一派,就是关注本地。微软,到苹果,到高通,现在都在推 AIPC 了。

OpenAI 为什么没敢推AI搜索

我觉得其实第二派会更快地到来。有可能你的电脑以后就是一个搜索引擎了,那我觉得这个可能对搜索引擎的模式是完全的颠覆。

我本地一个 APP,到百度抓五六个网页,自己回来做分析。你说百度不让我抓?这个没办法不让抓,你也分辨不出来,我就是一个用户。那到时候,搜索引擎的整个商业模式就完全没法成立了。



本文》有 0 条评论

留下一个回复