大概是在上周四,许多渠道都传出消息称,苹果的AI进军中国市场已选定合作伙伴——百度。这条消息在极客圈和IT达人圈中引起了轩然大波。因为我们这些程序员、自认技术水平还算不错的人,一般并不使用百度搜索,而只用Google。在我们看来,用百度搜索技术问题的效率低,而且常常出现错误或重复的信息,非常低效。因此,我们普遍认为一个高效的程序员都会用Google,不用百度。
当然,在ChatGPT爆红之后的这一波AI浪潮中,我们对百度的文心一言也没有太高评价。很多人认为,在中国本土的大语言模型中,文心一言也并不是表现最佳的。各种排名和口碑来看,其他国内大语言模型都比百度好。
所以这次苹果选择百度自然就引发了极客圈内的强烈反应。特别大家是对百度的整体印象并不好。大家可能知道,百度的主要金主之一是莆田系医院。当年还有那个叫魏则西的男孩,因为在百度上搜索信息被误导,导致最终人财两空。这类事件让许多极客圈的人对百度非常不满。
然而,我觉得普通老百姓对此大多平静。毕竟如果你用国行iPhone,它的默认搜索引擎一直都是百度。当年苹果刚把国行iPhone的默认搜索设为百度时,可能有人抱怨过,但对普通大众来说,这并不是个大问题。
在中国大陆,普通用户对百度的认知度还是很高。虽然百度搜索存在各种各样的问题,但这么多年过去了,甚至有些人觉得Google搜索不如百度用得顺手。当然,Google离开中国多年,导致对国内网站的抓取也有问题。但总体上我们还是认为Google的内容质量更高。但是,对普通大众来说,这可能不是什么大事。
极客圈真正关注的是,现在国内有一些大语言模型的效果和排名都要优于百度,那为什么苹果还是选了百度?这就是问题所在。
首先,苹果在中国选择一个大语言模型合作方,与在美国的做法肯定不同。在美国或其他地区的Apple Intelligence,其实有三层架构:
第一层是手机本地的小模型,即本地运行的大语言模型;
第二层是苹果服务器上的大语言模型,一个更大的模型;
第三层是当苹果自己的模型无法解决问题时,会把请求传给像ChatGPT这样的第三方服务。
在美国,这三层体系结构清晰,合作伙伴 ChatGPT只参与第三层。
然而在中国,这套模型体系都涉及到备案和审批的问题。很多人忽视的第一个问题就是:苹果在中国上线本地模型、服务器端模型,乃至与第三方模型合作,都需要走中国的法规流程。这对苹果来说,是一个非常棘手的问题。
也就是说,在中国,苹果必须找到一个本土伙伴,协助它完成这些审批和备案。这个要求不仅限于云端的大模型服务,还包括本地的小模型。根据我朋友阑夕老师周四转述的Information网站的采访内容来看,苹果可能需要与百度合作,共同训练一个适合放在手机上的小模型。
为什么要和百度一起训练呢?
一个很重要的因素是中文语言模型比英文更复杂。英文只有26个字母,词汇结构相对简单,而中文有数千乃至上万常用字符和大量词汇。训练中文大语言模型的复杂度远高于纯英文模型。即使苹果拥有一定的中文语料,也可能觉得与百度合作能更高效地获得更好的中文语料和训练支持。
然而,八卦消息中也提到,文心一言的泛化能力并不理想。当苹果尝试把自己在英文版Apple Intelligence上成熟使用的一套提示词(prompt)套用到文心一言时,效果并不如预期。这意味着与百度合作虽能解决审批和中文语料问题,但在模型质量上可能会有一定的折扣。
那么为什么非选百度不可?
其实,这个问题的核心也许根本不在技术本身。
关键在于,中国政府对互联网服务有自己的监管逻辑和要求。想要合法合规地在中国开展大语言模型业务,需要一整套的备案和审查程序。百度在这方面的经验和人脉都非常丰富。相比之下,苹果在中国的本土化经验主要集中在硬件和iCloud云服务的合规上,而非人工智能服务。百度深谙国内监管流程,知道如何通过各类审核关卡,公关流程和专家评审。苹果自己是搞不定这些事情的。
举例来说,Google当年进中国后发现自己无法适应本土监管的要求,因为中国政府并不像美国政府那样通过正式文件和明文法律要求删除某些搜索结果。中国监管往往更灵活、更隐蔽,这让坚持严格程序和记录的Google难以适应。最终,Google选择退出。
而苹果的策略不同,它主要靠卖硬件赚钱。硬件本质上不涉及价值观与信息审查,所以更易于在各国让步和妥协。苹果愿意在中国放置服务器、遵守本地法规来换取市场。而AI作为一项服务,如果想本地化,就必须寻求本土合作伙伴帮助应对监管,这就是为什么要找百度。
再者,苹果对AI的要求与其他纯AI公司不一样。Apple Intelligence可能不够优秀,但因为苹果的产品拥有庞大的用户基础,它并不需要在短期内就做得极其完美。只要它具备基础可用性,长期有时间慢慢打磨。
Siri就是一个案例:尽管Siri并不像Google Assistant或亚马逊Alexa那么智能,但它依然每天有高达十多亿次的调用量。用户依然买苹果的硬件,而不会因为Siri不够聪明就放弃iPhone。同理,Apple Intelligence只要能稳定上线,在中国有合规的环境,就可以一边迭代一边提升。
从算力和服务器承载能力来看,苹果进入中国后,会有庞大的用户访问需求。百度在国内有充分的基础设施和服务经验,能帮助苹果在中国应对高并发访问量,保障服务稳定性。对苹果来说,这些优点跟模型性能略有不足相比,更有价值。选择一家在国内成熟、资源丰富的巨头,要比选择一家模型表现稍好但规模与人脉都不足的公司更务实。
此外,这种中外差异未来可能会越来越明显。中美关系、贸易战、监管要求不断演变,中国的网络审查和监管手段不断成熟,这就导致中国与西方在互联网生态上逐渐形成两个并行世界。
国行iPhone与美版iPhone可能在硬件上类似,但在软件和服务层面却越来越不同。中国的iPhone用户在使用Apple Intelligence时,背后是百度的技术和监管语境下的合规环境,而美国的iPhone用户则是另一套完全不同的生态。
过去我们还能轻松访问Google、YouTube和Twitter,但今天已成往事。现在越来越多的境外服务被挡在防火墙之外,或者经过严格审查。苹果作为一家全球化企业,在中国市场必须适应这样的环境,将服务器放在国内,与本土企业合作,接受审核与监管。这种局面在短期内恐怕很难改变。
未来可能会有更多类似的案例出现。随着中国在技术和监管上的能力不断提升,它可以更精确地对接国外企业进入中国市场时的条件与要求。这种双轨的互联网生态会继续发展下去。
硬件产品如英伟达的显卡还相对“安全”,因为它们是中性工具。但涉及内容、信息与价值观的互联网服务,无论是搜索还是大语言模型,都将面临更复杂的监管与博弈。
苹果希望在中国仍然保持硬件优势,同时让软件和服务在当地落地。这就意味着必须和本土合作伙伴一起“做功课”,而百度正是这么一个能够在政策、备案、算力、资源、用户体验、稳定性等各方面帮助苹果通关的选择。尽管可能并非技术最佳,但对苹果来说,这已经是最现实可行的方案。
总之,这就是为什么苹果会选择百度,以及为什么苹果只能选择百度。至于在这种选择下,Apple Intelligence在中国会变得多好用?可能还需要时间来打磨和验证,但从苹果的战略思维来看,这并不是最紧要的事。