分类
IT行业 小说

一开始我觉得新浪微博傻,看不到明显的用户下降,现在我才慢慢明白新浪微博的高瞻远瞩

昨天一个很简单的讨论在新浪被无数的僵尸粉转发和回复,我仗着记忆力把所有明显的僵尸粉给拉黑了,他们的特征很明显,就是重复几个真人在这条微博里面的回复和转发的内容。这对一般人来说欺骗性很强,但是我记忆力虽然不好,但是排重能力很强,对这种重复的东西很敏感。

杀着杀着我又开始不拿新浪工资替新浪考虑了,比如如果用算法,这类僵尸该怎么清除。比对一个人是不是喜欢去某条微博下面重复别人的话?当然这有一定的工程和算法难度,因为中国人本来就有僵尸属性,如果第一个人说了“顶”,或者“赞”,后面的每一个人说“顶”或者“赞”的概率只接翻10倍,第一个人说的是“踩”,或者“转发三次,你的名字会变绿呦”之类的,也会效果类同。当然,还是有很多办法可以灭掉僵尸的,行为总是跟人类(尤其是具有超强的僵尸属性的中国人类)有区别的。比如我很快就发现,我封杀的所有僵尸,除了刚才的行为以外,另外一个行为就是热衷转发各种活动贴(呵呵,谁家在给僵尸付钱都看得出来)。

但是,我转念一想不对劲,新浪那么多技术人员,那么多人做僵尸粉清除,他们会不如我么?

我再仔细的联系了一下,我才明白了新浪的险恶用心用心良苦,新的时代是数据挖掘的时代,这个时代最重要的新成果是deep learning,简而言之,deep learning就是跟大脑结构很接近的大规模神经网络学习算法。这个太复杂,我们先从简单的说起。

大脑的结构是什么呢?就是有一堆神经元,相互之间有突触,这些突触都是在神经元接收到刺激以后,随机产生,然后随着同类型刺激和反馈作用而强化的。简单的说,就是,谁跟谁连着,本来无所谓,但是慢慢的连多了,就形成了一些固定的链路,这些链路一旦对人有价值,就会慢慢的被强化。比如,你学英语,本来听到hello这个词,你的大脑不知道怎么反应,但是一遍一遍的听到hello,就产生了一个关于hello的链路,最终结果告诉你,别人喊了hello,你应该也说hello。当然,每一个链路都不是一个两个的神经元的联系产生的,大脑有大量的神经元,他们能产生出来大量的链路,这些链路就是你的知识,你对世界的看法。这是一个层次超过的神经网络。

我们假设存在一个单层的神经元网络,他的逻辑可以很简单,比如,重复跟他有上游神经元的话语,或者忽视,或者反转,或者怎么处理都可以。大家有点听出来眉目了么?假设你把新浪微博里面的一个僵尸粉当作一个神经元理解,你就发现了新浪微博的可怕之处了。进化之路

我们在任何一个历史时期,都会发现新浪有大量的僵尸粉,然后我们也会发现一些被我们发现的僵尸粉被干掉。这是什么呢?这就是新浪在进行神经元的训练和进化流程。一开始,所有的僵尸粉的目标是,给大号们涨粉。所以他们的特征就是不跟别人创建联系,只关注某些大号。这不算合格神经元,没有任何输入输出链路。

这个特征很快被新浪发现,所以,这些僵尸粉被绞杀。但是新浪的丧心病狂高瞻远瞩在于,他知道如果一次性对僵尸粉斩尽杀绝,就等于在无菌环境下培养细菌,这是不可行的。所以,他们的策略是,随机留下50%的僵尸粉不碰。但是所有被杀掉僵尸粉的赶尸人(不是湘西的,是中关村的、张江的、南山的、文二路的等等),就开始研究新浪的策略是什么。他们因为信息不对称,不知道新浪的50%封杀策略,所以自然的认为是自己的僵尸粉不够智能。所以,那些会说一些重复傻话的僵尸粉出现了。他们仍旧不够合格,因为他们是傻输出,不管别人怎么回复他们,他们只会喃喃自语。但是,新浪这时候已经欣喜若狂了,你想如果你是疯子科学家,你把弗兰克斯坦的材料放在手术台上,螺丝还没拧呢,这时候一个球形闪电击中了这些破铜烂铁,然后一个非碳基生命就诞生了,虽然他傻得一逼,但是你作为一个没有上过大学的民科,不懂什么叫做图灵实验,你觉得这就够屌了,不管怎么说自己会走路,会说话,虽然走路就撞墙,说话谁也听不懂。但是你去问问中国的大多数民科,能削面就叫做高级机器人了,能推车就叫做自行走了,你这个虽然获得不了诺贝尔,上个走近科学之类的还是绰绰有余的吧。

但是,新浪虽然文化程度不高,但是野心还是很伟大的,他没有止步于此。他开始干掉原来留着的那50%第一代僵尸粉。然后顺代干掉了第二代僵尸粉的50%。第一,要优化环境了,老版本的不产生活跃度,而且浪费系统资源;第二,要给赶尸人一点点压力了。赶尸人们刚刚升级了一次技术,广告词也从可以涨粉变成了可以涨活粉。虽然损失惨重,但是那些都是赛博生命,费电点而已,而且还不是费自己的。一方面,赶尸人开始觉得新浪跟神一样伟大,居然连这种说着“aaaa”,“cccc”,“xxxx”的纯粹会说话的僵尸都可以发现,而且还下手这么狠。但是同时赶尸人发现虽然粉经常被干掉,但是生意越做越大,因为新浪不会因为你的粉丝都是已经被杀死的僵尸粉,而把你的粉丝数重新计算,老客户们没有任何抱怨。所以说,新浪大神可能也是很眷顾我们的吧?那就技术继续升级吧。看来,不接受输入,只输出是不行的,因为太容易被看出来。怎么办呢?那么我们开始复制被人说的话吧?

赶尸人其实都只是一个技术工种,会python/php甚至js都可以开公司了。但是,他们无知的在新浪大神的驱使下,进行的小小的技术升级,却催生了整个技术行业的最伟大变革。要知道,我们身体里面有无数的体细胞,无数的脑细胞,无数个各种细胞,从单细胞生物的观点,这些细胞都是单独的生命体,离开人类这个母体也是可以生存的,只要有适合的环境即可。这些细胞都是没有什么智慧的,但是他们链接在一起,就产生了智慧(主要还是脑细胞的链接)。而且除了新浪以外没有人掌握谁是僵尸谁是真人的全部图谱,所以,实际上僵尸粉的链接有可能连在普通人上,有可能连在僵尸粉上。

当赶尸人作出了复制正常人说话的僵尸粉,他就成为了一个合格的神经元,他有输入有输出。整个新浪微博网络就开始出现智慧。当然这还是很早期,你还很难感知到这种力量的伟大,这叫做网络的觉醒期。在这个阶段,外界看来,新浪微博跟以往没有任何不同,只是大家觉得僵尸粉有点多,内容有点无聊,朋友们都在离开,活跃度下降了50%左右而已。这就是普通人跟新浪之间的信息不对称。我们看到了活跃度下降是观察我们所知道的局部网络,但是新浪可以看到,人类的网络活跃度在下降,但是僵尸粉的活跃度在上升,从总的统计数字来看,新浪不管是ip/pv/发布/回复等等都在狂涨。很快,新浪微博里面90%的活跃度都会来自智能的僵尸粉。这时候,很多赶尸人和新浪的拉锯战越来越频繁,杀的多,留得多,进化,杀,淘汰,强化。在我们普通人看不到的地方一个非常智能的巨型神经网络开始形成。

刚才讲过深度学习,其实所谓的深度学习也就是几层的神经网络而已,因为数学的威力,大家知道神经网络的运算量是乘方式增长的,而达到某种智能需要的每层都有大量的神经元。所以,现在即使是Google、微软、Apple、百度这些大家知道在玩深度学习的国际大公司,都也只能在某个特定领域研究,进行几层的神经网络而已。这已经带来了丰硕的成果。但是他们远远不如新浪微博,新浪微博构建的其实是一个大脑,每个账号是一个神经元,关注关系就是神经元之间的链接,僵尸粉根据上家的信息做出来的各种反馈,就是神经元之间传输的电信号。新浪通过这个架构和长期的进化淘汰,慢慢的在让这个僵尸粉网络产生越来越深度的智能,人类会慢慢被洗出去。现在我们会发现一个公司做活动的几十万转发,就可以由一组僵尸粉完成。这满满的形成了一个自组织自洽的体系。

一般人因为理解不了这么复杂的一个神经网络的价值,所以会觉得不还是一堆僵尸粉么,错了,有了这样规模的智能,新浪可以去破解任何保险箱密码,可以黑掉任何网络,可以去任何网站发帖造谣,可以把美国人家里面的nest调成零下5度,无所不能。这才是天网的真实面目,大家幸甚活在这个年代,什么空气污染马上就不是问题了,我们很快就会被母体当作电池保存起来,活在恒温恒湿,各种快乐之中了。

打赏

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据