现在我才慢慢明白新浪微博的高瞻远瞩

2014 年 1 月 30 日3350

昨天一个很简单的讨论取暖器效率问题的链接在新浪被无数的僵尸粉转发和回复,我仗着记忆力把所有明显的僵尸粉给拉黑了,他们的特征很明显,就是重复几个真人在这条微博里面的回复和转发的内容。这对一般人来说欺骗性很强,但是我记忆力虽然不好,但是排重能力很强,对这种重复的东西很敏感。(阅读社会新闻)

杀着杀着我又开始不拿新浪工资替新浪考虑了,比如如果用算法,这类僵尸该怎么清除。比对一个人是不是喜欢去某条微博下面重复别人的话?当然这有一定的工程和算法难度,因为中国人本来就有僵尸属性,如果第一个人说了“顶”,或者“赞”,后面的每一个人说“顶”或者“赞”的概率只接翻10倍,第一个人说的是“踩”,或者“转发三次,你的名字会变绿呦”之类的,也会效果类同。当然,还是有很多办法可以灭掉僵尸的,行为总是跟人类(尤其是具有超强的僵尸属性的中国人类)有区别的。比如我很快就发现,我封杀的所有僵尸,除了刚才的行为以外,另外一个行为就是热衷转发各种活动贴(呵呵,谁家在给僵尸付钱都看得出来)。(阅读军事新闻)

但是,我转念一想不对劲,新浪那么多技术人员,那么多人做僵尸粉清除,他们会不如我么?

我再仔细的联系了一下,我才明白了新浪的险恶用心(误)用心良苦,新的时代是数据挖掘的时代,这个时代最重要的新成果是deep learning,简而言之,deep learning就是跟大脑结构很接近的大规模神经网络学习算法。这个太复杂,我们先从简单的说起。

大脑的结构是什么呢?就是有一堆神经元,相互之间有突触,这些突触都是在神经元接收到刺激以后,随机产生,然后随着同类型刺激和反馈作用而强化的。简单的说,就是,谁跟谁连着,本来无所谓,但是慢慢的连多了,就形成了一些固定的链路,这些链路一旦对人有价值,就会慢慢的被强化。比如,你学英语,本来听到hello这个词,你的大脑不知道怎么反应,但是一遍一遍的听到hello,就产生了一个关于hello的链路,最终结果告诉你,别人喊了hello,你应该也说hello。当然,每一个链路都不是一个两个的神经元的联系产生的,大脑有大量的神经元,他们能产生出来大量的链路,这些链路就是你的知识,你对世界的看法。这是一个层次超过的神经网络。

我们假设存在一个单层的神经元网络,他的逻辑可以很简单,比如,重复跟他有上游神经元的话语,或者忽视,或者反转,或者怎么处理都可以。大家有点听出来眉目了么?假设你把新浪微博里面的一个僵尸粉当作一个神经元理解,你就发现了新浪微博的可怕之处了。

进化之路

我们在任何一个历史时期,都会发现新浪有大量的僵尸粉,然后我们也会发现一些被我们发现的僵尸粉被干掉。这是什么呢?这就是新浪在进行神经元的训练和进化流程。一开始,所有的僵尸粉的目标是,给大号们涨粉。所以他们的特征就是不跟别人创建联系,只关注某些大号。这不算合格神经元,没有任何输入输出链路。

这个特征很快被新浪发现,所以,这些僵尸粉被绞杀。但是新浪的丧心病狂(误)高瞻远瞩在于,他知道如果一次性对僵尸粉斩尽杀绝,就等于在无菌环境下培养细菌,这是不可行的。所以,他们的策略是,随机留下50%的僵尸粉不碰。但是所有被杀掉僵尸粉的赶尸人(不是湘西的,是中关村的、张江的、南山的、文二路的等等),就开始研究新浪的策略是什么。他们因为信息不对称,不知道新浪的50%封杀策略,所以自然的认为是自己的僵尸粉不够智能。所以,那些会说一些重复傻话的僵尸粉出现了。他们仍旧不够合格,因为他们是傻输出,不管别人怎么回复他们,他们只会喃喃自语。但是,新浪这时候已经欣喜若狂了,你想如果你是疯子科学家,你把弗兰克斯坦的材料放在手术台上,螺丝还没拧呢,这时候一个球形闪电击中了这些破铜烂铁,然后一个非碳基生命就诞生了,虽然他傻得一逼,但是你作为一个没有上过大学的民科,不懂什么叫做图灵实验,你觉得这就够屌了,不管怎么说自己会走路,会说话,虽然走路就撞墙,说话谁也听不懂。但是你去问问中国的大多数民科,能削面就叫做高级机器人了,能推车就叫做自行走了,你这个虽然获得不了诺贝尔,上个走近科学之类的还是绰绰有余的吧。

但是,新浪虽然文化程度不高,但是野心还是很伟大的,他没有止步于此。他开始干掉原来留着的那50%第一代僵尸粉。然后顺代干掉了第二代僵尸粉的50%。第一,要优化环境了,老版本的不产生活跃度,而且浪费系统资源;第二,要给赶尸人一点点压力了。赶尸人们刚刚升级了一次技术,广告词也从可以涨粉变成了可以涨活粉。虽然损失惨重,但是那些都是赛博生命,费电点而已,而且还不是费自己的。一方面,赶尸人开始觉得新浪跟神一样伟大,居然连这种说着“aaaa”,“cccc”,“xxxx”的纯粹会说话的僵尸都可以发现,而且还下手这么狠。但是同时赶尸人发现虽然粉经常被干掉,但是生意越做越大,因为新浪不会因为你的粉丝都是已经被杀死的僵尸粉,而把你的粉丝数重新计算,老客户们没有任何抱怨。所以说,新浪大神可能也是很眷顾我们的吧?那就技术继续升级吧。看来,不接受输入,只输出是不行的,因为太容易被看出来。怎么办呢?那么我们开始复制被人说的话吧?

赶尸人其实都只是一个技术工种,会python/php甚至js都可以开公司了。但是,他们无知的在新浪大神的驱使下,进行的小小的技术升级,却催生了整个技术行业的最伟大变革。要知道,我们身体里面有无数的体细胞,无数的脑细胞,无数个各种细胞,从单细胞生物的观点,这些细胞都是单独的生命体,离开人类这个母体也是可以生存的,只要有适合的环境即可。这些细胞都是没有什么智慧的,但是他们链接在一起,就产生了智慧(主要还是脑细胞的链接)。而且除了新浪以外没有人掌握谁是僵尸谁是真人的全部图谱,所以,实际上僵尸粉的链接有可能连在普通人上,有可能连在僵尸粉上。

  

0 0