新京报:12306新验证码能解决购票公平吗?

2015 年 12 月 8 日2890

  专栏

  从社会意义上看,新的验证码虽然排除掉机器登录,杜绝了机器与人之间的不平等,但是,在熟悉电脑与不熟悉电脑的人群之中,仍然存在数字鸿沟。

  3·15刚过,12306订票网站就推出全新的验证码,方式与以往数字或者汉字的不同,这次是根据汉字识别图片中的内容。登录12306,点击“点此开始验证”,之后会出现验证码图片,在网页上显示8张图片,有贺卡、雕像、动物、植物、热气球、家用电器等等,然后,要求消费者点击选出其中一类物品,比如,选出8张图片中所有的“鞭炮”或者“血压计”等等。只有多选正确后,才能顺利登录12306订票系统,没把握的可以刷新更换。网友们戏称,这是12306的“找茬”游戏。

  12306为何采用新验证码

  在去年的达沃斯论坛上,马云向外界透露,阿里巴巴在做的一个很大的项目是在“春运”期间为火车订票网站保驾护航。

  阿里的帮助的确起到了非常大的作用。2015年春运售票最高峰日出现在2014年12月19日,12306网站访问量(PV值)达到破纪录的297亿次,平均每秒PV(每秒页面浏览量)超过30万次,当天共发售火车票956.4万张,其中互联网发售563.9万张,占比59%,均创历年春运新高。把高频次、高消耗、低转化的余票查询环节放到云端,而将下单、支付的核心业务仍留在12306自己的后台系统上,这样的思路为12306减负不少。

  每秒30万次的PV很大程度是刷出来的。这里面有各种浏览器,抢票app的贡献,也有黄牛私人定制软件的贡献。在网络订票时代,网络黄牛配置了100兆光纤宽带;有专门为抢票设计的外挂程序。用黄牛自己的话说就是“一般乘客根本不可能有机会抢到票”。这种巨大的刷票增加了服务器的负担,造成死机,引来社会抱怨。

  于是,攻防战出现了:一边大流量刷,一边强大的服务器能力接受这种刷,力保不死机,但这样的攻防战不是根本的解决办法。所以,12306推出新的验证方式,就是为了堵住机器登录。

  总的来说,这次启用的图片验证码简单有效,正常用户可以轻松识别。新的验证码启用后,一时之间,现有的抢票软件都失效了。

  新验证码也有可能被破解

  不过,破解的可能性也是存在的。要破解,需要能够模仿人的点击,识别汉语,这两项技术相对比较成熟。唯一稍微有问题的是图片识别,虽然现在百度提出了百度大脑,拍照搜索,但实际上效果还是非常差,机器识别图片现在的可用性还不高,比如,机器很难识别二维平面上呈现出来的透视关系,而人类却可以进行“脑补”。

  但是,机器却有自己的粗暴办法。每一张图片的数字文件,都有自己特定的信息特征码,机器只要把图片的数字特征识别出来,然后,人工把这个唯一的数字特征与某种物品联系在一起,那么,当下一次机器遇到了这个图片,计算出了这个特征码之后,经过比对已有的特征码,机器就知道这张图片应该归为哪一类。

  当然,实现这个目标之前,必须人工完成所有特征码与类别的一一对应关系,所以,如果这里的“所有”指的是无限的话,破解就不可能实现。图片会是无限的吗?显然不可能,而且,图片量也不会太大。因为,12306网站,乃至后台程序本身,也识别不了图片,12306也需要事先人工把图片与类别一一对应。那么,只要图片库有限,机器自然就可以完成在所有图片中选出一种物品的要求,实现机器登录。不过,阿里的工程师与产品经理也并不是傻瓜,相信后续还会有更多的办法。不过,把点击、刷新与服务器容量的攻防战换做工程师与黑客之间的攻防战,仍然会消耗大量的费用。

  从社会意义上看,新的验证码虽然排除掉机器登录,杜绝了机器与人之间的不平等,但是,在熟悉电脑与不熟悉电脑的人群之中,仍然存在数字鸿沟,而买一张火车票,参与分配火车票这种稀缺资源,应该仅仅与公民的身份有关,不应该与年龄、文化程度有关。那么,从这个思路看,即便采用了新的验证方式,抢票也需要手脚更快,仍然做不到从容二字。

  刘远举(上海金融与法律研究院研究员)

0 0