这个网站做数据科学家的FB 但除了社交还做实事

2016 年 7 月 23 日2610

网易科技讯 7月13日讯,如果说早期到中期的社交网络注重广度,目标是建设一个能覆盖所有人的网站,那么现在则是为特定人群或行业开发一整套平台的细分市场阶段了。明眼人可能说,这难道不是互联网早期的网络聊天室和留言板吗?没错,但这些更有针对性的社交网络将提供Web2.0加强后的“聊天室”,来自世界各个地方的极客和爱好者们不仅可以在网站上发帖交流自己的看法,还可以合作开发项目。

  如果说早期到中期的社交网络注重广度,目标是建设一个能覆盖所有人的网站,那么现在则是为特定人群或行业开发一整套平台的细分市场阶段了。明眼人可能说,这难道不是互联网早期的网络聊天室和留言板吗?没错,但这些更有针对性的社交网络将提供Web2.0加强后的“聊天室”,来自世界各个地方的极客和爱好者们不仅可以在网站上发帖交流自己的看法,还可以合作开发项目。

  已经有不少网站开始尝试细分社交的思路了。医生和医学院的学生一直希望有平台能让他们分享、学习病患的医疗图像。另一些针对特定爱好人群而设计的应用程序则覆盖了从《七龙珠》到泰勒·斯威夫特的种种话题,人们可以分享传言、玩家绘画,以及下载老电视剧的最佳网站等等。每个应用程序的用户量从几千到10万不等。值得一提的是,这些针对细分市场的应用虽然用户量远远不及Facebook这样的社交巨头,但其用户的活跃度却往往超过了Facebook。

  最近最火的一个细分社交网站无疑要数Data.World。这是一个面向数据科学家和有数据分析需求人群的社交网站。它提供了一个让用户们把所有数据集中在一处的解决方案。他们的最终目的是通过收集和整理千千万万的数据集,能够让用户们从中挖掘出新的可用信息,实现“1+1>2”的效果。该公司已经筹集了1400万美元资金用于开发其平台,并已于今日上线。

  美国人口统计局的首席营销官Jeff Meisel表示:“Data.World想要解决的问题是当前数据科学最棘手的一块,那就是如何能将政府提供的数据和其它相关数据结合在一起,让官方数据真正发挥出它们应有的价值。”

网易科技讯 7月13日讯,如果说早期到中期的社交网络注重广度,目标是建设一个能覆盖所有人的网站,那么现在则是为特定人群或行业开发一整套平台的细分市场阶段了。明眼人可能说,这难道不是互联网早期的网络聊天室和留言板吗?没错,但这些更有针对性的社交网络将提供Web2.0加强后的“聊天室”,来自世界各个地方的极客和爱好者们不仅可以在网站上发帖交流自己的看法,还可以合作开发项目。

  Data.World的界面与Facebook非常相似,每个用户都有自己的资料页面,包含头像、姓名等信息。它也有推送功能。在此之外,作为专为数据处理人群设计的网站,Data.World也允许用户关注一个数据库而不一定是一个用户。

  用户可以在Data.World搜索、分析、下载数据。从Data.World上下载数据的一大优势在于所有数据都是按照Data.World的统一规范整理过的,所以可以很容易地合并多个数据库。处理过数据库的人都知道,合并数据库往往是非常枯燥乏味的一项工作。数据科学家们还可以在数据库下面留言评论,相互交流,但目前Data.World还没有提供用户间私信的功能。

网易科技讯 7月13日讯,如果说早期到中期的社交网络注重广度,目标是建设一个能覆盖所有人的网站,那么现在则是为特定人群或行业开发一整套平台的细分市场阶段了。明眼人可能说,这难道不是互联网早期的网络聊天室和留言板吗?没错,但这些更有针对性的社交网络将提供Web2.0加强后的“聊天室”,来自世界各个地方的极客和爱好者们不仅可以在网站上发帖交流自己的看法,还可以合作开发项目。

  大数据的要义在于通过合并许许多多的数据,让人们得以通过合理的研究方法从中发现系统的规律,并在此基础上做出预测。比如科学家可以利用它分析癌症在不同阶段的变化过程或跟踪某种治疗手段的效果。商业公司也可以通过分析大数据来掌握客户的种种特点,以此来提高销量。

  来自宾夕法尼亚大学的市场营销教授Peter Fader说道:“如果我真的能掌握有关客户的360度全方位信息,那我的公司无疑可以运行的更有效率。但许多人都对此很不屑,他们总会说"说起来容易做起来难",这话也不假,因为数据库的基础建设还是一团麻,很难把不同的数据库连接在一起。”

  人们已经在收集、存储、同步数据上花了很大功夫,但要真的发挥出大数据的全部威力,还有许多关键性的障碍需要解决。Fader教授指出,其中之一就是数据的搜索问题。假如你有你的产品在某个地区的销售数据,但你没有任何关于顾客本身的数据,那么你就需要从别的地方找到相应的数据。就这个例子来讲,你可以会到人口统计局网站上去下载官方的公开数据,但这些数据并不能直接连接到你自己的数据库里,有的统计方法不同,有的格式不同,这些细节问题会耗费你大量的时间和精力。

  来自麦肯锡全球研究所的Michael Chui说道:“许多数据科学家们表示他们在整理数据、处理细节差异上耗费了80%的时间。任何能让数据科学家们把更多宝贵的时间挪到真正的数据分析上的努力都是伟大的。”

  数据来自方方面面,它们分散在政府网站上、众多大学的网站上以及许多公司里。它们整体非常零散。正如Chui所说的那样:“目前来说,对在数据搜索方面,我们还没有像今天的搜索引擎那样便捷的搜索方案。”

  这也正是Data.World的目标之一,它希望可以成为下一代数据搜索引擎。在刚刚上线的时候,Data.World有约1000个从公共网站上下载的数据库,他们和美国国家科学联合会合作,直接把人口调查局的数据导入到网站上。除了建设数据搜索引擎外,Data.World创始人还希望通过人工智能等技术向用户推荐相关的数据库,帮助科学家发现更多数据。

  Meisel说道:“Data.World的愿景是研究人员能够更方便地找到彼此并利用数据库解决问题。”在伊波拉这样的公共健康危机爆发时,Data.World可以帮助官方更快地完成数据分析。

  Data.World平台很可能是免费使用的,只有再上传不与他人分享的私人数据库时需要付费。这一服务可能针对想要利用Data.World网站上的数据库分析自家数据的公司。

(责任编辑:柯博文 HT006)

0 0