谷歌在其云上提供了5000万张图纸的数据集

你可以通过一个人的涂鸦来了解他。这就是谷歌创意实验室于2016年11月推出的互动网络实验“快画”(Quick Draw)背后的创意。它招募了一些勇敢的网民,让他们用草图来说明提示,同时利用人工智能(AI)来试图识别出画的是什么——有点像高科技版的Pictionary。

Quick Drawhas收集了345个类别的超过10亿张图纸,其中5000万张是去年谷歌开源的——包括提示和地理用户位置等元数据。今天,它通过谷歌云平台(GCP)以API和相应的聚合物组件的形式提供这些组件。(对于外行来说,Polymer是一个用于构建web应用程序的开源JavaScript库。)

从本周开始,任何加入公共谷歌组的GCP客户都可以通过搜索API并将其添加到项目中,从而将该API添加到他们的库中。有了聚合物组件,涂鸦只需一行代码就可以显示在基于web的应用程序中。

谷歌创意实验室的创意技术专家尼克·乔纳斯在接受VentureBeat的电话采访时说:“当我们发布数据集时,它基本上适用于345个类别中的每一个类别,使用起来有点麻烦。”“过去一年做的很多研究都是对整个数据集的大型分析。我们从开发人员那里得到了一些反馈,他们说他们想要一种更简单的方法来快速原型化数据。”

快速绘制API——它使用谷歌云端点来托管Node.js API, Jonas解释说——提供了对原始数据集中包含的5000万个文件的访问,但是省去了下载它们全部的需要。它为每个绘图返回一个JSON对象或一个HTML画布呈现—一个涂鸦。

乔纳斯说:“这是一种让用户在开始使用它之前不必下载大量数据的方法。”

从这些数据中可以得出一些惊人的见解。Quartz今年6月的一项研究发现,86%的美国玩家是逆时针画圈的,而80%的日本玩家是顺时针画圈的。(研究发现,这种差异可以归因于日语书写中从左至右的笔划顺序。)与此同时,谷歌Research的一项内部调查发现,来自西方国家的用户往往会在鱼的朝向与亚洲用户相反的方向上涂鸦。

数据集也被创造性地使用。英国艺术家尼尔·门多萨(Neil Mendoza)使用一种面部跟踪算法在人的头上快速绘制草图,德国计算机科学家黛博拉·施密特(Deborah Schmidt)从30万张随机涂鸦中选取了一部分,用拼贴画填充字母模板。

在未来,该团队正在考虑将涂鸦迁移到数据库中,这样就可以进行精细的访问控制。从理论上讲,用户可以查询“在2017年3月给我一份来自中国的公认的图纸”。

“我只是想鼓励人们以新的方式使用[数据集],并做出贡献,看看这可能如何扩展,”乔纳斯说。“我只是想鼓励开发人员使用它。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。