加拿大数据开放平台data.gc.ca的启示与教训

那些看过推特的人早已经知道,我将行权举办记者招待会,宣布data.gc.ca的上线。这是联邦政府数据公开湖的入港口。对于那些想深入了解数据开放和探究为什么这很重要的人,我的建议是这个网址,这篇公告以及这篇文章——他们列出了一些数据开放极其重要的原因。

这次发布会,我想回顾一下data.gc.ca项目的启示与教训!

加拿大数据开放平台data.gc.ca的启示与教训

启示丨关于data.gc.ca的重要议题

也许关于data.gc.ca最重要的议题是现在联邦政府数据公开湖的入港口已经部署。这意味着,整个加拿大政府公务员系统中,谁拥有想和大家分享的数据,通过data.gc.ca转入互联网,已成为新政策体系的一部分。这是中央机构行政许可放权的重大信号。通过入港口接入体制,大量给予那些需要数据共享许可权的人,一个流程标准化的、高速化的数据传播途径。由此可见,data.gc.ca自身的意义重大。

事实上,我被告知,已经有许多部门和私企都被要求开始接触并操作data.gc.ca来分享他们的数据。这样的结果类型正是我们作为公民应该想看的。

另外,我听说政府要将接入data.gc.ca的部委和数据量翻倍。所以这给我们的另一个启示是政府承诺将其发展壮大。我认为这是很重要的,很有意思。尽管有一些数据公开湖的接入港已经大张旗鼓的高调展开,但也仅仅是一些数据没有源泉的,不可持续发展的信息孤岛,必将被时代所淘汰。

进展丨成果如何

辩证的说,“数据湖中的金矿”依旧是稀缺资源。因此我觉得,必须对U2U异化模式中构建价值制高点的基础时刻保持谨慎的态度。就是说,清澈的数据湖将给加拿大带来波澜壮阔的影响:预算数据,项目部花费数据(如英国),食品检验数据、产品召回数据,加拿大统计局网站(http://www.statcan.ca/)的每一个信息,加拿大服务中心的坐标,邮政编码集,邮箱地理信息,商业许可证信息,税收信息,慈善机构和公开上市交易的公司信息,只要是能想到的,我还能再列举出很多以及更多……

我认为那些透明产业,技术产业,创新产业,移动产业和线上服务团体未来将更加密切的关注data.gc.ca,来看我们在数据湖中搞了什么花样。而精髓的地方是政府也将要求人们来反馈他们需求在数据湖中看到什么样的信息。我个人强烈鼓励人们让政府知道他们想看什么,特别是当人们的需求涉及到政府已经分享过的数据时,人们获取了一种无法使用的格式。

教训丨一个词:许可证

许可证漏洞深深的打击了data.gc.ca。有些人到目前仍然沉迷在老生常谈的观点,许可证不允许数据开放——这种批判,我认为是公平的。但我想要表达的是:现如今的data.gc.ca数据公开许可证可以有效的灭掉商业创新的任何可能,并限制各处数据被精准控制在非盈利领域的使用。

这条线是第一个,同时也是最大的阻碍:

“在加拿大政府看来,可能损害本国形象或曲解本国声誉时,您不得以任何方式使通过GC数据公开湖入港口获取的数据不失效“。

这是什么意思呢?这是否意味着任何从data.gc.ca获取数据的记者,在文章撰写时,批判政府行文的论调,都是公然违反使用条款?这种情况是可能会出现的。从问责制和透明化的角度看,这是致命的问题。

从商业的角度来看,它也存在问题。如果有人想使用来自data.gc.ca的信息资源去帮助身边的人,那么在利用这些政府提供的信息时,他有可能会得到一个好的结果,但如果得到一个坏的结果,是否算违约?这个问题实质上是条款的隐性逻辑与约束,使那些意图利用这些数据的企业审视其所必须承担的代价。

更新:3月17日星期四,下午3:30,部长打电话通知我,他们将从纸面上废除这一条款。这是一个令人振奋的消息,同时data.gc.ca的快速行动也受到了财政委员会的称赞。这也是极大的认可,这是一个充满希望的试点(如β阶段)项目,这里提及的一些其他问题,在下面的评论中也将得到解决

这样的条款毫无价值,世界上没有其它任何一个数据公开湖入口港有这样的条款。

第二条战线是:

“除了重新编译软件兼容的特定目的,你不得反汇编,反编译,或试图以任逆向方式激活data.gc.ca所提供数据的任何部分。你不得将来自于data.gc.ca的数据合并或链接到任何产品或数据库,来识别个人信息,家庭信息,房主信息或者以这样一种方式,来加持你已经收到的或者获取的,由加拿大官方政府持有的个人信息,家庭信息,房主信息、组织信息、或商业信息。