玛丽回想起了早上的新闻。也许这是谜题中的一个重要部分?埃德加的热情让她深受鼓舞,她也确实看到了他的一些建议的明确意义——但她也有一些保留意见。“我可以看到数据和分析领域正在发生很多事情,但这些数据是否会随着时间的推移保持足够稳定,从而有助于政策决策?其中一些数据源在未来几年还会存在吗?我们用来分析研究趋势的数据的一个重要优势是我们可以信任它。随着时间的推移,它相对稳定。我们不知道 Twitter 会存在多久,也不知道人们是否会改变使用它的方式。此外,我听到有人谈论‘机器人’可能会扭曲我们可能做的任何分析。”她继续说,“这不仅仅是关于数据随时间变化的稳定性,也与可比性有关。我工作的一个重要部分是能够将我们的表现与其他国家进行比较。例如,我们是否能够使用这些数据在欧盟层面进行有意义的比较?”
这些挑战是 Edgar 在查阅的关于使用新数据制定政策的文献中看到的,引起了激烈的争论。“我不会假装知道这些困难而重要的问题的所有答案”,他开始说道。“长期稳定性和跨国可比性是真正的挑战——确实有些新数据来源并未覆盖欧洲所有国家,覆盖世界多个地区的数据就更少了。但几年前使这类工作变得困难的一些挑战现在已经被克服,我相信如果我们努力寻找解决方案,我们将继续看到快速进展。例如,几年前,如果你想通过从政府网站上抓取信息来比较多个国家的研发税收抵免政策,那么这些文件都是以不同语言发布的,这是一个真正的障碍。在过去的几年里,我们使用谷歌翻译等工具以可靠的方式自动翻译文本的能力取得了令人瞩目的进步。”他继续说道:“验证新数据来源并确保其可信的另一种有效方法是将它们与更‘传统’的来源(例如来自调查的现有指标)联系起来或进行交叉引用。”玛丽看起来很感兴趣,但并不完全相信。
“让我们花点时间回顾一下机遇”,埃德加继 LINE 数据 续说道。“告诉我,你想要什么?你会如何使用它来制定政策决策?”轮到玛丽分享她的所有想法了,她对数据机遇的热情与埃德加一样高涨。“更好的评估数据”,她开始说道。“我们想了解我们正在实施的政策和计划的影响,但现有数据使我们很难有效地将投入和活动与最终影响联系起来。”她继续说道,“我们还想更好地了解知识转移、商业创新和新兴技术的动态,这些可能会极大地影响人们的工作和整体经济。”进一步深入探讨联系的概念,她继续说道:“我们希望更好地了解复杂系统及其动态——我们希望超越难以传达整个故事的单个独立指标。”
埃德加笑容满面,迅速打开笔记本电脑,在会议室前面的宽屏幕上调出一张巨大的网络图,上面满是鲜艳的色彩、节点和相互连接的线条。“为了传达复杂的信息,我们需要重新思考我们呈现数据的方式,”他兴奋地说。“目前,我们使用的大部分数据都以静态格式呈现在一份长篇报告中。如果我们可以利用新的交互式工具,让用户更好地控制提问的类型和信息呈现的方式,那会怎样?一些交互式工具已经开始绘制某些地方的创新格局,让我们能够看到各种各样的动态,比如大学和私营公司之间的合作网络。这个工具甚至可以推荐合作,而且它是完全免费和开放的,任何人都可以使用。”
他热切地看着玛丽,等待着她的回答。一片寂静,然后是“我到底在看什么?”埃德加不知道该如何回答——“这是……一张网络图。”玛丽笑道,“是的,我知道了。它看起来很不错,但我不确定我是否更喜欢它而不是条形图。”她停顿了一下,然后继续说,“但也许我只是需要一些时间来适应它,或者并排查看几个例子,以便理解它告诉我的内容。”埃德加松了一口气,小心翼翼地笑了笑,想要保持他们谈话中那种合作和开放的精神。玛丽看了看手表,然后又看了看屏幕,结束了会议,和爱德华握手,热情地微笑着说:“这是今天的一个好的开始——如果我们能做好,它有很大的潜力。让我们看看我们能把它带到哪里。”
该博客是 EURITO 范围界定阶段活动的一部分,并传达了“文献综述报告:数据在 R&I 政策周期中的作用”和 2018 年 4 月 17 日举行的第一次政策利益相关者研讨会的调查结果。如需更详细地了解,请参阅: