许多研究人员都对直接从网站获取新的数据很感兴趣 。但是从网站上收集大量数据可能是不切实际的 。当手动收集数据后 , 很容易出现人为错误 。当自动收集数据时时 , 它可能会违反网站的服务条款 。
所以 , 研究人员通常依赖一个被称为API的工具 , 该工具代表应用程序编程接口 。Web API根据规则提供了网站和用户之间的通信方式 。特别是 , 它们允许用户通过从特定网站下的数据库请求数据 , 从而快速获得明确定义的数据类型 。(这不是唯一的API 。例如 , 智能手机应用程序经常使用API在你的设备和应用程序的数据库之间来回传送数据 , 但是在这篇文章中 , 我们关注的是从网站向用户提供数据的API 。)
许多大公司以及政府机构都创建了公共API 。这些组织的数据可以很容易的访问 , 以鼓励开发人员使用他们的平台 。在Pew研究中心 , 作者经常使用API为研究收集信息 。常见的有我们在社交媒体中的机器人、关于枪支的Google搜索、Facebook上的科学页面以及关于政府政策的公开评论中(都使用了API) 。
API如何提供数据
API提供各种形式的数据 , 但JSON是其中最受欢迎的 。JSON是用于构造数据的有用文件格式 , 因为它保存了与制表符或逗号分隔文件(如.tsv和.csv文件)相关的更多层次结构和关于数据集的元信息 。根据你用于数据分析时使用的编程语言 , 有些库可以使JSON数据操作变得直观 。例如 , 在R统计语言中 , 可以使用jsonlite库将API中的数据转换为熟悉的R对象和类 。
API可以用于不同的编程语言
为了在各种用不同语言编写的计算机程序(如Java、Python、R等)上有效地与API进行交互 , 研究人员依赖于API”封装器” 。这些工具(存在于大多数流行的API中)允许研究人员在使用他们自己选择的编程语言的同时直接从API请求数据 。下面 , 我们以世界银行的API为例 , 使用R访问数据 。
示例:如何与世界银行的API进行交互
世界银行API为研究人员提供了数百个关于世界各国健康、财富和文化的变量 。为了展示如何使用这个API , 我们可以编写一个脚本来获取一些变量并绘制它们 。在这种情况下 , 我们将使用世界银行提供的识别码搜索变量 , 然后将变量提取到R的内存中 。
下面的代码使用WDI包 , 这是一个包含世界银行API封装的R包 。(如上所述 , 封装器是一个函数或一组函数 , 用于执行对API的调用 , 并将结果转换为比API本身更有用的内容 。)要执行此代码 , 首先必须安装WDI软件包以及devtools、ggplot2、gganimate、data.table和dplyr 。你可以使用以下命令为R安装这些函数:
我们还将为动画安装gganimate附加软件包:
现在安装了这些软件包 , 让我们将它们加载到工作内存中:
推荐阅读
- 免费翻译文言文的app 文言文翻译器在线翻译软件
- 中国免费文献检索网站 常见搜索引擎有哪些
- 照片打印软件免费版 照片打印图片
- 产品网络推广的免费渠道和方法 如何进行产品推广
- 手机助手排行榜 电脑软件助手哪个好
- 免费的word转换器推荐 word转pdf工具类
- 免费领取一个微信号 手机号可以注册几个微信号
- 利用百度搜索免费做推广的方法 百度搜索引擎营销步骤
- 微信还信用卡如何免费 微信可以还信用卡吗
- 破解版修复数据软件 顶尖数据恢复软件破解版