天气数据应用背景:
大家是不是有这样的习惯,每天早上起床第一件事,先看看天气预报,天气的好坏,可能会影响我们一天的工作、生活、或者身体的状态。对于某些行业来说,比如零售业,天气的好坏也随时影响着他们的营业情况。天气信息对我们来说非常重要,对企业也一样,那么今天就教大家如何获取真实有效的天气数据,来辅助我们的业务分析。
我们知道,航空公司对天气数据的要求是非常高的,因为这影响着飞行安全,有这么一个网站,WU Weather Underground (Link: https://www.wunderground.com/),实时采集并记录着全球机场的天气状态,当然它不仅包括我们平常关注的温度,还包括气压、风向、能见度、热指数、湿度、降雨等等,比如输入Shenzhen(深圳),可得到以下天气情况:
如果可以将这些数据采集并存储下来,为企业的数据挖掘分析应用场景所用,是不是很赞呢?接下来一步步教大家使用SPSS Modeler 18.0最新版本扩展功能来实现吧。
环境准备:
安装相关的软件,按以下顺序安装:
1. 安装IBM SPSS Modeler 18.0客户端
http://bigdata.evget.com/product/168.html
2. 安装开源软件R (这里需要注意,与IBM SPSS Modeler对应的R都有相应的版本要求,对应着SPSS Modeler 18.0版本的是R 3.2版本,比如我这里安装的是R 3.2.2版本),R下载链接如下:
3. 安装IBM SPSSModeler 18.0与R的集成插件R Essentials for SPSS Modeler plugin,该插件下载链接如下:
https://developer.ibm.com/predictiveanalytics/downloads/
安装该插件的时候,会让您选择已安装R的路径,所以在安装此插件之前,需要先安装R。
实现该功能,需要的程序包有两个,下载链接分别是:
plyr 程序包:https://cran.r-project.org/web/packages/plyr
weather Data程序包:https://cran.r-project.org/web/packages/weatherData
选择相应操作系统的程序包,直接单击下载即可。
下载完成后,直接打开R,在菜单栏上选择“从本地zip文件安装程序包”。
然后选择刚才下载的程序包文件载入即可。
获取扩展程序 :
在之前一期的微信文章〈IBM SPSS Modeler 18.0新版本强劲推出〉里面有介绍到,IBM SPSS Modeler 18.0最新版本提供强大的扩展功能,那么这里,我们就选择其中的一项扩展功能来载入。
打开IBM SPSS Modeler 18.0之后,在菜单栏上,选择扩展—>扩展中心
得到以下面板,选择我们需要的天气数据导入包“Weather_Underground_Import”,勾选“获取扩展”,然后确定即可。
载入完成后,会在IBM SPSS Modeler 18.0字段选项面板,看到新安装导入的节点“WeatherUndergroundImport”
准备数据文件 :
接下来,准备源文件,记录你需要获取哪些日期以及地点的天气数据,我这里使用Excel表格data.xlsx,记录两列数据,分别是Date和locationID,再输入我需要了解的日期及地点,如下图:
在SPSS Modeler 实现最后步骤
打开IBM SPSS Modeler 18.0,选择源节点Excel,选择上一步文件中准备好的data.xlsx.
对数据格式作转换,这里程序包写好的日期格式是YYYY-MM-DD,如果您准备的文件日期是这种格式,则不需要做转换,我这里的文件日期格式是MM/DD/YYYY,因此先使用导出节点对日期格式做下转换,使用的是字符串函数substring以及拼接字符符号>< 。
转换公式是:substring(7,4,Date)>< "-" >< substring(1,2,Date)><"-" >
接下来直接连接我们载入的新节点WeatherUndergroundImport,按下图设置。
完成后,最后可通过表格来查看各城市的天气情况了。
这里的天气数据包括有如下内容:
至此,我们就完成了对外部的天气数据的获取了,接下来就可以利用这些天气数据“为所欲为”了。
总结
IBM SPSS Modeler 18.0最新功能的扩展,让用户更加方便、无限制地增加扩展应用功能,具体链接如下:
http://bigdata.evget.com/product/168.html
每个应用都有相应的介绍文档以及Demo示例,点击上图的GO TO REPOSITORY进入具体的应用介绍,如下图:
选择相应点击右边的Download Zip可下载所有这些内容,非常有用也非常方便。
感兴趣的朋友,还不赶紧试下~
更多大数据与分析相关行业资讯、解决方案、案例、教程等请点击查看>>>
详情请咨询在线客服!
客服热线:023-66090381