基于Scrapy的农业网络数据爬取 |
| |
引用本文: | 李乔宇,尚明华,王富军,刘淑云.基于Scrapy的农业网络数据爬取[J].山东农业科学,2018(1). |
| |
作者姓名: | 李乔宇 尚明华 王富军 刘淑云 |
| |
作者单位: | 山东省农业科学院科技信息研究所; |
| |
摘 要: | 准确、及时、高效地获取农业数据是全产业链农业信息分析预警工作的前提和基础,是提升农业信息分析预警专业化和规范化水平的关键。本研究针对互联网中存在的大量农业信息数据,以玉米价格数据为例,设计数据抓取和规范化存储策略,首先基于Scrapy框架建立对网页的请求响应,分析网页布局后对关键信息进行循环抓取,并利用正则表达式将抓取的信息提取为格式化数据,然后将数据本地化存储为Microsoft Excel表格或存储至数据库中,最后利用Echarts将数据以可视化的方式在Web端展示,从而实现对农业网络数据的挖掘和利用。
|
本文献已被 CNKI 等数据库收录! |
|