《Python地理数据处理》——第1章 引言1.1 为什么使用Python和开源工具

简介:

本节书摘来自异步社区《Python地理数据处理》一书中的第1章,第1.1节,作者: 【美】Chris Garrard(加勒德) 更多章节内容可以访问云栖社区“异步社区”公众号查看。

第1章 引言

本章内容

介绍空间数据的基本类型
什么是地理处理
QGIS软件的使用
人类制作地图的历史远比我们开始写作的时间久远,法国著名的拉斯科岩洞壁画上就有一幅星空图。古时候,世界各地的人们都曾使用过地图,如巴比伦人、希腊人和中国人。制图的艺术在这数千年中也在不断发展演化,从最初将洞壁岩穴作为介质,到后来将泥土沙盘、羊皮纸、纸作为介质,再到现在的电子地图。随着技术的发展和进步,地图上所包含的细节越来越多,每个要素也越来越精确。事实上,因为最早期的地图结构简单,大多数人可能很难将其作为真正意义上的地图。

从洞穴墙壁上的刻画到大规模量产道路线图的转变,经历了很长时间,但是过去几十年的巨大变化的确令人惊叹。随着地理信息系统的普及以及更易使用,越来越多的人能够分析其空间数据,并制作出自己的高品质地图。随着网络地图以及网络地图服务的出现,用户可以在线制作自定义地图,并与世界各地的用户进行分享。我们中的大多数随身都带着移动设备,这些移动设备里安装的地图软件可以显示当前位置,并引导我们如何到达一家准备体验的新饭店。不仅如此,数据的可获得性也发生了巨大转变。早期的地图制作者如果了解到我们要把道路数据叠置在航空影像以及可通话GPS设备上时,将会十分震撼。

基于这些技术的进步,以及众多免费和开源的工具产品,你可以使用功能强大的软件来处理自己的数据。本书的目的主要是教你有关处理空间数据的基本概念以及如何通过Python编程语言和其他开源工具进行具体的操作。读完这本书,你将学会编写Python脚本来解决基本的数据分析问题,并获得解决更复杂问题的背景知识。

1.1 为什么使用Python和开源工具

使用Python和开源工具处理空间数据有以下几个令人信服的原因。首先,Python是一门功能强大的编程语言,与其他语言相比,它的优势是更容易学习,而且使用Python编写的代码也很容易阅读。如果你之前从未编过程序,这是一门很好的入门语言;如果你是从其他开发语言转变而来,你将会发现Python很容易上手。

学习Python是一个不错的选择,即使你读完这本书后不再用它进行空间分析,它依然是你编程时的绝佳之选。许多不同的Python模块可广泛地应用于众多的应用程序中,包括网络开发、科学数据分析和三维动画。事实上,地理空间应用程序只是Python众多应用中的一个很小的子集。

此外,Python是一门多平台语言,除非你使用的是限定于某个操作系统的特殊模块。你在一台机器上写的Python脚本可以在任何其他机器上运行,前提是脚本运行所需的模块已被安装。你可以在自己的Linux机器上开发一套脚本,然后将它们提供给使用Windows系统的同事,所有的脚本都应该可以正常运行。你只需要安装Python解译器运行代码,因为,这些主流的桌面操作系统都可以免费获得。

Python附带的核心语言包及众多的模块代码,都可以在自己的代码中使用。此外,还可以通过其他来源获得更多的模块代码。例如,Python包指数(PyPI),此网站上罗列了60000多种不同应用目的的扩展模块,而且全部免费。然而,这并不是说所有的Python模块都是免费的。有GIS背景的人肯定对ArcPy很熟悉,这是一个ArcGIS附带的Python模块,但如果没有ArcGIS许可授权,此模块是无法使用的。

Python不仅有大量免费的Python包,而且其中许多还是开源的。尽管一提到开源软件,大多数人就想到它们是不用花钱的,但这仅仅是开源的一部分含义。开源的真正意义是,如果你愿意,就可以获得源代码。你能访问源代码意味着没有任何东西是“黑盒子”(如果你想花时间一探盒子内部的究竟),你可以根据自己的需要修改这些代码,这才是极度的自由。我曾经使用过一个开源工具但它不能很好地满足我的需求,所以我就稍稍改进了源代码,经过重新编译,然后就有了一个能完全满足我需要的实用程序。而这对于专有软件是完全不可能的。开源软件自身具有的这两类自由特性,使其成为一种有吸引力的模式。

目前存在几种不同的开放源码许可类型,其中一些不仅允许你根据需要修改代码,还允许你售卖开发的衍生作品,而且不需要提供源代码和你所做的修改。其他许可要求如果你使用此开源软件,那么基于此开发的软件也必须开源。

在本书中,我们将介绍一些用于地理空间数据的、比较流行的开源Python模块。一些模块最初是使用其他语言进行开发的,但随着这些模块变得如此通用并为大家所重视,它们要么被移植到其他语言,要么用于研发相应的绑定模块,以便能够应用于其他语言。例如,地理空间数据抽象库(Geospatial Data Abstraction Library,GDAL)是一个用于空间数据读写的非常流行的C/C++库,针对Python、.NET、Ruby和其他语言进行了相应的绑定开发。GDAL库甚至还被一些专有软件包所使用。因为此模块库的广泛使用,所以这本书主要介绍GDAL/OGR。如果你能学会使用这个,那么再学习其他库也将不再困难。有几个基于GDAL/OGR开发的库很不错,而且使用简单,但是我们并不需要将GDAL中所有的功能都提供出来。查看附录A,可以了解本书中用到的模块安装说明。

使用开源工具的另一个优势是有一些模块包的活跃用户社区,你会发现社区里对bug和其他相关问题的解决速度要比许多专有软件包更快,你甚至可以通过电子邮件列表与这些库的实际开发人员讨论其中一些细节。

相关文章
|
7天前
|
数据采集 存储 API
网络爬虫与数据采集:使用Python自动化获取网页数据
【4月更文挑战第12天】本文介绍了Python网络爬虫的基础知识,包括网络爬虫概念(请求网页、解析、存储数据和处理异常)和Python常用的爬虫库requests(发送HTTP请求)与BeautifulSoup(解析HTML)。通过基本流程示例展示了如何导入库、发送请求、解析网页、提取数据、存储数据及处理异常。还提到了Python爬虫的实际应用,如获取新闻数据和商品信息。
|
2天前
|
机器学习/深度学习 Python 数据处理
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力负荷数据
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力负荷数据
13 0
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力负荷数据
|
2天前
|
存储 机器学习/深度学习 数据可视化
Python面板时间序列数据预测:格兰杰因果关系检验Granger causality test药品销售实例与可视化
Python面板时间序列数据预测:格兰杰因果关系检验Granger causality test药品销售实例与可视化
39 6
|
2天前
|
机器学习/深度学习 数据采集 供应链
从数据到决策:scikit-learn在业务分析中的应用
【4月更文挑战第17天】本文探讨了scikit-learn在业务分析中的应用,包括数据预处理、分类、回归和聚类模型的构建,以及模型评估与优化。通过使用scikit-learn,企业能有效处理数据、预测趋势、客户细分并制定决策,从而提升经营效率和市场策略。随着机器学习的发展,scikit-learn在业务分析领域的潜力将持续释放,创造更多价值。
|
2天前
|
算法 数据可视化 Python
Python中LARS和Lasso回归之最小角算法Lars分析波士顿住房数据实例
Python中LARS和Lasso回归之最小角算法Lars分析波士顿住房数据实例
11 0
|
2天前
|
机器学习/深度学习 数据采集 数据可视化
Python数据处理与分析
【4月更文挑战第13天】Python在数据处理与分析中扮演重要角色,常用库包括Pandas(数据处理)、NumPy(数值计算)、Matplotlib和Seaborn(数据可视化)、SciPy(科学计算)、StatsModels(统计建模)及Scikit-learn(机器学习)。数据处理流程涉及数据加载、清洗、探索、特征工程、模型选择、评估与优化,以及结果展示。选择哪个库取决于具体需求和数据类型。
13 1
|
2天前
|
BI 开发者 数据格式
Python代码填充数据到word模板中
【4月更文挑战第16天】
|
3天前
|
数据可视化 算法 API
Python数据可视化-seaborn Iris鸢尾花数据
Python数据可视化-seaborn Iris鸢尾花数据
11 0
|
3天前
|
程序员 索引 Python
06-python数据容器-set(集合)入门基础操作
06-python数据容器-set(集合)入门基础操作
|
3天前
|
索引 容器
06-python数据容器-list列表定义/list的10个常用操作/列表的遍历/使用列表取出偶数
06-python数据容器-list列表定义/list的10个常用操作/列表的遍历/使用列表取出偶数

热门文章

最新文章