MATLAB 数据分析方法(第2版) 1.1 数据分析与MATLAB

简介:

第1章 MATLAB基础 

 MATLAB数据分析方法

 

本章主要介绍MATLAB软件的一些入门知识,包括MATLAB界面及其基本操作、变量与函数、运算符与操作符、矩阵数据的输入与输出、符号运算、M文件与编程等,为读者学习以后各章打下基础。

 

1.1 数据分析与MATLAB


1.1.1 数据分析概述

1.数据分析的概念

 

数据分析是指用适当的统计方法对收集来的数据进行详细研究,提取其中有用信息并形成结论,以求最大化地开发数据的功能,发挥数据的作用。在统计学领域,有人将数据分析划分为描述性数据分析、探索性数据分析以及验证性数据分析。描述性数据分析是描述测量样本的各种特征及其所代表的总体特征,探索性数据分析侧重于在数据之中发现新的特征,验证性数据分析侧重于已有假设的证实或证伪。

数据分析的目的是把隐藏在数据背后的信息集中和提炼出来,总结出研究对象的内在规律。在实际工作当中,数据分析能够帮助管理者进行判断和决策,以便采取适当策略与行动。例如企业通过对产品的市场销售数据分析,可把握当前产品的市场动向,从而制定出今后合理的产品研发和销售计划。

 

2.数据来源与分类

 

数据分析的起点是取得数据。数据是通过实验、测量、观察、调查等方式获取的结果,这些结果常以数量的形式展现出来,因此数据也称为观测值。数据按照不同的标准进行分类,可分为观测数据与试验数据、一手数据与二手数据、时间序列数据与横截面数据等。

 

1)观测数据与试验数据。观测数据是在自然的未被控制的条件下观测到的数据,如社会商品零售额、消费价格指数、汽车销售量、某地区降水量等。利用这类数据进行观测所研究的个体,并度量感兴趣的变量。试验数据是在人工干预和操纵的条件下产生的数据,这种数据通常来自于科学与技术实验。例如,在研究不同的药物成分组成对某种疾病的治疗效果有什么不同时,记录实验药物成分在不同的条件下产生相应的治疗效果数据,那么药物成分数据与治疗效果数据就是试验数据。

 

2)一手数据与二手数据。一手数据是针对特定的研究问题,通过专门收集、调查或试验获得的数据。例如,为制定一家百货商店的营销方案,在这家商店所在城市抽取近300户家庭作为样本进行调查,收集下列数据:对本商店及其竞争对手商店的熟悉程度;家庭成员在各个商店购物的频率;选择百货商店时考虑的因素,如商品质量、种类、退赔政策、服务、价格、店址、商店布局、信用与收款政策;每个商店的偏好评分;被调查者的年龄、性别、受教育程度等。二手数据是由各种媒体、机构等发布的数据,数据分析人员可以根据研究的问题,从这些数据中加以选择,如证券市场行情、物价指数、耐用消费品销售量、利率、国内生产总值、进出口贸易数据等。

 

3)时间序列数据与横截面数据。时间序列数据是对同一研究对象按时间顺序收集得到的数据,这类数据反映某一事物、现象等随时间的变化状态或程度。例如,2005年至2014年中国人均国内生产总值指数(上年=100)数据分别为:110.7,112.1,113.6,109.1,108.7,110.1,109.0,107.2,107.2,106.7(数据来源:《中国统计年鉴2014》)。同样,某商场每日销售额、某股票每日收盘价、沪深股市每日收盘指数等都是时间序列数据。

 

横截面数据是在同一时间、不同统计单位、相同统计指标组成的数据列,这类数据体现的是个体的个性,突出个体的差异。例如,某日沪市全部交易股票的当日收盘价数据、2014年中国31省市人均国内生产总值增长率数据都是横截面数据。

 

近年来,出现了将横截面数据和时间序列数据合并起来进行研究的数据类型,称为面板数据(Panel Data)。该数据具有横截面和时间序列两个维度,当这类数据按两个维度进行排列时,数据都排在一个平面上,与排在一条线上的一维数据有着明显的不同,整个表格像是一个面板。该类数据模型可以分析个体之间的差异情况,又可以描述个体的动态变化特征。例如,每年各地区的国内生产总值增长率数据;在一定时期间隔内对同一地区同样的家庭进行调查,以观察其住房和经济状况是否有变化,这样得到的数据都是面板数据。

 

3.数据分析过程

 

数据分析过程包括确定数据分析的目标、研究设计、收集数据、分析数据、解释结果。

 

1)确定数据分析的目标。数据分析的目标是分析和解决特定的领域问题,而这个问题可以用量化分析的方法来解决。

 

2)研究设计。研究设计是根据数据分析的目标寻求解决方案。一般而言,数据分析是用量化分析的方法对现象进行描述、解释、预测与控制。一个特定的领域问题要转化为数据分析问题,首先要进行量化研究设计,确定用什么量化研究方法以及怎样研究。常用的量化研究方法有调查法(用调查或观测得到的样本数据推断总体)、相关研究法、实验法、时序分析法等。

 

3)收集数据。确定了所要解决的问题的研究设计后,根据所要采用的量化研究方法收集数据。例如,若采用调查法,需要确定具体抽样方法以获取数据;若采用实验法,需要进行实验设计,通过实验来获取数据等。这些是为所要解决的问题专门收集的一手数据。除此之外,通常还需要二手数据。

 

4)整理与分析。数据整理与数据分析即利用数据分析方法进行计算和分析。数据分析方法以统计分析技术为主,借助各种软件(SPSS、SAS、Excel、S-Plus等)工具,完成数据的计算分析任务。本书以MATLAB为工具进行计算。

 

5)解释和分析计算结果。使用各种方法与软件等工具计算后,会得到一系列结果,包括各种图表、数据等。说明、解释和分析这些结果,或利用计算结果检验各种假设、预测、控制等,从而最终解决所要研究的问题。最后提交数据分析报告,供决策时参考。

 

1.1.2 MATLAB在数据分析中的作用

 

MATLAB是一套高性能的数值计算和可视化软件,它集矩阵运算、数值分析、信号处理和图形显示于一体,构成了一个界面友好、使用方便的用户环境,是实现数据分析与处理的有效工具,其中MATLAB统计工具箱更为人们提供了一个强有力的统计分析工具。

 

选择MATLAB软件作为数据分析工具,不仅节约了数据分析过程中的计算时间,而且增加了统计推断的正确性,提高了数据分析的效率。但要注意,尽管软件对数据分析起到非常大的作用,但软件不能处理数据分析中所有阶段所要解决的问题。明确这一点后可以更好地使用软件。确定数据分析的目标、对问题的研究设计、选择统计分析方法、收集数据、解释和分析计算结果,这些都不是软件所能替代解决的。

 

本书介绍数据分析的基本理论方法,应用MATLAB编写程序进行数据分析,既面向过程又面向对象。为方便读者,以下对MATLAB的基本操作方法作比较系统的介绍。

 

相关文章
|
1月前
|
数据可视化 数据挖掘 数据管理
问卷调查数据分析指南!掌握方法,精准把握用户需求!
本文介绍了如何利用自定义报表、交叉报表和过滤器进行问卷调查数据分析。文章首先区分了定量和定性数据,强调了定量数据在分析中的重要性,并列举了客户体验(CSAT、CES、NPS)和市场调研的关键指标。接着,提到了定性数据分析方法,如情感分析和词云图。文章还讨论了自定义报表、交叉报表和过滤器在数据筛选和相关性探索中的作用,以及收集器在多源数据收集上的应用。最后,强调了仪表板在数据可视化和比较中的优势,并推荐了Zoho Survey作为综合的数据管理平台。
51 0
问卷调查数据分析指南!掌握方法,精准把握用户需求!
|
1月前
|
数据可视化 数据挖掘 Linux
Python数据分析(四)——plot方法
Python数据分析(四)——plot方法
|
2月前
|
搜索推荐 数据挖掘 C++
数据分析方法-对比分析和用户画像
数据分析方法-对比分析和用户画像
70 1
数据分析方法-对比分析和用户画像
|
3月前
|
机器学习/深度学习 数据采集 存储
基于振弦采集仪的工程监测数据分析方法研究
基于振弦采集仪的工程监测数据分析方法研究主要涉及以下几个方面:
基于振弦采集仪的工程监测数据分析方法研究
|
4月前
|
算法
MATLAB求解线性方程组的八种方法
求解线性方程分为两种方法--直接法和迭代法 常见的方法一共有8种 直接法 Gauss消去法 Cholesky分解法 迭代法 Jacobi迭代法 Gauss-Seidel迭代法 超松弛迭代法 共轭梯度法 Bicg迭代法 Bicgstab迭代法
130 0
|
4月前
|
供应链 搜索推荐 数据挖掘
数据分析方法与模型
数据分析方法与模型
|
3月前
|
算法 5G PHP
基于范数求解缩放因子方法的MIMO系统预编码技术matlab仿真
基于范数求解缩放因子方法的MIMO系统预编码技术matlab仿真
|
4月前
|
机器学习/深度学习 数据采集 运维
重要的数据分析方法:时间序列分析
重要的数据分析方法:时间序列分析
110 1
重要的数据分析方法:时间序列分析
|
1月前
|
SQL 机器学习/深度学习 NoSQL
常用的数据分析方法和工具有哪些?
随着大数据时代的到来,数据分析也逐渐成为了各企业、组织以及个人的必要技能之一。但是数据分析在进行过程中,我们往往会遇到各种各样的问题,比如面对不同类型的数据,如何进行有效的分析?今天和大家分享一些常见的数据分析方法和工具,希望对大家有所帮助。
|
4月前
|
算法
MATLAB求解非线性方程组的五种方法
求解线性方程分为两种方法--二分法和迭代法 常见的方法一共有5种 二分法 迭代法 牛顿法 割线法 拟牛顿法 Halley法