天猫双11数据过于完美,引网友质疑,用Python算算就知道了啊

简介: 天猫双11数据过于完美,引网友质疑,用Python算算就知道了啊

双11结束了,大家已经无手可剁 ,你们都贡献了多少啊?

天猫官方公布了今年的双11成交额为2684亿元,成功刷新了自己创下的商业纪录。按理说大家已经习惯了逐年增长,没想到。。。

由于过于完美,引发网友提出质疑。

screenshot

该微博在天猫公布2019年销售额后,引发大量讨论,成功登上热搜。

一些人提出了相反意见:某大V表示天猫双11数据是精确地控制了交易额,从而形成了理想的曲线。

而天猫相关负责人回应称,符合趋势就假?造谣要负法律责任。

我们且不评论是真是假,先想想我们能干点什么呢?

不如先照着这位微博网友的步骤来复现一遍吧。

利用Excel进行拟合

这位微博网友使用的工具似乎是Excel,我安装的是WPS,应该也能胜任。

先将天猫2009年-2018年的双十一历年销售额历史数据导入到一张表里。

screenshot

点击插入一张散点图。

screenshot

screenshot

左键点击一下任意一个散点数据,出现散点数据选择状态。

鼠标右击,弹出提示框,点击“添加趋势线”。

在WPS表格右侧,找到趋势线属性按钮,左键单击一下,弹出趋势线属性框。

screenshot

选择三次多项式,得到结果√
screenshot

其中R²=0.9994,这与微博网友的预测值一致,说明我们的方法是对的。

天猫双11数据过于完美,引网友质疑,用Python算算就知道了啊
over。

停一停,

作为Python专业爱好者,怎么能能少了Python呢?

利用Python进行拟合并预测

我们在Python中可以利用numpy求解多项式以及多项式拟合。

尝试用numpy的polyfit函数进行拟合,并作图。

代码如下:

import matplotlib.pyplot as plt
import numpy as np

x = np.array([year for year in range(2009,2019)])
y = np.array([0.5,9.36,52,191,352,571,912,1207,1682.69,2135])
z1 = np.polyfit(x, y, 3) # 用3次多项式拟合
p1 = np.poly1d(z1)

yvals=p1(x)
plot1=plt.plot(x, y, '*',label='实际销售额')
plot2=plt.plot(x, yvals, 'r',label='拟合销售额')
plt.xlabel('年份')
plt.ylabel('销售额(亿)')
plt.legend(loc=4) # 指定legend的位置
plt.title('2009-2018淘宝双十一销售额拟合曲线')
plt.figure(figsize=(10, 10))
plt.show()

print('拟合多项式:',p1) #打印拟合多项式
p1 = np.poly1d(z1)
print("-"*40)
print('2019年预测值:',p1(2019)) #打印预测值
运行结果:

screenshot

screenshot

利用三次多项式预测的数据与公布的结果确实很相近。

我们继续搞事情。

将今年2019年的2684亿导入,预测一下后面三年:

screenshot

按照网上的阴谋论,后面几年的数据应该如此。

碎碎谈:

看了网络上的好几篇文章,众说纷纭。

作为一个技术er,就不去对此事做评价了。

只写一些其中跟我们相关的数据知识就够了。

网络大众对此事的看法到底如何?

不妨看下腾讯科技发起的一个投票。

screenshot

大众的看法就像这个投票。

相关文章
|
2天前
|
机器学习/深度学习 Python 数据处理
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力负荷数据
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力负荷数据
17 0
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力负荷数据
|
2天前
|
存储 机器学习/深度学习 数据可视化
Python面板时间序列数据预测:格兰杰因果关系检验Granger causality test药品销售实例与可视化
Python面板时间序列数据预测:格兰杰因果关系检验Granger causality test药品销售实例与可视化
39 6
|
2天前
|
机器学习/深度学习 数据采集 供应链
从数据到决策:scikit-learn在业务分析中的应用
【4月更文挑战第17天】本文探讨了scikit-learn在业务分析中的应用,包括数据预处理、分类、回归和聚类模型的构建,以及模型评估与优化。通过使用scikit-learn,企业能有效处理数据、预测趋势、客户细分并制定决策,从而提升经营效率和市场策略。随着机器学习的发展,scikit-learn在业务分析领域的潜力将持续释放,创造更多价值。
|
2天前
|
算法 数据可视化 Python
Python中LARS和Lasso回归之最小角算法Lars分析波士顿住房数据实例
Python中LARS和Lasso回归之最小角算法Lars分析波士顿住房数据实例
11 0
|
2天前
|
BI 开发者 数据格式
Python代码填充数据到word模板中
【4月更文挑战第16天】
|
3天前
|
数据可视化 算法 API
Python数据可视化-seaborn Iris鸢尾花数据
Python数据可视化-seaborn Iris鸢尾花数据
11 0
|
3天前
|
程序员 索引 Python
06-python数据容器-set(集合)入门基础操作
06-python数据容器-set(集合)入门基础操作
|
3天前
|
索引 容器
06-python数据容器-list列表定义/list的10个常用操作/列表的遍历/使用列表取出偶数
06-python数据容器-list列表定义/list的10个常用操作/列表的遍历/使用列表取出偶数
|
3天前
|
机器学习/深度学习 数据处理 计算机视觉
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力消耗数据
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力消耗数据
16 1
|
4天前
|
机器学习/深度学习 数据采集 数据挖掘
Python 的科学计算和数据分析: 解释什么是数据规整(Data Wrangling)?
【4月更文挑战第15天】数据规整是将原始数据转化为适合分析和建模的格式的关键步骤,涉及缺失值处理(删除、填充、插值)、异常值检测与处理、数据类型转换、重采样、数据合并、特征选择和特征变换等任务。这些预处理步骤确保数据质量和准确性,为后续的数据分析和机器学习模型构建奠定基础。
18 4