数据挖掘

#数据挖掘#

已有9人关注此标签

内容分类

株莉

大佬们都在学习的数据上云必备攻略,你还在观望什么?!

数据是什么?数据就是核心资产在经历大型灾难而导致系统停运的公司中有40%倒闭,剩下的公司中也有33%在两年内破产。———— Gartner Group调查1小时的业务中断/数据丢失,金融机构将损失约:280万美元!—— Horison Information Strategies 企业上云时代,从数据采集、数据整合、数据挖掘、数据分析、数据智能处理,已成为数据上云的完整链条。在这一链条中,数据可能会丢失、泄露、被越权访问、被篡改,甚至涉及用户隐私和企业机密等问题,云上数据安全已成为企业上云最为重要的因素。 数据保护是企业级存储必备的能力。用户针对自身的数据有各种不同等级的保护要求。大型企业以前均采用传统备份一体机/备份软件方式进行数据保护。随着“企业上云”的计划的实施,越来越多的企业将业务系统、数据库等服务搬移到“云上”。 阿里云正在逐步替代传统厂商的解决办法,为用户提供云原生的数据保护方案。 7月3日,阿里云云上存储数据保护新品发布会,与大家分享必备的“企业上云攻略”: 数字化浪潮下的数据安全重要性; 云上应用级同城容灾——快照服务(功能、特性及应用场景); 云上数据级同城容灾——同城冗余存储(功能、特性及最佳实践); 了解详情,点击【产品活动页】参与直播,点击【直播间传送门】更多信息,点击【产品详情】 参与话题,赢取限量奖品: 当前对象存储的存储类型不是已经很安全了吗,为什么还要推出同城冗余存储这样的存储类型服务? 听说传统数据中心建容灾中心、双活中心成本很高,同城冗余存储会不会很贵啊? 看云存储的“两地三中心”是如何炼成的 云上无代理的数据保护方式是否是未来行业发展趋势? 您是否有针对整个ECS实例进行数据保护的需求?

游客4c3lpvjn33j5i

hbase小能手

Maxcomput 做数据分析和数据挖掘怎么样?

Maxcomput 做数据分析和数据挖掘怎么样?

一码平川MACHEL

2019年5月编程语言排行榜:R跌出前20,Python成最大赢家

TIOBE 近日公布了2019年5月编程语言排行榜,总体排名变化不大,排名前十的依旧是:Java, C, C++, Python, Visual Basic .NET, C#, JavaScript, SQL, PHP 和汇编语言。 3年来一直排名在前20名的R语言,在本月首次跌出前二十名,这是非常令人吃惊的,因为统计编程领域仍然在蓬勃发展,特别是由于数据挖掘和人工智能的普及,但这也使得数据统计分析被整合至更多的领域。 这种趋势下,Python已经成为最大赢家,最可能的原因是统计编程正从大学发展到工业,而Python更容易被业界接受。此外,从上图我们可以看出Python和C++的得分相差无几,因此无论从哪个角度看,Python都是最受瞩目的编程语言之一。 参与话题讨论 你觉得Python为什么会受到追捧? 你的工作中有没有用到Python? 未来Python的应用方向有哪些?

sdydata

什么是机器学习平台?有何作用呢?

深度了解机器学习平台的作用及优势

1119038336742178

小白学大数据,求指点方向。

一直对数据比较感兴趣,毕业之后就在传统行业的商品管理工作的,近两年行业不景气,另外所在行业目前的数据分析仅停留在低层次上,短时间内貌似无法突破;我现在26了,在深圳月薪还没过万,实在汗颜,现在想转行大数据,做数据分析和数据挖掘,求大牛指点下方向。目前正在自学Orcle数据库,下一步准备学python语言,请问这些的规划合适吗?

很菜的小白

greenplum的应用场景

前辈您好!我先简单介绍一下背景:我搭建了一个PostgreSQL数据库用来存储单独一台机床在加工过程中产生的各种数据,我想借助神经网络等手段来分析这些数据,在此之前,需要对数据进行清洗、去噪和特征提取等操作,并将处理后的数据保存,以备将来训练和测试神经网络。上述过程都在个人电脑上进行。我的问题是:1、选择greenplum来存储处理后的数据合适吗?或者说greenplum适用于这样的场景吗?2、greenplum集成了一些数据挖掘和机器学习的功能,在这功能可以为数据清洗和神经网络提供哪些便利呢?

马铭芳

爬虫数据管理【问答合集】

目前互联网中网络爬虫的自然语言处理方向前景怎样?https://yq.aliyun.com/ask/195258artTemplate:arttemplate生成的页面可以爬虫可以爬到数据吗https://yq.aliyun.com/ask/226332爬虫如何自动读取更多按钮https://yq.aliyun.com/ask/177860能推荐一个爬虫+数据挖掘的成熟工具吗?https://yq.aliyun.com/ask/121576爬虫和数据挖掘的区别?https://yq.aliyun.com/ask/121522爬虫数据用什么数据库储存最合适?https://yq.aliyun.com/ask/121854scrapy-redis分布式爬虫启动为什么会等待https://yq.aliyun.com/ask/185071部署了CDN,但是爬虫抓取仍然超时。https://yq.aliyun.com/ask/119262怎样将爬虫正常访问我的主域名https://yq.aliyun.com/ask/66704python 爬虫报错 , 是什么原因呢?https://yq.aliyun.com/ask/126797python的爬虫采集,和php采集器意义一样么?什么区别?https://yq.aliyun.com/ask/65930站点百度爬虫联通率低,有没有解决办法?https://yq.aliyun.com/ask/63848PHP可以写网页爬虫吗 ?原理是什么?https://yq.aliyun.com/ask/29398用Java写网络爬虫有哪些比较好的开源项目?https://yq.aliyun.com/ask/7440防止网络爬虫进行数据抓取https://yq.aliyun.com/ask/20134阿里云上有什么机制或服务可以防御爬虫?https://yq.aliyun.com/ask/42194请问Android爬虫遇到了权限问题怎么办?https://yq.aliyun.com/ask/13993分布式爬虫框架的设计https://yq.aliyun.com/ask/50547如何解决爬虫网页异步https://yq.aliyun.com/ask/21247爬虫怎么保存已经访问过的urlhttps://yq.aliyun.com/ask/10745关于二层爬虫程序数据获取问题?https://yq.aliyun.com/ask/17634PHP爬虫在js对象里该如何获取https://yq.aliyun.com/ask/11199爬虫如何保存已访问过的url?https://yq.aliyun.com/ask/7874

马铭芳

图像识别【问答合集】

图像识别技术的使用领域https://yq.aliyun.com/ask/193950语音识别和图像识别的区别https://yq.aliyun.com/ask/193981有没有比现在DeepLearning/CNN更好的图像识别方法https://yq.aliyun.com/ask/194160如何将matlab训练的图像识别模型应用到单片机中_https://yq.aliyun.com/ask/194119深度学习在图像识别中的运用是属于数据挖掘还是人工智能https://yq.aliyun.com/ask/194341如何通过人工神经网络实现图像识别https://yq.aliyun.com/ask/193960图像识别用什么语言写最简单_https://yq.aliyun.com/ask/194001数字图像处理在领域图像识别应用https://yq.aliyun.com/ask/194380图像识别就是拿手机拍照然后识别图片或者图上的字,这种技术如何实现https://yq.aliyun.com/ask/176627公安局能否通过图像识别技术找到嫌疑人?https://yq.aliyun.com/ask/194060模式识别 语音 图像 哪个好发文章https://yq.aliyun.com/ask/194231如何通过人工神经网络实现图像识别https://yq.aliyun.com/ask/193951图像识别创业,现阶段的图像识别技术可以运用到哪些行业https://yq.aliyun.com/ask/193992怎么在window的caffe下进行图像识别https://yq.aliyun.com/ask/194320非限制条件下人脸图像是什么意思_https://yq.aliyun.com/ask/194180如何用图像识别分析竹条的正反面_https://yq.aliyun.com/ask/194229如何利用图像处理去识别有颜色的箱子https://yq.aliyun.com/ask/194289利用python做机器学习图像识别要怎么做https://yq.aliyun.com/ask/194178图像识别之前要进行哪些处理?https://yq.aliyun.com/ask/193936图像识别的相关领域_https://yq.aliyun.com/ask/193990图像识别概念股有哪些https://yq.aliyun.com/ask/193963哪种编程语言最适合做图像识别https://yq.aliyun.com/ask/193973安检机图像识别方法有哪些https://yq.aliyun.com/ask/194413录播跟踪技术中,红外线好还是图像识别技术?https://yq.aliyun.com/ask/194130图像识别中样本少怎么处理重复使用https://yq.aliyun.com/ask/194143机器学习和图像识别是怎样彻底改变搜索的https://yq.aliyun.com/ask/194306验证码图像识别,希望给点思路!https://yq.aliyun.com/ask/176610有哪些机器学习,图像识别方面的入门书籍https://yq.aliyun.com/ask/194385用52单片机可以实现简单的图像识别吗_https://yq.aliyun.com/ask/194375图像识别深度学习用的模型有哪些https://yq.aliyun.com/ask/193956怎样用unity做图像识别https://yq.aliyun.com/ask/194347c#如何调用微软的ocr进行图像识别https://yq.aliyun.com/ask/194000vb可不可以做图像识别软件https://yq.aliyun.com/ask/194084在图像识别这一块,目前有没有可以移植到嵌入式https://yq.aliyun.com/ask/194146扫一扫功能也是用图像识别技术吗https://yq.aliyun.com/ask/194291微软怎么攻克图像识别技术难点的https://yq.aliyun.com/ask/194287OCR软件无法识别图像https://yq.aliyun.com/ask/194096图像识别和图像匹配的区别是什么?https://yq.aliyun.com/ask/193935什么叫图像识别技术https://yq.aliyun.com/ask/193937形状识别传感器和图像识别传感器的工作相同吗?各自工作原理是什么?https://yq.aliyun.com/ask/194381贴片机的图像识别和激光识别哪种效果好https://yq.aliyun.com/ask/194132远程抄表图像识别vc++可以完成吗https://yq.aliyun.com/ask/194382

李杨卓

阿里云ACA第二章考试有些问题不懂

疑惑一:如果要呈现产品类型、区域、销量,用哪种图? (4选1:气泡图、 柱状图、瀑布图、饼图)疑惑二:数据分析平台包括哪些部分?5选3(事务处理、数据同步、数据清洗、数据处理、数据展现)疑惑三:一个大型企业每天产生10T数据,直接放在业务系统进行数据分析,这样是对是错?疑惑四:数据仓库可以做什么?4选2(业务办理、缴费、报表查询、数据挖掘)疑惑五:如果在ODPS中设置一个任务每日2点30分执行,以后每天都会执行吗?

知与谁同

手机客户端开发,算法工程师,数据挖掘哪个职位更好

手机客户端开发,算法工程师,数据挖掘哪个职位更好

知与谁同

数据挖掘怎么最快入门?书籍或培训都可以。

数据挖掘怎么最快入门?书籍或培训都可以。

知与谁同

算法工程师的职业道路应该怎么走?

比如搞数据挖掘、大数据处理这些...

ubuntults

数据分析与数据挖掘什么关系?

数据分析与数据挖掘什么关系?是一回事吗?

support

日月盈昃辰宿列张万物迎新,去假寻真如果能改变世界你会选择何种组织结构规划BAT的未来?

古语有云莫轻小恶,以为无罪,小恶所积,足以灭身。然而现实是盲目的,多数人目光还是比较短视,只能看到眼前的利益,却忽略长久的发展。以企业为例,传统企业大多数是呈金字塔结构,因为管理者是有幅度的,再优秀的管理者也无法直接管理数百名员工,尤其是当一个组织或者企业处于初创阶段的时候,最终只会导致群龙无首滥竽充数。一些公司机构在迅速壮大以后,大量扩充中高层,以加强管理,于是导致了组织机构臃肿。对于市场的反应和决策速度变慢,无法做出任何前瞻性的决策,这种僵硬的官僚体系可能最终导致了错误的发展。 不过新的文明总是生生不息优胜略汰,经过数十年的发展,新的组织结构正在被越来越多的使用,如facebook等互联网巨头,它们采取的是网状结构,是一种相对平等的组织体系。 这种组织结构的特点是它不会预先设置你的工作流程、职位规划等,而是通过工作的过程中充分挖掘员工的潜力,让它自己适应自己最适合的位置。只是去掉中心的特权,高层和底层不会有地位上的区别,仅有职责上的差别,从而造就传奇。仁者见仁智者见智,如果未来能有个机会能让你去假寻真改变世界,你会选择何种组织结构规划BAT的未来 ?

隐林

自建集群耗资百万?如何低成本搭建数据仓库?

随着大数据、云计算等技术的应用和普及,互联网环境下数据处理呈现出新的特征:业务变化快;数据来源多;系统耦合多;应用深度深。业务变化加快导致数据来源增多,以前的数据大多来自于应用系统数据库,基本为结构化数据,比如Oracle、MySQL等数据。现在的互联网环境下有了更多的数据,比如网站的点击日志、视频数据、语音数据,这些数据都需要通过统一的计算来反映企业的经营状况。在互联网环境下,系统耦合也相对比较多,最重要的是要注重如何在这样的环境下加深数据整合、提升应用深度。从应用深度上来说,之前更多专注于报表分析,在大数据环境下则更多地进行算法分析,通过建立数据模型去预测和研判未来趋势。所以在这种境况下,对于系统的需求也更高。 在高需求下,传统仓库必然面临着挑战:数据量增长过快导致运行效率下降;数据集成代价大;无法处理多样性的数据;数据挖掘等深度分析能力欠缺。自建集群,耗资上百万,并且还需要专业人员运维。 从2012年开始,阿里集团将之前在Hadoop上的数据体系搬迁到阿里云数加MaxCompute(原ODPS),并完成了数据体系的重构。MaxCompute能提供快速、完全托管的从GB到EB级数据仓库解决方案,可经济并高效的分析处理海量数据,高效的计算能力能够很好的支撑着强大的经济体。(《企业大数据平台下数仓建设思路》) 之后,阿里集团开始对外服务,开始研究数据智能化和帮助外部用户如何利用阿里的大数据平台实现大数据应用。 阿里正将MaxCompute这样的“核武器”快速推向全球市场,彻底改变了行业处理数据的方式。此前,大多采用自建Hadoop集群,耗资上百万,并且还需要专业人员运维。而MaxCompute采取按量收费的模式,仅按照0.3元/GB按量付费,即开即用。根据大部分公司的数据量来测算,一般每月只需花费数百元。 MaxCompute最近在华南又开新服!了解详情: 《数据智能需求旺盛 阿里云MaxCompute 2.0华南区开服》 《深圳MaxCompute大数据计算平台75折限时抢》 欢迎一起来聊一聊:如何做你所在的企业才能更好的赶上这个时代?为了做好企业数据服务,架构师们应如何帮企业做好低成本的数仓攻略? 参与聚能聊将有机会获得价值千元的金闪闪 TechInsight云栖门票 一张! Tech Insight是一场专门针对开发者、架构师,以及产品技术管理人员的“实战”技术之旅。在这里,顶级技术专家们解读各类跨行业解决方案。5场分论坛,2场Workshop,1场MVP Demo Show。 TECH INSIGHT 面对面深度技术分享

珺姐

你心目中的云产品机器人是什么样?

阿里云的产品已经150多款了,用户真心眼花缭乱。买了几款用起来也难免遇到问题。。 - 等人工解决吧,问题多,工程师少,排队等待是经常! - 看文档吧,检索只能用关键字,有时候描述不准,就与答案失之交臂了! 当当当,和大家介绍个小助手: 云博士——生于智能,最懂云计算 云博士目前已经学会阿里云所有产品的文档,并在此基础上加入了语义理解,数据挖掘,更好的理解用户问题,更“懂”用户的为您推荐答案!并且云博士全天候为您服务,不知疲倦,也不会出错! 除了静态的文本和图片,云博士还支持视频答案呢~ 可以手把手的教你怎么做! 当然,云博士也并非十全十美!不能解决用户的所有云产品问题,目前还是主要定位于咨询类的产品问题,所以像看日志debug才能解决的问题目前还不能解答喔~ 那么问题来了: 你心目中的云产品机器人是什么样? 云博士怎么样做才能更懂你呢? 打开脑洞写建议,赢奖品噢~~

柚子菌

理工科学生,想找到好实习/工作,有哪些小技巧?

很多同学都会问『我的经验不多,要怎么找到好实习/好工作呀,有木有什么小技巧?』楼主也是经历过校招过来的,深知校招的水深火热,今天就跟大家讨论一下,经验不多的学生,如何找到好实习、好工作,有哪些让面试官眼前一亮的小技巧。 1. 让你的简历界面友好 很多同学的简历排版混乱,面试官一眼看过去很难抓住重点。建议在网上找一些简历模板,优化一下自己的简历,甚至还可以做一个个人展示网站,既作为个人信息展示、也可以体现自己的实践能力。相信面试官忙了一天,看到你精心准备的材料,一定会眼前一亮。 2. 积极参与相关比赛,丰富经历 现在有很多针对大学生的技术/设计/创意大赛,与同学们合作参与,一方面,可以体现出你对业界新动态的敏感,另一方面,在这个过程中,既能产出自己的作品,又能体现你的团队合作能力和组织策划能力,一举N得。最后如果真的获得了一个好的名次,更是锦上添花。 3. 准备一份可以证明自己能力的材料 四六级?绩点?三好学生?这些都不是关键!关键的是证明你专业能力的东西,例如,你要应聘技术岗,可以自己做一个小网站/小应用;你要应聘设计岗,可以带上自己日常的作品;你要应聘产品岗,可以带上自己做的相关产品分析报告。这些不一定需要你去大公司实习才能获得,但是可以让面试官感受到,你的实践经验不多,但是有实践的能力。attention!阿里云也提供了针对未来开发者们的学生机,帮助大家累积实践经验,希望未来的开发者们,有你的加入。 学生机的运营同学说了,一定要我在这里给他添加一个广告,学生专属价格9.9元(原价108元),他说用了可以提高求职成功率。 说了这么多,该你说了,你在面试中,有哪些小技巧?参与讨论有机会赢礼品哦!

風輕揚

大数据入门

数据挖掘及数据安全入门需掌握哪些?