当前位置: 首页> 零基础如何入门数据分析?> 正文

零基础如何入门数据分析?

  • 用户2532089730用户2532089730
  • 2023-06-30
  • 115
  • 共18人回复
大数据研习社
「大数据研习社 」发表看法
2023-07-07

零基础入门数据分析,建议先从Excel开始,因为Excel是数据分析最常用的工具,功能强大,入门容易。

从Excel开始

Excel需要学习的有3点,Excel公式、数据透视表和Excel图表。

1、Excel公式

2、数据透视表

3、Excel图表

学习一些SQL基础

接着建议学习MySQL,因为数据分析跟数据打交道,懂点sql知识还是很有必要的。

懂点统计学理论很有必要

统计学是必须的,不懂统计学根本算不上数据分析师,具体内容有:统计学基础、参数估计、假设检验、方差分析、线性回归、时间序列、聚类分析、主成分分析及因子分析等。

SPSS

分析工具除了Excel,推荐SPSS,使用广泛,容易上手。

因为统计学很有些分析方法通过Excel就可以搞定;有些不行,必须通过其他工具才能搞定,例如多元线性回归、聚类分析、主成分分析及因子分析,都需要用到SPSS。

在掌握了统计学的基础上,在学习SPSS是很容易的,因为SPSS只是一个工具而已。

编程学习(可选)

另外,有精力的话,懂点编程也是必须的,因为用Excel做数据分析,少量数据(大约几十万甚至百万)没有问题,但是再大一点的数据通过程序来程序会更高效。

1、Python/R

Python和R都可以,R在数据分析方面更加强大,也更成熟,但是想往机器学习方向发展的话,Python还是主流语言,推荐学习Python。

2、Excel VBA

虽然Excel为我们提供了很多好用的公式和功能,但是还有很多工作无法用现有的公式和功能批量完成,比如Excel表格的批量拆分、数据批量分类等,而借助于VBA代码,可以很方便地处理这些问题。

回答完毕!

郭敏儿
「郭敏儿 」发表看法
2023-06-30

大数据公司里一般建立数据库和分析数据的是两拨人。

如果你想学习如何建立数据库,就学SQL。结构化查询语言(Structured Query Language),简称SQL,是一种数据库查询和程序设计语言,用于存取数据及查询,更新和管理数据的系统。可以用来查询检索数据,添加修改和删除数据等等。

如果你想学习拿到数据后如何进行分析,就学Python,统计和一些机器学习算法。机器学习理论主要是设计和分析一些让计算机可以自动学习的算法,从数据中自动分析获得规律,并利用规律对未知数据进行预测。因为这些算法中涉及了大量的统计学理论,所以有一些统计学的知识是很有帮助的,但是也不需要统计什么都懂。但是由于我们处理的数据很庞大,无法手算,必须借助计算机来帮我们进行大量的计算,所以需要学习Python编程语言来帮助我们,每个机器学习的算法都有相应的Python指令来帮你计算的。

机器学习的算法有比如:

非监督式学习中的K-Means算法,DBSCAN,t-SNE等等,主要不是用来预测,而是对整个数据有一定的深入了解。

监督式学习中常见的有:

回归算法:试图采用对误差的衡量来探索变量之间的关系的一类算法,常见的种类有最小二乘法(Ordinary Least Square),逻辑回归(Logistic Regression),逐步式回归(Stepwise Regression),多元自适应回归样条(Multivariate Adaptive Regression Splines)以及本地散点平滑估计(Locally Estimated Scatterplot Smoothing)。

决策树学习:根据数据的属性采用树状结构建立决策模型,通常用来解决分类的问题。常见种类有:分类及回归树(Classification And Regression Tree, CART), ID3 (Iterative Dichotomiser 3), C4.5, Chi-squared Automatic Interaction Detection(CHAID), Decision Stump, 随机森林(Random Forest), 多元自适应回归样条(MARS)以及梯度推进机(Gradient Boosting Machine, GBM)

神经网络:模拟生物神经网络,通常用于解决分类和回归问题。神经网络是机器学习的一个庞大的分支,有几百种不同的算法。(其中深度学习就是其中的一类算法,我们会单独讨论),重要的神经网络算法包括:感知器神经网络(Perceptron Neural Network), 反向传递(Back Propagation), Hopfield网络,自组织映射(Self-Organizing Map, SOM)等等。

数据分析不是个事儿
「数据分析不是个事儿 」发表看法
2023-07-07

看到楼里大家都是系统性地阐述,我这边直接讲工具,毕竟工欲善其事,必先利其器。

作为一名数据分析师,应该学习哪些工具呢?

一、Excel工具

说起用什么做数据分析,很多人的脑海中都会不约而同地想到Python、R、SQL、Hive等看似很难掌握的数据分析工具,它们就像数据分析路上的拦路虎一样,让人踟蹰不前。

其实,在众多的数据分析工具中,Excel属于最常用、最基础、最易上手的一款数据分析工具。Excel的功能十分强大,它不仅提供了众多的数据处理功能,像Excel函数能够帮助我们做数据整理,数据透视表帮助我们快速、高效的做各种维度分析,形形色色的图表能帮我们形象地展示出数据背后隐藏的规律,同时Excel还有很专业的数据分析工具库,包括描述性统计分析、相关系数分析等。

Excel对于转行数据分析的小白来说,应该是最友好的。大家都知道“转行”其实是一件很困难的事儿,但是你学会了Excel,是完全可以找到一份“数据”相关的工作的,只有踏进数据领域,你才有可能从事其它更多的数据岗位。

二、BI工具

BI工具是专门按照数据分析的流程进行设计的,也是专门用于数据分析的工具。仔细观察这些工具后,它们的基本流程是:【数据处理】-【数据清洗】-【数据建模】-【数据可视化】。

关于BI工具,其实有很多你估计已经用到过,比如说Tableau、Power BI,还有帆软FineBI等。今天我们就分别带着大家来盘点一下,这三款工具。

1、Tableau

Tableau是一款交互式数据可视化软件,它的本质其实也是Excel的数据透视表和数据透视图。

Tableau也是很好的延续了Excel,只需要简单地拖拽,就能很快地实现数据的分类汇总,然后拖拽实现各种图形的绘制,并且可以实现不同图表之间的联合。

Tableau同时支持数百种数据连接器,包括在线分析处理(OLAP)和大数据(例如NoSQL,Hadoop)以及云数据,至少现在你能学到的数据库软件,Tableau基本都能够实现与其数据之间的互动。

2、Power BI

Power-BI是一款(BI)商业智能软件,于2014年发布,旨在为用户提供交互式的可视化和商业智能,简单的数据共享,数据评估和可扩展的仪表板等功能。。

大家可能都知道,Power BI以前是一款Excel插件,依附于Excel,比如Power Query,PowerPrivot, Power View和Power Map等,这些插件让Excel如同装上了翅膀,瞬间高大上,慢慢地就发展成为现在的Power BI数据可视化工具。

Power BI 简单且快速,能够从 Excel电子表格或本地数据库创建图表。同时Power BI也是可靠的、企业级的,可进行丰富的建模和实时分析,及自定义开发。因此它既是你的个人报表和可视化工具,还可用项目、部门或整个企业背后的分析和决策引擎。

同时,无论你的数据是简单的 Excel电子表格,还是基于云和本地混合数据仓库的集合, Power BI都可以让你轻松地连接到数据源,直观看到或发现数据的价值,与任何所希望的人进行共享。

3、FineReport

帆软是业内做报表比较久的一家公司,使用类excel风格的界面,可添加图表和数据源,也可实现大屏效果。

其实它的类Excel风格界面,应该是它区别于Tableau工具的一个很重要的点。FineReport 通过直接连接到各种数据库,就能方便快捷地自定义各种样式,从而制作周报、月报和季报、年报。

用过FineReport 的朋友,还会有另外一种体会,它的图形效果比Tableau要酷炫的多,操作起来同样也是那样的方便。

另外,FineReport 的个人版本是完全免费的,并且所有功能都是开放的,大家赶紧下去试试吧。

4、FineBI

关于FineBI,这是目前市面上应用最为广泛的自助式BI工具之一,类似于国外的Tableau等BI分析工具,但FineBI在协同配合,数据权限上,能更好的解决国内企业的情况。

但严格定义来讲,它其实是一款自助式BI。支持Hadoop、GreenPlumn、Kylin、星环等大数据平台,支持SAP HANA、SAP BW、SSAS、EssBase等多维数据库,支持MongoDB、SQLite、Cassandra等NOSQL数据库,也支持传统的关系型数据库、程序数据源等。

5、Python & R

其实不管是Excel,还是介绍的三款BI工具,它们都是为了执行特定功能,而设计出来的。如果说某一天,既定功能不能很好,或者说不能满足你的需求,那么应该怎么办呢?

这就需要我们了解,并学习一点编程语言了,最大的优势就在于:它非常强大和灵活。不管是R或者 Python,都有很多包供我们调用,同时也可以自定义函数,实现我们的某些需求。

最后,分析工具放在后台了,大家私信“BI”就能获得!

可乐必可乐
「可乐必可乐 」发表看法
2023-07-03

想要零基础如何入门数据分析,先要从整体认识数据分析,再从简单处着手。

大数据时代,数据分析变得越来越普遍。即便有着不同的职业经历,来自不同的国家或地区,数字都能发挥威力。数据分析不是简单地把业绩做成图表提交上去,而要用合乎逻辑的方式证明“为什么会这样”,才能说服对方。

柏木吉基写了《如何用数据分析解决实际问题》,作者柏木吉基在汽车公司的总部工作了11年,主要工作就是跟数据打交道,因此有着不寻常的见解。

柏木吉基在书中指出,将数据应用于实际业务分四种情况:

1.解读数据。这是驾驭数据的基础,关键要掌握观察数据的“视点”,从静态和动态两方面去看一个数据。

2.基本的数据分析方法。互联网时代,要有基本的电子办公技能。

3.综合技能。将思维方式有机地结合起来,不再孤立地看数据,而使数据具有整体一贯性。

4.高级分析技能和IT系统。更专业,难度也更大。

这本书里同样介绍了基本的统计学知识,如平均值、中位数、标准差、回归分析等,结合了作者柏木吉基工作的实例,简单易懂,也更有实用价值。需要注意的是,数据分析方法从来都不是孤立使用的,组合运用威力更巨大,从而实现1+1的爆炸式效果。正如《如何用数据分析解决实际问题》中说,“复杂的管理问题不一定需要高难度的统计方法。简单易懂的表达方式反而更为重要。”数据分析不是比拼难度,而是以终为始,服务于解决问题的目的。

华为云开发者联盟
「华为云开发者联盟 」发表看法
2023-07-09

在盘点有哪些数据分析工具之前,我们先看下数据分析的工作都有哪些?主要体现在几个方面:存储原始数据、按要求提取数据、按要求计算数据、将数据做成图表、解读数据,得出结论。

所以我们选择工具一定是能满足我们日常工作要求的,下面我们详细盘点一下都有哪些常用的数据分析工具。

一.EXCEL

基本介绍

Excel是目前最基础、也是应用最广的数据分析工具,能够解决数据分析中80%的问题。Excel的功能十分强大,它不仅提供了众多的数据处理功能,像Excel函数能够帮助我们做数据整理,数据透视表帮助我们快速、高效的做各种维度分析,形形色色的图表能帮我们形象地展示出数据背后隐藏的规律,同时Excel还有很专业的数据分析工具库,包括描述性统计分析、相关系数分析等。EXCEL个人感觉是本文介绍的所有工具中最重要的,数据分析工具分类可以分为 EXCEL和其他,尤其是对于转行数据分析的小白来说,应该是最友好的。

优点分析

1、入门门槛低,简单易学;

2、只要掌握其中的vlookup、match、indirect、if等几个常用的函数,就可以满足很多日常应用场景;

3、图表绘制很简单, Excel拥有各种丰富的可开发的图表;

4、Excel里有开发工具选项卡,还有分析工具库,可以拓展出大量分析功能;

5、自动汇总功能,Excel更加简便灵活

6、计算公式丰富

学习路线

1、基本操作包括数据的简单处理汇总、图表制作等,属于Excel基础知识,一般大家都能正常使用。

2、熟练掌握常用的函数后,你就可以做简单的数据统计、分析和数据可视化等工作了。

3、为了进一步从不同维度对关心的指标进行上卷、下钻分析,还需要非常熟练地掌握数据透视表,这也是Excel最为强大、使用最为频繁的功能。

4、为了实现复杂的业务分析,解决不同数据源、海量数据的分析问题,我们就需要掌握PowerQuery和PowerPivot,PowerQuery负责整合多种来源数据,并进行数据转换,PowerPivot对整合后的规范化数据进行高效率的透视分析,几百万上千万行数据均不在话下。

同类型工具:VBA、PowerQuery、PowerPivot、Power View、Power Map

二.BI图形化工具

数据最终是要呈现给业务/管理层查看的,因此到进阶阶段,BI工具也是必须要掌握的一个技能。

现在市面上BI工具很多,主流的就是Tableau、FineBI和PowerBI,本土企业很多用FineBI,外企大多数是用PowerBI和Tableau。

1.PowerBI

基本介绍

Microsoft PowerBI同时提供本地和云服务。它最初是作为Excel插件引入的,不久PowerBI凭借其强大的功能开始普及。目前,它被视为商业分析领域的软件领导者。它提供了数据可视化和bi功能,使用户可以轻松地以更低的成本实现快速,明智的决策,用户可协作并共享自定义的仪表板和交互式报告。Power BI能够从各种数据源中抓取数据进行分析,除了支持微软自家产品如Excel,SQL Server等,各类数据库如Oracle,My SQL,IBM DB2等,还支持从R语言脚本,Hdfs文件系统,Spark平台等等地方导数据。

优点分析

1、Power BI有一个免费的基本版本,让用户有机会首先探索它

2、它支持多种方式来整合或导入数据(流数据、云服务、Excel电子表格和第三方连接)

3、它具有实时馈送数据的交互式仪表盘

4、用于将Power BI与应用程序集成的简单API

5、分享报告和仪表板的不同方式

6、多平台支持(Web,桌面,移动)

学习路线官网

(1)Power BI基础

1.初步认识Power BI

2.Power Query 快速数据集成

3.Power Query 数据清洗

4.Power BI 数据模型

5.可视化报表制作

6.Dax函数和表达式

7.发布与服务介绍

(2)Power BI 进阶

1.数据集成与清洗处理经验总结(37分钟6节)

2.函数相关重点(27分钟6节)

3.模型讲解(需注意的地方)(4分钟1节)

4.图表-可视化部分经验分享(54分钟10节)

5.本地与云端-报表的发布管理与权限控制(13分钟2节)

之前转载过一篇文章《小目标 | Power BI新人快速上手手册》,学习Power BI也可以参考一下。

2.FineBI

基本介绍

国内较为领先的BI软件,定位于自助大数据分析的BI工具,提供数据处理、即时分析、多维度分析、可视化等服务。FineBI目前最新版已迭代到 V5.0,主要面向企业客户(个人用户免费全功能使用,但是限制2个并发用户),在国内各行业有着众多的成功应用案例。

优点分析

1、业务人员自己动手制作仪表板,可以根据业务需求组合图表,以便展示更多信息;

2、选中图表类型,将数据字段快速拖曳,就能够实时分析图表;

3、可视化界面便于分析;

4、可以接入多种数据源。包括常用数据库(Hsql、IBM DB2、Microsoft SQL Server、MySQL、Oracle)数据、Hbase、Hadoop Hive、阿里云AnalyticDB以及华为云DWS;服务器数据集;本地Excel数据集;sql数据集;自助数据集。

学习路线

这个是国内厂商产品,可以在官网直接试用即可。

同类型工具:PowerBI、Tableau、Qlikview、SAP BI、Oracel BI、FineBI、Yonghong BI

三.数据库及编程语言相关

1.Python

基本介绍

Python是一种面向对象、解释型计算机程序设计语言。Python语法简洁而清晰,具有丰富和强大的类库 ,而且是这几年最火爆的数据分析工具,没有之一。

优点分析

1、简单易学

Python是一种代表简单主义思想的语言。阅读一个良好的Python程序就感觉像是在读英语一样。它使你能够专注于解决问题而不是去搞明白语言本身,Python极其容易上手,因为Python有极其简单的说明文档。

2、速度快

Python 的底层是用 C 语言写的,很多标准库和第三方库也都是用 C 写的,运行速度非常快。

3、免费、开源

Python是FLOSS(自由/开放源码软件)之一。使用者可以自由地发布这个软件的拷贝、阅读它的源代码、对它做改动、把它的一部分用于新的自由软件中。FLOSS是基于一个团体分享知识的概念。

4、可移植性

由于它的开源本质,Python已经被移植在许多平台上。

学习路线

1、Python语言基础

Python语言概述和环境安装丨变量、数据类型和进制丨运算符和分支结构丨循环结构入门丨循环结构的应用

2、常用数据结构和函数

字符串丨列表的应用丨元组和集合丨字典类型的应用丨函数使用入门

函数和面向对象编程

包和模块丨函数的高级用法丨装饰器和生成器丨面向对象编程基础丨面向对象编程进阶

3、Python网络数据采集

爬虫概述和页面抓取丨解析页面的方式丨爬取数据的持久化丨Cookie和商业IP代理丨获取页面动态内容丨Selenium应用详解丨提升爬虫工作效率丨破解验证码丨爬虫框架Scrapy

4、数据分析概述和Excel的应用

数据分析和数据分析师概述丨指标和指标体系建设丨Excel的安装和快速上手丨Excel中的函数和公式计算丨Excel透视表、透视图和商业数据看板

5、关系型数据库和SQL

数据库概述和MySQL的安装使用丨表关系和SQL的应用丨SQL数据查询详解丨窗口函数和业务场景下的数据查询丨Python程序接入MySQL数据库

6、商业智能(BI)工具

MySQL其他相关知识丨从Excel到Power BI丨Power BI中的数据清洗和分析模型丨Power BI中的数据可视化和报表制作丨Power BI项目实操丨认识和使用Tableau丨认识和使用fineBI丨数据思维和分析模型

7、Python数据分析

Python数据分析工具介绍丨使用NumPy实现批量数据处理丨线性代数和NumPy的linalg模块丨使用Pandas进行数据分析

8、机器学习算法

机器学习概述和kNN算法丨回归算法丨逻辑回归丨朴素贝叶斯丨决策树丨支持向量机丨聚类算法和轮廓系数丨集成算法丨特征工程和评价指标丨机器学习项目实战

同类型工具:R、Julia、Scala、Spark、Java、Hadoop

2.MySQL

基本介绍

SQL也是必会的工具,因为我们要利用SQL语句来取数、清洗数据。MySQL 作为互联网中非常热门的数据库,在高并发业务场景下,一条好的 MySQL 语句能为企业节省大量的运作时间和成本,这也是为何互联网大厂面试官最爱考察数据库底层和性能调优的原因。

优点分析

1、速度快

分析型数据库MySQL运用新一代超大规模的MPP+DAG融合引擎,采用行列混存技术、自动索引、智能优化器,在瞬间即可对千亿级别的数据进行即时的多维度分析透视,快速发现数据价值。此外,还可以快速扩容至数千节点的超大规模,进一步提升查询响应速度。

2、灵活

分析型数据库MySQL版极度灵活的存储和计算分离架构,您可以随时调整节点数量和动态升降配实例规格。分析型数据库MySQL版同时支持在大存储SATA节点和高性能的SSD节点灵活切换。例如,您可以从8个C4升到12个C8,或从12个C8降到8个C4,企业可以真正做到灵活控制成本。

3、易用

分析型数据库MySQL版作为云端托管的PB级SQL数据仓库,全面兼容MySQL协议和SQL:2003,通过标准SQL和常用BI工具、以及ETL工具平台即可轻松使用分析型数据库MySQL版。分析型数据库MySQL版旨在帮助企业降低实时数据化运营的建设门槛。

4、超大规模

分析型数据库MySQL版是全分布式结构,无任何单点设计,使得数据库实例支持ECU节点动态线性扩容至数千节点。您可以通过横向扩容来大幅度提升查询SQL响应速度、以及增加SQL处理并发。

5、高并发写入

支持您实时化、极速地进行数据写入、更新和高并发查询、交互式分析、ETL一体化。采用RAFT协议,支持超大规模数据写入实时、强一致;对于高并发或大吞吐场景,可按需独立弹性扩展,存储可以从GB级扩展到百PB级,TPS可横向扩展至千万级。

学习路线

MySQL学习这部分,我在上期的内容共创文章【云驻共创】如何有效率地学习MySQL?一文中有详细的描述,这里不单独介绍了。

同类型工具:PostgreSQL、Oracle、SQLServer、MongoDB

四.华为云数据分析相关产品

1.IoT数据分析 IoTA

基本介绍

华为云物联网数据分析服务基于物联网资产模型,整合物联网数据集成,清洗,存储,分析,可视化,为物联网数据开发者提供一站式服务,降低开发门槛,缩短开发周期,快速实现物联网数据价值变现。

优点分析

1、物联网资产模型感知

华为云物联网数据分析服务是以物联网资产模型为中心的分析服务。不同于公有云上的通用型大数据相关产品,物联网数据分析服务与资产模型深度整合,在相关数据分析作业的定义中,开发者可以方便引用物联网的模型数据,大大提升数据分析的效率。

2、一站式开发体验

大数据开发技术门槛较高,而华为云物联网数据分析服务整合了大数据分析领域的最佳实践,为开发者打造一站式数据开发体验,并且跟华为云物联网相关服务(比如设备接入)无缝对接,降低开发者开发难度,提升开发效率。

3、针对物联网时序数据优化

针对物联网数据具备的显著时序特征,华为云数据分析服务在数据存储及数据分析上做了大量的优化。比如海量时间线能力,单实例支持10万线,数据存储压缩比20:1,以及多种时间维度的聚合计算能力。

2.云数据仓库 GaussDB(DWS)

基本介绍

新一代、全场景数据仓库,一站式分析,性能、容量无限扩展;守护高价值数据、创享高价值分析,企业数字化转型坚实伙伴

优点分析

1.高并发交互式查询秒级响应,分析师工作效率全面提升

单集群480节点,装机容量20PB,支撑数据分析、集市、BI等各种场景;

通过分布式查询优化,实现高并发点查询秒级/毫秒级响应;

资源融合统一,灵活调配,多层级并行计算,效率最优

2.HTAP混合负载,按需弹性,湖仓一体

混合负载:“一库两用”,支持超过100万QPS、10万TPS高并发混合读写,支持事务强一致;

资源管理:可以根据业务优先级进行资源动态分配,实现“快慢通道”;

按需扩容:弹性按需扩容,灵活应对用户数据及负载潮汐变化;

仓湖一体:DWS可以直接读写OBS对象存储系统的数据,支持数据冷热分级。

3.复杂即席查询,实时数据分析,一站式平台

复杂SQL实时查询,10+表格联合运算,秒级返回结果;

实时入仓批流融合60万/秒/节点,T+0完成数据分析;

多源数据融合,一站式统一平台,助力非传统数仓工程师便捷使用数据。

以上内容分享自华为云社区《【云驻共创】你知道有哪些好用的数据分析工具类软件?》,作者:再见孙悟空_ 。

葡萄城GrapeCity
「葡萄城GrapeCity 」发表看法
2023-07-03

你好,我的主页有一整套0基础入门数据分析的课程,可以进行免费学习~

------------------------------------------------------------------------------------------------

数据分析工作,不仅能通过对真实数据的分析去发现问题,还能够通过经济学原理建立数学模型,对投资或其他决策是否可行进行分析,预测未来的收益及风险情况,为作出科学合理的决策提供依据。

数据分析工作用事实说话,用数据揭示工作现状和发展趋势,改变了凭印象、凭感觉决策的不科学状况,客观地抓住了工作中存在的突出问题,使这些问题无可争辩地反映在面前,促使人们不得不努力提高水平、改正问题。数据分析工作提高了工作效率,增强了管理的科学性。

我们提数据,做报表,这些都是信息的收集,信息的处理,信息的整合;而给结论,是我们需要输出的对这些信息的描述,也就是我们需要告诉别人这些信息到底是啥;因为信息多,我们才要整理,因为整理了,我们才需要提炼有用信息。

后半段,从认知事物到决策,是工作的目的。我们呈现了高度汇总的信息,这个是个事实;呈现事实本身是没有用的,通过事实给出的观点才是有用的。

一切的数据处理,内容总结,都是为这个观点服务的;就如同论文,我们长篇大论写了一堆数据,描述了一堆事实,最后不给一个论点,你说的这些数据和事实,都是无用的。

所以说,数据分析应该分析在前,数据在后;因为核心目的,是为结论负责,而这个结论又是为后续的决策负责。也就是说,我们在做数据分析时,第一个阶段时整理数据,处理信息;第二个阶段是总结信息,呈现事实;第三个阶段是基于事实,给出观点。

数据分析师在进行数据分析时,数据分析工具是一个必备的工具。目前市场上除了Excel、Python、SPSS等常见工具外,像Power BI、Wyn Enterprise等自助式商业智能BI工具的普及,为数据分析注入了新的活力。

数据分析大杂烩
「数据分析大杂烩 」发表看法
2023-07-09

数据分析思维概述:

数据分析的过程与做大盘鸡有异曲同工之妙。如果一一对应,可以这么来看:

1.客人到底想吃什么?(分析目标)

2.要做一盘大盘鸡(业务背景)

3.知道大盘鸡的做法,需要哪些材料(分析思路)

4.有一块鸡肉(原始数据)

5.有配料(辅助数据)

6.有灶台、锅碗瓢盆(分析工具)

7.蒸煮炸等烹饪手法(数据处理)

以上可以形象帮你理解数据分析。当然其中最重要的是分析思路,当然我感觉数据分析还是应该从 获取数据以及可视化开始。希望对你有帮助

进取笔墨丹青
「进取笔墨丹青 」发表看法
2023-07-07

如果你零基础想要入门数据分析,以下是一些建议和步骤:

1. 了解数据分析的基本概念:开始之前,了解数据分析的基本概念和术语是很重要的。了解数据分析的定义、目标和常用方法,可以帮助你建立基本的框架和理解。

2. 学习统计学基础知识:统计学是数据分析的基石,因此学习统计学基础知识对于入门数据分析非常重要。了解常用的统计概念,例如平均值、标准差、相关性等,以及统计学中的基本原理和方法。

3. 学习数据分析工具和编程语言:数据分析通常使用各种工具和编程语言来处理和分析数据。最常见的工具包括Excel、Python和R等。学习如何使用这些工具和语言进行数据操作、数据可视化和统计分析是入门数据分析的重要一步。

4. 完成在线课程或教程:有许多在线课程和教程可以帮助你入门数据分析。一些知名的在线教育平台,如Coursera、edX和Udemy,提供了丰富的数据分析课程,从入门到高级都有不同的选择。选择适合你的学习需求和水平的课程,跟随课程的教学和实践案例进行学习。

5. 实践和练习:理论知识只是入门数据分析的一部分,实践和练习同样重要。找到一些真实的数据集,尝试应用学到的知识进行数据清洗、数据分析和可视化。通过实际操作,你将更好地理解和掌握数据分析的技巧和方法。

6. 加入数据分析社区:加入数据分析的社区可以提供学习和交流的机会。参与在线论坛、社交媒体群组或本地数据分析小组,与其他从业者交流经验和分享学习资源。这样可以获得更多的学习资源和建议,并与同行进行互动。

7. 持续学习和提升:数据分析是一个不断发展和演进的领域,因此要保持持续学习和提升的心态。跟踪行业的最新趋势和技术,参与培训课程或进阶学习,不断更新和发展自己的数据分析技能。

记住,数据分析是一个深入的学科,需要不断地学习和实践才能掌握

。入门后,可以根据自己的兴趣和发展方向选择更具专业性的领域进行深入学习和研究。

聚数云海
「聚数云海 」发表看法
2023-07-01

大数据时代,数据为王。用数据做分析,给公司决策提供指导性意见,是众多公司在这个精细化运营,降本增效的时代必须要做的事情。各大企业都建立了数据分析部门。截止目前,我国共计1400万数据分析人才缺口,市场规模预计将在2025年达到2000亿!数据分析与其说是一个岗位,更是一个重要技能,拥有这项技能意味着你的就业前景更好,职业发展更广。

那么数据分析零基础应该怎么学呢?下面我将从数据分析的学习周期、学习内容以及职业发展规划三个方面,带大家充分了解数据分析这一行业。

1、 数据分析要学多久?

每个人的学习能力和基础都不同,所以数据分析的学习周期也不同。如果是通过自学的方式,由于无专业老师指导及无法系统的学习,这个周期可能会很长。一般来讲,如果零基础的学习者进行系统的培训,最快也要将近三、四个月的时间。数据分析的学习应该首先从熟悉表以及表结构开始,它的原点一定是在首先了解熟悉Excel的基础上,在能够从数据库里提数的基础上再进行技能的升级。你的技能从能够从数据库里提数,并且用Excel和BI处理几万行的小数据量,到使用python批量化处理几十万甚至百万行中量级数据量,到最终使用大数据的相关组件,例如hadoop,spark,flume等组件处理千万级甚至是亿级大数据量。每一个阶段所需要的工具加方法论都是不一样的。一般而言,对于自学而成为能处理中量级数据量的分析师而言,得至少入门python的pandas,numpy等数据处理库。这个零自学的周期,也一般跟悟性和自律有关,悟性和自律性高的同学,可能在4个月能够掌握;如果悟性和自律性不高的同学,这个周期有可能就是半途而废,无法估量时间了。这里给大家推荐一下聚数学院的《数据分析实战就业班》(聚数学院),专注于培养数据分析师的数据处理能力、数据分析能力和数据挖掘能力,课程内容从数据库管理、统计理论方法、数据分析主流软件的应用到数据挖掘算法等,对一整套数据分析流程技术进行系统讲解并配以实战练习,学完之后,学习者可以直接达到数据分析师的水平。

2、 数据分析要学什么?

(1) Excel

说起Excel可能会有人觉得这个很简单,但是Excel确实是一个功能强大的利器。零基础学数据分析师一定要从Excel入门,因为Excel是处理小型数据量企业用的最多的工具,在基础数据分析师与数据运营岗位中具有极其重要的地位。作为数据分析师的核心工具,具体学习内容有Excel函数技巧(查找函数、统计函数、逻辑函数)、Excel快速处理技巧(格式调整、查找定位、快捷键技巧等)和Excel可视化技巧(组合图、条形图、数据气泡地图)等。

(2) Mysql

SQL同样是零基础学习数据分析的核心内容。因为作为数据分析师,你首先要解决的问题就是你要有数据来做分析。通常企业都会有自己的数据库,数据分析师首先得根据业务需要知道自己要从企业数据库中提取哪些数据。企业如果部署本地数据库,那么一定是SQL语言做提取数据的语言。SQL简单易懂,非常容易上手,并且是非学不可的。SQL语言从学习MySQL数据库开始,涉及对表结构数据的增删改查。真正在企业里面,数据分析师一般不会有增删改的权限,只会有查的权限。学员应该重点掌握查的各种句式。

(3) Python

Python的基础对于数据分析师而言是非常重要的。对于十万级或者百万级数据量而言,Excel和BI都会因为运行卡顿而变得完全无法使用。然而在实际企业运用中,一次性处理十万级以及百万级数据又是非常常见的。而Python则是处理这种中量级数据的利器。因为Python有很多的第三方强大的库,比如Numpy、Pandas、Matplotlib、Seaborn等。这些库能让数据分析师对百万数据进行数据清理和画图分析。Python不仅能数据清洗,画图,还能用sklearn进行大数据算法分析。虽然Python是数据分析的重要工具,但是不同的职业发展方向,Python掌握的程度也是不一样的。

(4) BI商业智能工具

BI可以理解成Excel图表透视表的高级版。BI是将表与表相连,然后得出很多指标图。它是一个大屏的看板,如下图:

企业销售指标,运营指标,物流指标等等。这些图可以表示企业在过去5个月的平均销售单价,过去24个月销售的物流发货量的变化曲线,甚至是现在实时的销售额,这些都是企业关心的问题。有了这个看板,领导层在监控企业业务方面就有了非常直观的数据,以供他们及时做出决策调整。现在市面上比较流行的BI软件,有FineBI,PowerBI等。而这些BI软件实际上都是非常类似的,学起来难度也不大。学习FineReport、FineBI由入门到精通,快速挖掘数据价值,将这些数据转化成有用的信息,让企业决策有数据依据,从而驱动企业决策和运营。

(5) 数理统计与数据运营

数理统计和数据运营方法论是数据分析师的理论基石。数理统计包括概率论,统计学,线性代数,以及基础的微积分理论。这些内容都不需要理解的很深,但是对它们的原理以及内涵都需要有所掌握。由于整个数据分析的源头其实就是脱胎于描述性统计分析的。描述性统计分析是对样本的总数、均值等指标做统计的;而数据分析后续涉及到的算法则是架构在统计学上更深一层次的建模。因此,掌握数理统计的相关知识对于入门数据分析师而言是基础且必要的。

那数据运营方法论是什么呢?数据运营方法论实际上是学习各个行业所运营的分析模型。例如,对电商而言,漏斗分析可以分析出来进入主页的人数PV1,到进入服装板块的人数PV2,PV2/PV1就可以得出一个进入服装板块的比率。还有很多通用的分析模型:相关分析,A/B test等。对于想往管理路线发展的数据分析师来讲,数据运营是必须要学习的知识。其实数据运营知识也不复杂,就是根据自身业务需求将指标拆解到最细,然后运用同比和环比两种数据分析方式。

(6) 机器学习

最后一个进阶要求数据分析师掌握对大量数据分析的能力。这种分析就不只是停留在描述统计分析和运用数据运营方法进行分析了,而是进行预测分析。预测分析的本质是利用已有的数据做出一套变量x,与预测最终值y之间的关系(也就是数学算法公式),然后利用这套算法,将更多的x输入算法中去得出一个预测的y值,这里听不懂没关系。总之,这个阶段的数据分析是利用大量的历史数据构建出一套数学公式(也就是算法),用这个数学公式去对未来进行预测。比如说:一个人大量地刷体育短视频,根据算法可以得出这个人可能对观看足球比赛的腾讯体育会员感兴趣。这类推断和预测对于商业世界是有着极大变现意义的。要想成为掌握算法的数据分析师,机器学习是不可跳过的入门。学员应该从简单的一元回归,多元回归,以及逻辑回归学习等,逐渐学习更多像决策树,随机森林,SVM等更高级的算法。

3、 数据分析的职业发展规划?

一般来讲,数据分析有两条发挥路线,一条是管理路线,一条是技术路线。往管理端发展,比如初级数据分析师,到数据运营,到数据分析经理、数据运营总监等等。这条发展路径主要要求统计学、Excel、PPT等技能,需要撰写市场分析报告。这条路看似技术掌握不用太深,但是对业务的理解要极深。而精深的业务理解需要时间和深度的业务钻研精神。如果你是非数学、计算机和统计学专业的朋友,比较适合这条非技术的职业发展之路。

而向技术方向发展,则目标会非常明确。一是深入往数据挖掘方向发展,学习深度神经网络,NLP等前沿算法。二是深入数据分析开发,把大数据组件hadoop,spark等等大数据组件学好学精。这是一条技术类的发展方向,要求更高的统计学能力、数理能力以及编程技巧。

实际上,无论是非技术的业务方向和技术专家方向都要的是两个字:钻研。当然听到这里,我们也需要重重地阐述一下:入门初级数据分析是不难的。而后半段,要成为一个优秀的数据分析师是难的,是需要刻苦钻研精神的。

如果看到这里,你觉得自己心理上已经就入门数据分析师方向做好了准备,但是你是零基础实在不知道如何入行的话,欢迎私聊获取免费的数据分析师知识点大纲,并且免费做数据分析师的入门咨询。

李明殊
「李明殊 」发表看法
2023-07-04

大家的回答都很好,但是有个问题。

一上来便是各种教程,二话不说给出一批书单,各种数据处理的方式,讲怎么样用Python挖掘数据,怎么用R进行数据可视化,讲AB测试。

他们给的教程都很好,数据处理的方式也很有借鉴意义。

且不说,有多少人是光收藏,而不去认真学习的,就算是认真去学习的,他们也会遇到这样的问题

为什么这么用,为什么这么做。

比如,前两天在我的这个回答中,零基础如何学爬虫技术? - 知乎

有很多人都有这样的评论

一开始我是无语,后来想了想,这应该是一个普遍问题

这就是数据分析中最大问题,很多人学习数据分析,更多的是为了数据分析而数据分析,实际上根本不知道自己在做什么,为什么这么做。

或者仅仅是为了在简历上增加一行

鄙人精通数据分析。

估计HR看了是要微笑着,然后把简历放入不予录用的文件夹中。

数据分析,不论使用什么样的工具,使用什么样的方法,不论是Excel,还是Python,还是MySQL,都是工具,目的只有一个——

解决一个问题,或者给一个决策提供依据。

所以,学习数据分析的第一步,是要考虑,我要用数据,解决一个什么样的问题?

这点如果没有考虑清楚,只是跟着网上的教程学习爬虫,学习数据清洗,然后把那些公有的统计数据做成绚烂的图表,又有什么用呢?

1.哪里开店

比如,有这样一个现实的例子,你表嫂跟你说,小明啊,你最喜欢吃我煮的麻辣烫了,我想开麻辣烫店,就在大学城附近,你说哪里好呢?

你是不是会想到以下几个问题呢?

表嫂的麻辣烫真好吃,想想就流下了口水

咳咳,正事要紧,到底应该在哪里开店呢?

所以,你有考虑到了这些可以量化的数据并且对应的你找到了这些数据的获取方式

问题来了,虽然写出来了大致的数据获取方式,但是具体怎么操作?

招生计划怎么获得,学校官网还是相关报道?如何通过在线地图分析学校面积及相关建筑分布的合理性,最小路径还是顺路路径?如何获学校食堂评价,爬取微博数据,获得地理位置,并且对提及“食堂”的微博进行词义褒贬分析?或者直接拦路问询?人流量怎么获得,实地考察的时候,用本子画正字吗?

很好,这些问题你都想到了相应的解决方式,并且很顺利的获得这些数据,尽管有可能不太准确,但是你确确实实比以前更加了解了大学城附近大致的餐饮市场环境,不是么?

这也就是,

数据分析必须紧贴业务本身

获得数据之后,如何分析,人流量/商贩个数?但是每个商贩的服务能力又不一样,是不是得加权,如何加权?

于是你考虑了很多情况,写下来一个公式:

建议推荐开店系数=(人流量*XX/(YY*0.4)+租金*0.5)/ZZ

根据系数,你得出一个结论,建议开店的位置的前三家分别是

A大东门A大小西门B大女生宿舍小南门

你表嫂想了下,说,我知道你最喜欢B大的小姑娘们,胸大貌美腿子长。

于是麻辣烫店就开在了B大女生宿舍的小南门。

这个过程中,你有可能学会的或者仅仅了解(不一定掌握)数据分析的相关技能包括不限于以下:

Excel加减乘除,基础函数;爬虫的基本原理,及操作方式;正则表达式与数据清洗;语义分析的一般实现方式;在线地图API可以获取的数据有哪些;

2.优化数据的应用

一阵时间的忙碌,店终于开起来了,你表嫂的手艺真的很不错,每天都有很多小姑娘过来吃麻辣烫,中午晚上的时候,都忙不过来。

你表嫂感觉很可惜,很多客户就这样被浪费掉了:我多卖一份,少卖一份都无所谓,但是小姑娘本来想吃咱们家的麻辣烫,结果爬不上队饿着肚子走掉了,到别家说不定还要等,看见我都觉得挺过意不去的。

这时候聪明的你,有可能想到了通过获取以下数据,并且进行相关的分析来优化当前这个问题

你连续跟踪了三天这样的数据,运用了相关的统计学的相关知识

等待时间>=13分钟的时候,用户放弃继续等待的概率是78%!,然后你表嫂并不能理解,这78%到底是什么意思

所以你画了一张图,说山峰越高,走的人就越多。

问题找到了,只要将最长等待时间优化到13分钟之内,用户放弃等待的几率有可能下降。

这时候聪明的你,想到了如下的解决方式:

用户抵店之后,才开始点餐,然后烹饪,是不是可以通过互联网的方式进行预点餐呢,所以你给表嫂申请了一个微信号,日经贴就是:“今天你想吃什么”,回复留言及预计到店时间,即可预订。你发现,用户选完菜之后总是喜欢把菜夹放到最远的地方,每次表嫂都需要把菜夹整理一次,拿到开始的地方。你考虑了一下,将菜筐的布局进行更改,刚好菜夹能够完成一次循环;或者你使用专菜专夹的方式。优化了店内桌椅布局,行走了最短的距离到达全店……

数据分析必须落地才是有效的,不是提交统计结果,而且获得统计结论

这个过程中,你有可能学会的或者仅仅了解(不一定掌握)数据分析的相关技能包括不限于以下:

数据清洗的一般方式,时间函数计算统计学中分布的相关知识,这里应该是泊松分布数据可视化,包括不限于Excel 图表,js图表库,或者在线图表工具

3.大数据的处理

生意越做越大,扩充了店面之后,又开了分店,这时候你表嫂已经不亲自上一线熬煮麻辣烫了,但是又不放心那些雇来的人是否认真的在服务,于是制定了相应的店规,动不动还来一个突击检查。感觉比以前还要累了。

这时候,聪明的你,看在眼里,疼在心里,所以,你建议嫂嫂购买专业的餐饮管理软件,来获得相应的店铺运营数据。

在餐饮软件的后台,会有这么些个大致的运营数据,

当前订单量,成交量,客流量,客单价,等等等等,一切看起来那么完美。

等等,不对,为什么这个月以来,C分店的客单价总是这么低呢?事出有异,必定有妖!

还好,这个系统功能还算完善,能够导出一天所有的订单明细,包含以下字段,

下单时间,下单菜品,下单客户,联系电话,消费金额,配餐人,操作人,收银员,等等等

但是,你还是快掀桌子了,一个月,让我导出30次数据,然后在合并么?这个方法简直太土鳖了

你想着,要是能直接读取数据库不就好了么?一看产品介绍,数据库使用MySQL,于是你Google了一下,SQL入门,你发现,WHERE 和SELECT 基本上都满足你的需求了

很顺利的,你把这些数据导出了。

你把这个20W条记录的CSV用Excel打开,风扇疯狂的转了起来,不一会,你表嫂孱弱的笔记本就卡死了。

你感叹,Excel分析小一点的数据还行,数据量稍微大点,就显得力不从心。所以,你拿起了一本书,名字叫《21天学习Python,从入门到放弃》,这不坑爹呢吗?

你想着,反正我是为了处理这批很大的数据,没必要全部了解Python的功能,只需要找到相关的操作方法就好了。

你在Google上分别搜索了以下关键字

Python mysqlPython 数据分析库

你还找到了一本,用Python进行数据分析的pdf,感觉这本书写的通俗易懂,而且还有元数据示例。

在搜索的过程中,你发现了有好多数据分析是代码示例,有的甚至,只需要改一下文件路径,搬过来就能用。

你会感叹,原来,写程序也是Ctrl+C,Ctrl+V啊

这个过程中,你有可能学会的或者仅仅了解(不一定掌握)数据分析的相关技能包括不限于以下:

SQL基础语句Python常见的数据分析库Python数据可视化

聪明的你,捣鼓了三两天,就发现了问题的所在?

那么问题究竟在哪呢

我实在是写不动了,明天再更

郑小柒是西索啊
「郑小柒是西索啊 」发表看法
2023-07-08

在这之前,我想推荐吴军老师的几本书,《数学之美》、《浪潮之巅》和《大学之路》

做分析之前,不得不提一下分析思维,《金字塔原理》可能会比较适合

想要了解数据分析是什么,不得不读《深入浅出数据分析》、《谁说菜鸟不会数据分析》、《人人都会数据分析》、《如何用数据解决实际问题》、《Excel图表之道》

不满足于简单的汇总统计、报表制作,进阶之后的案例丛书,全方位了解传统行业、互联网行业中的分析案例、方法和模式,《网站分析实战》、《增长黑客》、《数据化管理》、《数据化运营速成手册》、《精益数据分析》……

会了一点分析,但是觉得理论不够扎实,那有必要读点统计学,《赤裸裸的统计学》、《统计数字会撒谎》

随着工作内容的深入,越来越觉得工具不够用,原来我只用excel,想要拓展点其他的工具,按照复杂程度,如下

sql类的书,《Mysql必知必会》、《SQL Cookbook》

spss的书,《spss统计分析基础教程》

R的书,《R语言实战》、《R cookbook》

python的书,《利用python进行数据分析》、《python cookbook》

数据算法层面,西瓜书《machine learning 机器学习》、《machine learing in action》、《the elements of statistical learning》、《数据挖掘与数据化运营实战》、《数据挖掘-市场营销、销售与客户关系管理领域应用》

资深的数据分析,在方法论、工具上的使用已经炉火纯青,对于模式和框架也已经了然于胸,这时候往往不局限于一个行业或者一个方向,而是拓面立体,《决战大数据》、《Doing Data Science》、《数据之巅》、《大数据时代》、《智能时代》、《卓有成效的管理者》……

好的分析离不开好的可视化呈现,《The Wall Street Journal Guide to Information Graphics》、《鲜活的数据:数据可视化指南》、《ggplot2:数据分析与图形艺术》、

数据集越来越大,sql已经不能满足日常工作,要学习hadoop、hive、sprak,我的第一推荐仍然是官网,当然,这里有个前提,就是你的英文阅读能力得特别好,否则得话,还是推荐《Spark大数据分析》、《Data Analytics with Hadoop》

要做实时分析,可以关注下flink、kafka的生态圈

jk喵
「jk喵 」发表看法
2023-07-04

可以从Excel开始。

Excel最大行数为1048576也就是100万行左右,对于比较小的数据分析是绰绰有余的。

那么如何通过excel进行数据分析呢?

以结合具体业务的数据分析来说,需要通过不同维度。

电商为例,分析用户行为时,可以通过数据筛选某一时期的点击数量,加购数量,收藏数量来形成用户漏斗模型。也可以自定义参数,如购买率。

还可以根据用户的区域划分不同区域的产品利润,销售情况,从而优化不同地区销售策略。

Excel中的函数,数据透析功能是分析过程中的常用功能,也可以通过Excel中的VBA功能实现自动化,提高效率。甚至是通过图表如柱形,散点,折现,饼状图等等实现可视化。

总之数据分析需要结合具体业务,Excel可以作为GB级别以下数据量的利器。

我是数学天才
「我是数学天才 」发表看法
2023-07-05

让我来分享一个很不快速(需耗时一年),但包你从零基础学到昏厥的学习教程吧:统计、SQL、R、Python、Tableau、Excel、Forecasting & Machine Learning

1. 统计

统计需要掌握的姿势:

Descriptive StatisticsProbability Concepts and Probability DistributionsSampling Distributions and the Central Limit TheoremConfidence IntervalsHypothesis TestingAnalysis of VarianceChi Square and Nonparametric TestsSimple and Multiple Regression

想躲过统计???

入门课收好,Coursera上阿姆斯特丹大学的Basic Statistics,卡通配图教学,和萌萌哒的你最配!!

University of Amsterdam:Basic Statistics | Coursera (旁听免费)

喏,还有一本简洁易懂的step by step英文教材,也是我们课上用的教材~

Basic Business Statistics by Mark L.Berenson & Others

2. SQL

常用语句来来回回就那么几个,但是要熟,要熟,要熟!

简历上有SQL技能,很重要!!!很重要!!!

常用语句总结:SQL Quick Reference From W3Schools

再送你一门超好,超好,超好的MySQL课!Coursera!杜克大学!我太喜欢教课的那个温柔美丽的大姐姐了~

Managing Big Data with MySQL | Coursera (旁听免费)

我学R上的课是Coursera上Johns Hopkins University的经典R课程和在Data Application Lab实习的时候上的商业分析师培训课。Coursera的那门课我上得不太走心,默默吐槽一下课程莫名散发着浓浓的时代感,老师有点面无表情,比较打击我的学习激情...... 好吧,我知道我作......

后来实习的时候上公司的培训课,教R的是个讲话干脆利落的小姐姐,才让我重新喜欢上R......

R Programming | Coursera (旁听免费)商业分析师 - Data Application Lab

作为一名主观上比较站Python的小粉丝,我目前学过的R就这么多啦!!大体了解了R的语言思维,碰到不会的问题再Google找代码就差不多了~

另外,我在Udemy上找到一门R的课,看课程设置觉得还是挺不错的,想学R的可以试试~ 关于Udemy上课程的价格补充一句,原价是吓人的,常年打折,但是打折力度经常变来变去的,最便宜的时候一般是10-20块的价格可以买到好课...... BTW,下面这门课目前15刀。

R Programming A-Z™: R For Data Science With Real Exercises!

4. Python

Python 是一门可以让人浑然忘我的语言......

这辈子学过韩语、日语、英语,和一丢丢R,但Python是我学得最有激情的......

最沉浸的那段时间里,不管几点回家,晚上睡觉前一定要看一点Python爬虫才能安心睡下,晚上做梦也是爬虫代码......

我最开始接触Python的时候上的课是Coursera上University of Michigan的经典系列:Python for Everybody,里面包含五门专项课,除了最后一门Capstone,其他四门都刷过(没写作业)。

这门课非常实在,内容非常赞,上课的是个亲切的老爷爷,学下来有助于你系统了解Python的功能~ 个人感觉 Using Python to Access Web 对于纯小白来说可能有点难度~

提醒一下,如果你搜Python for Everybody,会发现...... 要交钱上啊!!!省钱小tip就是在搜索栏里一门一门搜专项课,进入专项课的页面就可以免费旁听了...... 同理适用于Coursera很多其他的系列课程。

University of Michigan: Python for Everybody | Coursera

Programming for Everybody (Getting Started with Python) | CourseraPython Data Structures | CourseraUsing Python to Access Web Data | CourseraUsing Databases with Python | CourseraCapstone: Retrieving, Processing, and Visualizing Data with Python | Coursera

密西根大学还出了Python的数据科学进阶课,包含了数据分析、画图和机器学习等内容:

University of Michigan: Applied Data Science with Python | Coursera

另外,我还追过大神

@秦路

的运营大湿兄知乎专栏,从“开始Python的新手教程” 到“用Python分析用户消费行为”,一共六篇文章,超快速入门Python数据分析。

Udemy上也有一门很棒的Python数据分析课,我目前在上,觉得好棒棒~

教numpy、pandas、画图、带着练三个数据小项目,至此觉得内容量已经很良心了,老师竟然还教机器学习!!!20个机器学习视频,用SciKit Learn这个包!还有还有!11个统计视频!还没完还没完!还有几个SQL和Web Scraping的小视频!满满的良心学习大礼包~

Learning Python for Data Analysis and Visualization

想必还有很多盆友们对爬虫充满了兴趣......

学爬虫当然要看崔庆才大神的系列教程啊!!!

文字版教程免费,使用的是Python 2.7版本↓

Python爬虫学习系列教程 | 静觅

视频教程499软妹币,之前有过折扣,印象中270多~

Python3爬虫视频学习教程 | 静觅

如果你只是比较随意,不想玩那么高深,或者你真的和我一样穷,可以看看文字版教程,了解urlib库、Requests库、BeautifulSoup库、Selenium库以及正则表达式后,跟着崔大神的三个免费case练一遍~ 我觉得对于小白来说就差不多了~

Python3爬虫三大案例实战分享

对于数据分析师来说,会爬虫不属于必备技能,那么学爬虫的意义是什么呢?大神

@董伟明

在他接近满分的“爬虫从入门到进阶”的Live简介中说得直戳心坎~

Hello World,醒醒啊!!!你的女神来了!!!

5. Tableau

终于,数据分析界的女神出场了!!!让我们大声喊出她的名字:T! A! B! L! E! A! U!

读作“Tab-low”!!!

我身边很多学Tableau的孩纸们,反应不是酱紫的,

就是酱紫的......

纷纷表示在这个看脸的时代,要好好学习女神软件......

(Source: Best Practices for Designing Efficient Tableau Workbook)

凭借着打娘胎起就异于常人的颜值,Tableau迅速蹿红,逐渐渗透进业界和美国高校。对于在美帝的数据分析师来说,Tableau也是简历上必备的技能之一。

我目前觉得学习Tableau的最好方式,还是去Coursera上上杜克大学的那门课,基本涵盖入门到中高级操作,墙裂打call,墙裂推荐!!!真的好喜欢教课的杜克大姐姐......

Data Visualization and Communication with Tableau | Coursera

另外,Tableau为了推广自家软件,在免费培训方面也是做得很拼......

Tableau Training & Tutorials (中英文都有)Live Training ResourcesWebinars

还有很多很棒的Tableau使用者的case展示~

Gallery

还有Moveover Monday Project,每周一po一个数据集和数据分析展示~

A weekly social data project

至于有些人说,下载都这么贵,土豪才学得起吧...... 只要你乖乖去上Coursera杜克大姐姐的课,会有惊喜......

6. Excel

无论你多喜欢Excel或者多不喜欢Excel...... 作为数据分析师,简历上有Excel技能也是必备......

最重要的当然是会Pivot Tables~

我也是通过DAL的商业分析培训课学的Pivot Tables,如果你只想学Pivot Tables,可以去Udemy上这门↓

Microsoft Excel - Data Analysis with Excel Pivot Tables

当然,还有一个免费的学习神器,YouTube啊~ 哈哈,Pivot Tables一搜一大把~

我真的非常热爱YouTube,基本没有YouTube不到的姿势......

7. Forecasting

预测/时间序列也是我们数据分析僧要掌握的技能,不过学得比较浅显,大概了解几个预测模型的原理和会用软件操作就行了。我们用过的教材是Business Forecasting,有中文版,不过我相信你不会想看的......

商业预测 (豆瓣)

Udemy上依旧有药!介绍Moving Average, Simple Exponential Smoothing, Double Exponential Smoothing / Holts, Winters / HoltWinters等模型以及在R和Tableau中的操作。

Data Science-Forecasting/Time series Using XLMiner,R&Tableau

如果你对Tableau女神是真爱!可以去上Udemy新课,目前评价4.7分,感觉还挺不错的样子,反正是安利到我了~

Forecasting and Time Series Analysis in Tableau

8. Data Mining and Machine Learning

想当年,刚接触数据时,我还是个蠢萌的宝宝,在听说“Machine Learning”这个东东的时候,内心是下面那样的......

何方的妖魔鬼怪,尼玛听名字就不明觉厉......

入坑数据分析一年,但才刚接触机器学习一个月(网课加这学期修的数据挖掘专业课),感觉难度明显拔高了一级,但越学越刺激,越学越稀饭~

目前还是个渣渣,不敢瞎说,就大概罗列一下机器学习入门需要掌握的知识点和网上的学习资源吧:

Linear RegressionLogistic RegressionDecision Treesk-Nearest NeighborsNaive Bayes ClassificationDiscriminant AnalysisNeural NetsSupport Vector MachinesCluster AnalysisRandom ForestNatural Language Processing

如果没听说过吴恩达男神的机器学习王牌课程,那你一定是假的数据猿......

Machine Learning | Coursera

说实话,没上男神的Machine Learning前,我还挺不理解为什么这个看上去其貌不扬的大叔,有这么多死忠信众...... 每次大叔的动向更新,都跟地震一样...... 娶的老婆还是跟他智商一样上天高的女神大牛!约翰霍普金斯的CS博士......

如果你和曾经的我一样迷惑,请去Coursera上课...... 顺带必须提一句,男神还是Coursera的联合创始人啊!!!我的前半生没有Coursera,但是后半生必须要跟Coursera紧紧相依......

反正现在的我是痛哭流涕着入吴恩达教了......

之前我在Python部分介绍的Udemy的Python数据分析课中,也涉及一部分机器学习的内容:

Learning Python for Data Analysis and Visualization

内容设置很赞,也很系统的数据科学课程还有:

University of Michigan: Applied Data Science with Python | Coursera

以上就是我总结的一些数据分析经典姿势~ 其实还有Decision Analysis(主要讲概率)和Optimization,大家就自行去YouTube吧,视频很多~

一年前的今天,我没开始刷网课,不会SQL,不会R,不会Python,不会Tableau,不懂Forecasting,更不知道机器学习是什么鬼...... 就修了两门专业课,统计和Optimization(Excel Modeling),仅此而已......

按照这份教程一点点啃完,其实你也可以在家DIY出半个名校学生(如果不提名校的校友资源和networking机会等的话)~

大家可以再参考一下几个美国出名的数据分析项目的课程设置:

University of Texas -Austin | MS in Business AnalyticsUSC | MS in Business AnalyticsUniversity of Chicago | MS in Analytics

最后再来个励志的故事,我最新关注的一个YouTuber,Harrison Kinsley。小哥毕业于Sam Houston State University(懵逼脸),专业是Philosophy and Criminology(茫然脸),毕业后就开始创业,自学python编程,并在网上po免费python教程,还创立了一个python学习网站,YouTube上目前有27万多粉丝。

如果你好奇小哥怎么赚钱存活?小哥说,他一周就能接好几个offer...... 你们没听过的公司一堆一堆的,全宇宙人民都听过的大公司Facebook和Apple的offer他都有...... 另外他还做咨询赚钱,生计完全不愁......

既然你都读到这儿了,看来也是数据的真爱,那就一起学到昏厥吧!

加米谷大数据
「加米谷大数据 」发表看法
2023-07-03

1、学一些数据分析的基础方法,基础知识,比如统计基础统计理论等

  打好概率与统计的基础。概率与统计是数据分析的基石,可以说日常碰到的大部分的分析需求都可以用统计分析来解决。统计学,对于互联网的数据分析来说,并不需要掌握太复杂的统计理论,只需按照本科教材,学一下统计学就够了。

2、学会一门编程语言,可以大大提高处理数据的效率

  Python和R是数据分析当中最常用的两门语言。比较推荐Python,性能上来说,Python的速度更快,上手容易,语言相对简单。

3、掌握数据库技能

  做数据分析离不开查询数据库,这里主要涉及的是SQL。入门SQL的书推荐一本《MySQL必知必会》。

4、掌握一些数据分析方法及一些数据分析的工具

  掌握数据分析相关的常用工具。数据分析方法是理论,而数据分析工具就是实现数据分析方法理论的工具。可以看一下《精益数据分析》,掌握常用的数据分析方法。

6、懂得业务知识,行业知识

  从事数据分析工作的前提就会需要懂业务,即熟悉行业知识、公司业务及流程,最好有自己独到的见解。

相关:大数据分析学习的详细解读

https://www.toutiao.com/i6616593013986558471/

心media运营
「心media运营 」发表看法
2023-07-10

随着大数据技术在各行各业应用的越来越广,数据驱动智能产品和精细化运营已经成为企业经营的制胜法宝。数据分析对于新媒体行业更是指南针般的存在,指引着运营的正确方向,这是每个新媒体人不得不熟练掌握的一项技能。

什么是数据分析?

广义上讲,数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。

对于新媒体运营而言,就是指我们发布内容之后,监测和统计用户对所发布内容实施的一系列行为。

数据分析有多重要?

于公司而言,数据分析师的作用主要是支持和指导项目的发展,合格的数据分析师支持项目的发展,优秀的数据分析师指导项目的发展。

数据分析师,是数据分析行业的起点。有的公司会依照自身所处行业的特点,赋予分析师更为细分的岗位名称,例如运营分析师、财务数据分析师、业务分析师和数据库分析师等。

除了所处的行业不同、业务项目不同,对于技术而言是万变不离其宗,所有数据分析师的最重要的职能就是针对业务项目或者运营的问题或需求,去获取、研究、分析数据,并整合数据分析结果,帮助公司做出正确的判断和决策。

对于新媒体运营人来说,数据分析更是必不可少的,这也是一个刚入行几个月的运营专员和一个有多年经验的新媒体运营师的区别所在。

对于公司来说,有效地数据分析可以更优质地了解运营的质量,预测运营的方向、控制运营的成本以及评估影响方案,这四个方面刚好就是新媒体运营数据分析的宗旨所在。

如何进行数据分析?

对于新媒体人而言,首先要分析最直接的基础数据包括文章或者视频的阅读量、点赞量、评论量、转发量、投币量、粉丝量,这些数据是管理员和读者都能看到的。

其次在创作者后台还要查看转化率、推荐量、页面停留时长、阅读完成率等等,给运营人员一个直观的正向反馈,保证自己的运营方向不会走偏,了解什么样的内容,适用于什么样的人群,适合在什么平台发布,几时发布获得的平台推荐量最大。

最后也要研究页面广告点击次数、付费人数、用户肖像分析等数据。

拿微信公众号举例来说,账号的定位,也就是你的账号到底是做什么内容的,在什么细分领域。目标受众的特点,真正阅读者的肖像分析,包括性别、年龄、地区、来源、所使用设备的类型,以及粉丝量增长以及减少的原因等,如下图。

如果各位小伙伴还有什么不懂的欢迎私信我哦。

帆软软件
「帆软软件 」发表看法
2023-07-05

从文科的超级菜鸟一路摸爬滚打,到独揽市场部的数据分析。我学习分为两块:学习数据分析知识、学习数据分析技能。

【数据分析知识-入门进阶高阶】一、入门必看,不需要会编程系列

1、《深入浅出数据分析》

数据分析入门第一本。通俗简单,能够让你对数据分析的相关概念有大致的了解。这本书蕴含的思想逻辑和分析原则,要好好体会,会对你以后的学习有很大的帮助。

2、《深入浅出统计学》

号称“文科生也能看懂”的统计书。阅读起来相当容易,一口气就能看完。这本书所讲的知识在数据分析中都是常见且必须掌握的,比如基本的统计量,基本上每个分析项目中都会用到;比如基本的概率分布,总体与样本的概念、置信区间、假设检验、回归分析,都是关于数据分析的统计学知识。

“HeadFirst类的书籍,一向浅显易懂形象生动,可以对分析概念有个全面的认知。”

3、《赤裸裸的统计学》

这本书是结合生活讲解统计知识,生动有趣。从作者自身的生活经历讲述他与统计学的故事。处处见得统计学在生活中的智慧。

“可以避免统计学一上来就大讲贝叶斯概率和随机分析的枯燥。”二、进阶:数据变多,不学编程搞不定系列数据分析领域的三把数据库利器:R语言、Python、SQL

1、《R语言实战》

如果要用R语言做数据分析,建议读完《深入浅出数据分析》之后,就开始读这本。从工具的安装,到具体分析方法在R语言中的实现,讲解详细,可操作性极强,是一本非常值得读的数据分析书。

2、《利用Python进行数据分析》

最经典的数据分析书之一,其中梳理介绍的pandas、Numpy、matplotlib 等库,应对一般的数据分析,完全足够。

3、《MySQL必知必会》

企业的数据,多是以数据库的形式存储起来的,那么如果你要去调用你想要的那部分数据,SQL就是必须的技能。MySQL本身比较简单,对于数据分析师来说,只需要掌握基本的语句和技巧,能够进行基本的数据提取和处理就能够应对一般的数据分析需求了。

三、高阶:数据思维高度训练系列

1、《精益数据分析》

“此书优势在于将企业分成了几个大的行业类别,并分门别类的讲解了每个行业的商业模式特点及分析技巧,对使用者的分析能力要求较高,且必须具备相应的业务知识。”

书中并没有讲到具体的数据分析技术,主要分析了各种产品中用到的指标、模型和“数据驱动型产品”的一些思路。

2、《数据科学实战》

“对于做了一段时间数据分析工作的人,这无疑是进阶更高维度的好书,很难有一本书,能够让你从简单的数据分析平滑地过渡到机器学习和数据挖掘,这本书我认为是这方面做的最好的一本。”

这本书是数据分析和机器学习之间的桥梁。从探索性的数据分析,引出了机器学习的基本算法:回归分析、k近邻、k均值,并介绍了不同应用场景中最常见的机器学习算法。

3、《决战大数据》

阿里巴巴前数据副总裁车品觉所著,讲解了阿里巴巴在企业内部治理数据过程中的心得,所讲“存-通-用”数据管理三板斧和“从数据化运营到运营数据”,字字珠玑,可堪借鉴。

【数据分析技能-搜集分析可视化】一、数据搜集

1、表单搜集:由于我是社会学出身,为了快速分发问卷收集数据,迄今为止用过3个表单工具,简道云、金数据、问卷星。问卷星在学生时代发问卷用过,个人不推荐;简道云和金数据都比较推荐,尤其简道云是今年开始接触,因为我个人很喜欢它的操作界面,后续的图表制作以及数据关联性较强,用的次数是最多的。

2、数据爬取:超级菜鸟还不至于到这一阶段。再加上这方面我了解不多,就不班门弄斧了。有意者可以参考这篇回答:如何入门 Python 爬虫?

二、数据分析与可视化

1、配色学习:好的可视化是一份数据分析报告的点睛之笔。数据可视化主要通过编程和非编程类工具进行实现,在学习工具之前,需要先对配色设计有基础的审美认知。

图表设计教程:Excel图表图形

图表配色参考地址:图表配色

2、数据分析软件

excel:

入门数据分析师都绕不开excel的魔掌。基础公式与常用函数、高级函数、VBA、SmartArt图形、数据透视表、交互图表、宏开发……

excel教程不要太多,如何快速学习excel,我之前也回答过,反正就是逮住一本教程,照着练:

图表制作上,可以使用一些excel插件,拯救配色:Data Chart、EasyCharts

专业报表软件:

不得不说,使用专业级的报表软件,才能让你的数据会“说话”。国外有tableau、Power BI,国内有Finereport、FineBI。这几个都不错,但鉴于我爱国,我更推荐国产的Finereport。但需要注意的是,这类专业软件,学习难度对超级菜鸟来说较高,适合入门后攻克。

以上。

宋运奎
「宋运奎 」发表看法
2023-07-09

作为一名IT数据人来回答下:

零基础如何做数据分析?

个人觉得 分三块来学习来努力吧:

一是 学一些数据分析的基础方法,基础知识,比如统计基础统计理论,数据分析方法如对比,Pest,杜邦分析等。

第二 一些数据分析的工具(器)如:word家族(excel,ppt,word),Sql,后期可以学一些专门的分析工具Spss。

第三 也是比较重要的就是业务知识,行业知识。

最后推荐一本数据分析行业比较好的书:陈哲老师的新书《活用数据》。

IT技术管理那些事儿
「IT技术管理那些事儿 」发表看法
2023-07-01

我是一枚做过产品运营,策划,数据分析,数据挖掘,大数据,在IT行业浸淫多年的最老的80后。

之前在刚毕业加入互联网这行的时候,也很焦虑也很着急,那会儿特别想做互联网产品序列的工作,但是脑袋里一片浆糊,不知道从何入手。

我先说说我的经历,然后再顺着我的经历讲数据分析这块的学习和提升的方法论,避免大家少走弯路,能用正确的方法快速成长。

我刚毕业那会儿是03年,面了很多网络游戏公司,因为从小特别热爱游戏,也面了很多IT公司,因为那会儿互联网刚起步没多久是一个风口,自己也挺喜欢,最终还是选择了游戏行业,因为还是遵循内心最真实的想法,选择自己热爱的领域作为未来的事业,这个选择一直到现在我都觉得很正确。

03年那会开始以管理培训生的身份到北京的一家知名游戏公司实习,机缘巧合,被选拔到了上海分公司做产品运营,负责一个moba+rpg项目的商业化和产品调优模块,刚去那会儿哪儿会这些专业的东西啊,去的时候甚至连封闭测试的目的都不知道,后来也是一个个问在工作中打磨出了方法论。说实话当时负责的是商业化和产品调优模块,如果你没有数据,你怎么去给研发提调优建议,怎么去设计商业化活动,如果商业化活动有问题你连调整的依据都没有,所以从那儿开始就开始接触数据分析的工作。

最开始的时候,我们内部对于用户流失的指标定义有很大的歧义,但是如果这个指标不确定下来,我们接下来的分析的结论会出现很大的偏差,最终会影响我们的调优决策,从而影响最终的业务,当时因为年轻也没有考虑太多就按照公司统一标准来,但现在转过头发现,真的很坑,当年的很多结论都是不对的,严重影响了大家的决策和判断。这里提到第一个点,叫做:业务数据指标的定义。这个东西至关重要!!!

当我们有了业务指标的定义的时候,需要去确定很多东西,比如说观测数据的维度,统计的周期等,比如拿一个最简单的流失分析来说,可能我的分析思路是抽丝剥茧,从大到小,逐项缩小范围的分析方式,那么具体分析的时候怎么分析呢?很多人都知道是看流失时的等级,如果等级看不出具体问题,还得到任务,如果任务还看不出来要到具体的客户端点击,当然这些都只是常规的操作,甚至如果有足够的经验和积累,不用做分析都大概知道哪里有问题,我们需要的分析不仅仅只局限于此,而是要更加的深入,深入的玩家背后的动机。这里提到第二个点,叫做:数据观测的维度,和统计的周期。这个东西同样直观重要!!!

在上海做了一年的产品运营之后,后续我调回北京总部,担任数据分析师,我是从普通数据分析师一步步走上管理岗位的,现在是公司业务数据部门的负责人,当然在15-19年这四年的过程中,对于产品设计,产品运营,数据分析,机器学习等相关领域均有比较深度的涉猎,所以在数据驱动业务这个事务上还算处理得比较得心应手,也推动了公司往“数据驱动”和“精细化运营”的方向发展,公司在这块的投入也逐步加大。

在这里,对于新人而言,我不会只推荐一些没啥卵用的书籍给你,比如《深入浅出数据分析》,这种书一点用都没有,我会给你推荐有用的书籍和实用的学习方法,看不好的书,看无用的书,往往感动了自己,却感动不了他人(你的上司和合作伙伴),你的能力并没有得到提升。

对于数据分析的小白而言,对于我现在培养的应届生而言,我有如下几个要求:

第一,技术需要过硬:

1)sql语句,你必须要给我学精通了,增删改查,以及存储过程你都需要样样精通,这块的话,给大家推荐一个学习地址,如果大家感兴趣或者有问题可以私信我要我之前整理学习文档资料

2)python,python的学习是为了让你后续处理繁杂庞大的数据集时更高效更方便更快速,以及后续有很多机器学习也好,或者深度学习也好的应用项目你能上手。

第二,掌握或精通一部分常用的数学原理:

1)基本数学原理,统计相关的原理,比如平均值,方差,标准差,导数,反函数,拉格朗日等等,这里大家可以去csdn也好或者淘宝也好买一本相关的书籍就够用。

2)机器学习算法原理:回归算法,分类算法,聚类算法等等,比如最简单的分类算法:决策树,他的数学原理你真的掌握吗?信息熵和条件熵是啥意思,怎么计算的知道么?如果你只能调包,那么解决简单的问题ok,涉及到很多复杂的情形,比如样本不均衡,比如特征过少时,你就无从下手。这块的话,推荐大家多去逛逛csdn这个论坛,很有用,能学到不少东西。

3)动手做一些虚拟案例,或者参与组里同事的一些项目,比如一个游戏内广告聊天拉人识别的项目,其本质是通过分类算法达成文本识别,这块涉及到的知识点可能有:文本处理,分类算法应用等,这块可以多去github上转转,有一些也许是已经运营过的案例能够给你启发的。

第三,不断加强自己对产品的感知力:

1)如果是游戏行业的:

多玩不同品类的产品,每个品类选择1-2款精品深度体验,注意是深度体验,而非浅尝辄止随着版本迭代深入体验,并且需要思考每一次的版本迭代和周更新的原因,反推业务需要解决什么问题带着问题去玩游戏,边玩边记录自己的感受,有经济能力就充点小钱,后续商业化分析部分会用得着做个有心人,记得多游戏横向之间做对比不要看gamelook等媒体上的测评稿,那些大多数是枪稿,要自己去体验,用心去体验,不要人云亦云多跟制作人层面的人交流宏观的设计理念(如果有机会的话),多跟数值策划学习数值规划的流程(职业,属性,战斗公式,属性配比放出,商品定价,游戏内经济流转设计等),多跟系统策划学习系统架构的知识(做一个系统目的是啥,是为了解决什么问题?),多跟产品运营学习运营知识(比如商业化设计,活动设计等等),多跟市场发行的同学学习相关知识(营销方法论,买量等),还有很多,不一而足...这里推荐几个有用的资讯门户或者app:腾讯GAD,游资网,机核网另外推荐一本书:《游戏设计的艺术》,这本书能带你进入一个前所未有的世界,并且从入门到精通都可以随手翻的工具书,注意是“设计的艺术”,而非“分析的艺术”

2)传统互联网(非游戏):

多体验互联网产品,要多而广,因为互联网产品跟游戏产品还不一样,他的体验成本(时间和精力)比具体游戏产品小很多,所以尽可能多而广,我现在仍然保持着每周至少体验5个新互联网产品的习惯,比如社交类的,可以多体验体验陌生人社交的,熟人社交的,多思考产品之间有什么共性和不同点带着问题去体验产品,主要反推产品做成这样有什么好,有什么不好,产品主要为了解决什么问题,他的业务目标有可能是什么样经常跟圈内人去探讨和交流,跟游戏不一样的是,互联网有很多的沙龙,可以多参加这种沙龙,但是不要杂而广,要专而精,现在有很多的沙龙就是为了做而做,为了感动自己而做,这种没有必要参加时刻关注竞品,比如你是社交产品公司的,那么微信也好,陌陌也好,每一次版本迭代,你都需要去思考他为了解决什么问题,然后结合具体的内容去评估他的目的是否达到。这里推荐1个能获取到较新互联网资讯的app:36kr,用这个基本上就足够了第四,多做数据积累,多思考,多提问:

我们在做具体的数据分析的时候,有时候需要快速响应业务,有时候通过传统分析方法很难找到问题点,这个时候积累就至关重要,游戏行业的产品决策,40%依靠数据,30%依靠用户反馈,还有30%依靠经验,这个经验就是积累。

积累是什么?积累是过往的产品调整,活动设计,跟数据之间的关系,我们只有在每一项工作都认真严谨对待的基础上,这个积累工作才能做好,这样你的产品和数据敏锐度会越来越高,后续你可以跨界成为产品专家。

第五,给自己的定位不光是数据分析师,而是半个产品或运营负责人

我们有很多的数据分析师,一直都处于很被动的状态,业务提什么需求你照做,久而久之就变成一个机械式地接需求完成需求的人员,毫无存在感。怎么改变这个现状呢?第一是要多做积累就如同上述第四点所说,这块急不得需要时间,第二是需要主动,把自己当作半个产品或运营负责人来对待,这样面对日常数据的时候,你会主动去完善日常监控指标,你会每日去盯着数据的异常和变化,你会根据这些异常和变化往下去进行深度的挖掘,或者数据没有异常时,按照经验这个阶段该做什么分析了,赶紧做,发现了问题或者潜在风险赶紧跟业务聊解决方案,这样才能将数据分析师的价值发挥到最大

以上五点,我认为是针对小白学习数据分析必备的方法和心理建设,职业道路漫漫,希望各位一切顺利,这是我第一次发这么长的回复,还希望各位支持,后续我会陆陆续续开通个人专栏和订阅号,争取多跟大家分享数据分析,数据挖掘,机器学习应用的一些案例,大家一起提升。

如有问题,随时私信我。谢谢大家。

欢迎发表您的看法