前言
想动手写写自己的经历,希望对更多像我一样想转行自学的年轻人有所帮助和鼓励。
1. 为什么想换工作
我的大概情况是,本科专业建筑环境与设备工程,2016 年 7 月毕业。同学很多去了工地,我受不了工地居无定所,选择了制造业。 制造业环境确实一般,虽然岗位是研发工程师,但经常要在车间干体力活,累得满头大汗,还要处理复杂的人际关系。无论是自然环境还是人文环境,只能用恶劣来形容。而且我们是单休,动不动就加班,最不合理的是加班没有加班费。节假日一般放一天,国企两天,周日值班一天给 32 块钱。 看到办公室里面三十几岁的男生还没有女朋友,有的即使有女朋友的还在住员工宿舍,快十年的工作经验还出国待过,现在月薪不到 1w。想到七八年后我的生活是这样,我就惶恐不安,觉得不能过这样的生活。 于是决心转行,瞄准 IT 行业。理由很简单:从业环境好,工作内容没有体力活(相对于体力劳动,更喜欢脑力劳动),相同的努力下,钱比制造业多,而且现在各个行业都与互联网相关。
2. 如何提前准备
从去年 11 月开始自学数据分析的一些课程。当时由于没有计算机基础,走了不少弯路,看了一些教程,东拼西凑,感觉乱七八糟。 甚至有一段时间,不断怀疑自己,放弃大学四年的知识,不做传统行业的研发,转身去接触一个新的东西是不是对的? 那段时间,认识了一些数据分析岗位的在职者,年龄不大。有个同学建议我先做 Python 开发,再做数据分析(因为他说数据分析如何如何难,机器学习算法都是大牛玩儿的)。当时犹豫了很久,还自学了 Django 教程、前端知识、HTTP 协议,去熟悉 Linux。准备去找 Python 开发的职位(其实对软件开发不感冒)。 后来,看了两本关于转行的书,至今对我很有启发。 第一本书《转行》说了以下重点:
- 寻找一个导师:导师可以降低你加入一个新行业的成本,帮助你熟悉环境和行业规则,也会鼓励完成心理方面的转变。
- 建立新的社交网络:过去的人脉关系会阻碍你的转行,因为他们是以过去对你的认知来评价你。新领域的人脉,会给你提供各种各样新的机会和情感支持,帮助你融入。
第二本书《职场人终身学习心法》归纳下: 首先,如果想系统地学习,那就建议选择系统的渠道。既然在这个领域你是新手,就不要指望自己能把散落的信息整合成系统了,那是高手要做的事情。要想系统地学习,那就踏踏实实地拿出几个月的时间来,看 5 本这个领域的经典书,选一门系统课,或者跟着一个系统学习过的老师把这个领域的骨架摸清楚。你又不比别人聪明几倍,却想用几分之一的时间,就掌握人家花了好长时间下了硬功夫,系统掌握的知识,怎么可能呢?先接受一个已经存在的系统,再在上面修修改改,对于新手是最适合的方案。
用 3 句话来总结一下上面两篇文章:
- 转行最好有人带、有人指导。
- 去认识做大数据这块的人,否则身边的人脉关系会不断否定你,打击你(以及要说服家人支持你折腾)。
- 系统学习,要几个月,不要贪多,要扎扎实实看书。
这样一看,我就明白多了,并且知道该怎么做了。 第一的话,我想转行做数据分析这块的,过去的背景与此相差太远。现在的话,只有坚持终身学习,系统学习,要看书,好好啃。 当然,上面的建议是建立在你下决心要转行的基础上。先问问自己下面几个问题:
- 喜欢不喜欢转行后的工作?评估自己转行的优势与劣势?问问自己为什么不待在现在的行业了?自己是不是有很强的自我驱动力?自己是不是能保持终身学习?自己搜集信息和整合信息的能力是不是很强?自己是不是不怕失败?转行失败了,拿什么保底?
- 把这些令人焦虑和令人害怕的事情考虑清楚,再去做决定,要不要转行。这些问题想清楚了,就清除了学习道路上的精神障碍。
- 学习的那段时间,基本上每天学习 3-5 小时。每周平均 30 小时左右。加上在办公室没有事情的情况下,利用电脑看看东西,用笔记软件记录。
- 这几个月,先后看了《Python 核心编程》《利用 Python 进行数据分析》《R 语言实战》,还看了 SQL 的一些教程,以及一些数据分析师需要的思维。最后面试的时候,掌握的技能包括 SQL、Python、R。会一点简单的爬虫,懂点 Linux。
- 但是每一个都掌握的很浅,书只看了一半。像一些复杂的算法,还不能深入的理解。
技术准备详解
为了弥补基础薄弱的问题,我制定了详细的技术学习路线,并配合代码实践。
1. 环境搭建 推荐使用 Anaconda 发行版,它预装了 Python 和常用的科学计算库,避免了配置环境的繁琐。
# 创建虚拟环境
conda create -n data_analysis python=3.8
conda activate data_analysis
# 安装常用库
pip install pandas numpy matplotlib seaborn scikit-learn
2. 核心库学习 数据分析的核心在于数据处理和可视化。
- Pandas: 用于数据清洗和分析,类似 Excel 的高级版。


