今天来简单写一下我是如何自学编程的。
自从大半年前写了文章《从英语翻译到人工智能:我如何用两年时间跨界转行》后,我就不断地收到关于自学编程的问题。这个周末终于有点清闲,就找机会把这篇经验总结写出来了。
1. 起步阶段:选择第一门语言
2018 年初,在我决定要从纯语言学转方向到计算机语言学之后,我就开始了自学基础编程。之前有不少读者误会我是在学校转了专业,其实不是,一是因为我们学校没有计算机语言学,二是德国大学普遍不能转专业。所以我只是在课余自学而已。
看了一些前辈的科普后,我选择了先从 Python 开始。因为我以前在 Coursera 上过网课,体验很不错,所以那时也照例先在 Coursera 上找到了一门 Python 入门课。
我选择的第一门编程课是密歇根大学推出的《Python for everyone - learn to program and analyze data with Python》——相信很多自学编程的人都曾上过这一门相当热门的编程系列课。
16 年上半年四五个月的时间里,每个周末我都拿出几小时花在密大这一系列共 5 个模块的课上。因为我对于新知识向来入门慢,结束这系列课所花时间确实不少,但我最终还是完成了所有课程内容和作业,也算是一只脚跨进了编程的大门。
现在回头看,密大这个系列的编程课最大优势在于教授讲得非常浅显易懂,Python 的基础知识点都一一讲过;但是,整体课程实在有些浅,很多计算机科学的基础知识都略过了,编程作业也太少太浅,导致单纯按这个课程走下来的学生必定练习严重不足。编程知识与技能的积累相辅相成,两者都需要用大量练习形成肌肉记忆,才能真正走到应用这一步。
当时 Coursera 上的课程还普遍免费,只有最后的 certificate 需要付费。我并不迫切需要 certificate,就利用 Coursera 当时的政策报名了好几个与计算机科学或数据科学有关的课程。除了密大的 Python 入门课之外,我还上完了杜克大学的《Mastering Data Analysis in Excel》。这个课则比我预想得讲得深不少,一方面帮我拾回了不少数学基础,另一方面我也无意中学到了一些数据科学(Data Science)的基础概念和方法,例如很是有用的二分类(binary classification)、混淆矩阵(confusion matrix)、熵(entropy)和互信息(mutual information)等。我认为,如果你大学没修过任何高数类课时,想要转行进入数据科学或软件工程的话,那至少杜克大学这门课里面的所有基础概念都应该认真掌握。
2. 进阶阶段:夯实计算机科学基础
接下来 18 年的暑假,我申请到了去图宾根大学计算机语言学系实习的机会。在那儿,我第一次接触到了学术界关注的几大自然语言处理主题,比如分词、句法分析、情感分析等等,NLP 于我不再只是一个空中楼阁般的虚称。
同时,在我的积极争取下,mentor 给了我一个简单的编程任务,但需要用 Java 来实现。Java 基础完全为零的我在两周内通过自学挣扎着写完了一个短程序,完成了任务!
那时快速记下的种种 Java 语法细节,自然是过后全被我忘了,但这个经历让我初步认识到不同编程语言之间范式的不同,也让我了解到编程在现实中的应用形式,同时还大大锻炼了我通过谷歌和 stack overflow 在纷杂的互联网世界里快速寻找有用信息的能力……
暑假结束,我回到学校继续上课。一天我在翻李笑来多年前的旧博客时,看到他推荐过 MIT 6.00 (2008 fall) Introduction to Computer Science and Programming 这门网课。后来我才发现这是门相当有名的经典计算机科学入门课,欧美很多自学计算机科学转行编程的前辈都学过并推荐这门课。于是我在课余也开始踏上了自学这门网课的'漫漫之路'。
不夸张地说,我认为从我开始上这门课的那一天起,我才真正入门了计算机科学(Computer Science)。以前只是入门了初级编程而已,其实根本还没碰到 CS 的门边儿——CS 之于 coding,就好比'懂得出海捕鱼之于只会去鱼市买鱼'一样,其实完全不能等同于一回事。
MIT 6.00 这门课很难,我直到 2019 年暑假才把所有课程视频看完、课后阅读读完、编程作业和考试写完。但这门课的两位教授(Eric Grimson & John Guttag)是我在网上见过的讲 CS 讲得最好的老师之二,跟着这两位教授的指引,我加深了对 Python 的理解,了解了几种基础算法的实现,学习了数据科学基础和机器学习,知道了测试的重要性,认识了几种常见编程范式,还了解了 CS 在工业中的具体应用。
很多初学编程的人,已经跟着一门像密大 Python for Everyone 那样的课程规规矩矩学完了 Python 的所有语法,但若抛给他一个实际问题、问他如何用 Python 实现,他就立马傻眼了。这些只学会了表层语法的人,都需要认真研究一门像 MIT 6.00 这样真正的计算机科学入门课,来提高对编程的理解与真正写程序的能力。
MIT 6.00 这门课也让我深刻认识到优秀的老师究竟有多么重要。天下老师手里的课本都相差无几,但大部分老师只是在做'努力把课本中的表层知识搬运到学生的耳边'这样的事,只有少数优秀的老师才真正理解一个知识点的内涵与外延、一群知识点之间的联系、不同学生的困惑之处,以及如何画龙点睛般化解学生的疑问。
秉承着这个'尽量只上好老师的课'的标准,在学完 MIT 6.00 后我又找到了另一门'名师课':Peter Norvig 在 Udacity 上开设的免费课程《Design of Computer Programs》。
In case you don't know Peter:Peter Norvig 是现任谷歌科研主管,USC 副教授,曾任 NASA 科研主管,出版过 CS 课本。Norvig 曾写过一篇名为《Teach Yourself Programming in Ten Years》的著名文章,欧美程序员几乎无人不知无人不晓。


