| 雷峰网
5
本文作者: 金红 | 2016-09-08 23:00 |
雷锋网按:本文作者YY硕,来自大疆工程师。原文标题《机器人工程师学习计划》,全文篇幅较长,为了方便阅读,故分为三篇,此为上篇。
很多朋友私信问我对机器人和人工智能感兴趣,该怎么展开学习。最近稍微有点空,我写写我的看法。
两年前,我在知乎回答如何定义「机器人」?的问题中试图给机器人做出一个比较仔细的定义,我觉得机器人和人工智能最大的区别在于是否要和物理世界进行交互。今年初在另一篇知乎“机器人或人工智能的研究会帮助我们更好的了解人类自己吗?”回答中,我说到传感器是和物理世界交互的基础。后来,我又在知乎“有哪些与控制、机器人等相关的 quotes?”的回答中提到莫拉维克悖论(Moravec's paradox),谈到了机器人学里公认的难题是在物理世界中实现类人的活动能力。
把之前的回答再翻出来是为了支持以下观点:机器人学的核心问题是做好和物理世界的交互。现在主流的机器人学分支里,处理与物理世界的交互的学科分为三类:传感器和处理算法(激光雷达,多目视觉,融合算法);多刚体系统动力学控制(工业机器人动力学控制和接触力控制);机器人自主移动(locomotion不知道该怎么翻译,轮式、足式、飞行等移动机器人的研究)。我建议对机器人学有兴趣的同学着重在这几个问题上面。
另外,根据世界第一的机器人教育机构卡耐基梅隆大学的机器人学博士的课程分类方式(http://www.ri.cmu.edu/education/COSAug2016.pdf),机器人学有四个核心领域:
感知。视觉传感器、图像传感器、触觉和力传感器、惯导等。
认知。人工智能、知识表达、规划、任务调度、机器学习等。
行为。运动学、动力学、控制、manipulation和locomotion等。
数学基础。最优估计、微分几何、计算几何、运筹学等。
结合卡耐基梅隆大学的核心课程要求,我觉得我定义的机器人学核心问题算是基本没跑偏的。本文后面谈到的机器人项目都是以上述观点和课程要求为基础。
一些可能有争议性的观点:
1. 机器人学是富人的活动。虽然工业越来越发达,但好的开发板和电机还是非常贵。如果要下定决心学习机器人学并且做出实物,你必须找到做实物出来的资金。要么是自己花钱,要么就得找学校的机器人社团,或者找什么愿意资助年轻人学习的贵人。另外现在没有任何一本完整的书可以教你怎么造一个四旋翼空中机器人或者大狗机器人,你需要参考十几本不同的教科书,这些书不管中文版还是英文版都很贵。
2. 机器人学是屠龙之术。这话是Ninebot创始人说的。虽然最近几年,平衡车、扫地机器人、多旋翼飞行器让机器人学开始进入人们的生活,但是可行的商业应用还是很少,而且已有的机器人和理论都还很难解决好与物理世界交互这件事情。所以一定要确保自己在机器人学这个道路上同时练好了能去其他行当吃饭的技能,比如编程、机械设计和硬件设计。也要做好心理准备,接受自己有可能在学会屠龙之术以后几年都造不出对社会有用的东西的事实。
3. 基于上述所说的观点,如果是已经工作之后才想要学习机器人的话,可能已经太迟了,因为很可能兴趣战胜不了客观限制因素。如果作为兴趣去学习,只能学到做巡线小车和舵机机械臂什么的,可能也满足不了中二病的创造欲。
个人认为机器人学是一个艰苦的道路,想要成为一个独挡一面的机器人工程师需要多年理论和实践的同步训练。理论学习和动手实践的过程还要互相排好时间表,在做某个实践项目的同时去学习最相关理论往往可以达到事半功倍的效果,但是同时那些不太相关的理论会看起来非常枯燥,因此如何妥善安排自己的实践项目也是很重要的事情。
这篇文章里我计划介绍一个电子工程、机械工程和计算机专业学生从大学一年级到研究生二年级的机器人学习计划,基本是我对自己过去学习方式的一个总结。按照这个方法来学习,能够成为一个能力全面,但是稍微偏软件一点的机器人工程师。这个六年的学习计划,估算下来,全年中每天在上课和完成课程要求之外要投入学习时间6-8个小时,这些时间一方面用于阅读课程知识的英文教材,一方面用于阅读其他学科的教材,一方面用于实践项目。
机器人工程师在大型项目里的定位类似于飞机系统里的总体设计师。和机械工程师、硬件工程师、软件工程师、算法工程师、控制工程师比起来,机器人工程师参与某个具体技术的时间较少,但是能够听得懂所有工程师说的话,能够作为不同模块间的协调人,带领整个团队去攻坚。当然如果机器人工程师能够在一个领域达到那个领域的工程师的优秀水平,肯定更好。
由于时间仓促,再加上个人水平有限,文章中如有纰漏和错误,恭请读者指出,谢谢。如果同学还有什么想知道的内容和教材,也欢迎留言交流。
刚上大一,你的机器人生涯开始了。先看看学校的校园网能不能翻墙,不能的话自己去买个一年一百多块钱的VPN,先确保自己能上Google,不要心疼VPN的钱,这能让你在之后的职业生涯里节省上万块钱。然后去注册一个gmail账号,再注册stackoverflow账号,再注册github的账号,再注册CSDN账号,注册完登录上去逛逛,暂时先不要问为什么。
英语水平一定程度上会是机器人工程师水平的限制因素,英语是同学们在大学最该努力学的一门课,而且不止要把它当成课,要当成一种技能,当成生活的一部分。当你开始努力学习一些高级的机器人知识以后,有可能会非常难以找到中文的参考资料,这个时候如果啃不下英文的资料,进步速度和眼界就会受到很大影响。因此大一的时候要多看看红宝书,看看美剧。
不管是什么专业背景的同学,大学一年级一定要上好的课是微积分和线性代数。线性代数的重要性需要特别强调。一般来说,优秀的工程师和科学家在职业生涯中要学至少五次线性代数,大一学一遍、学凸优化的时候学一遍、学线性系统的时候学一遍、学机器学习的时候学一遍……如果在第一遍学的时候就看到对的书,刷到对的题,那么以后的学习会轻松很多。
网上有很多对于如何学好线性代数的讨论,比如知乎问题如何理解线性代数?。Matrix67大神的文章随记:我们需要怎样的数学教育?也很有启发。我个人对学习线性代数的建议是两本书,一本叫做《Linear Algebra Done Right》,另一本叫做《Linear Algebra Done Wrong》,我比较喜欢的是Done Wrong这本书,第一它是免费的,第二只需要读前6章两百页就够了,第三它页边距很大,打印出来有很多空白做练习题。另外一个较好的教材是麻省理工公开课:线性代数。不论如何,学线性代数一定要用国外的教材,千万不要用国内的教材。啃英文书很累,但是考虑到之后还要啃更多的英文书,线性代数已经算是很入门的了,一定要啃下来,同时还要刷足够多的课后题。
学完线性代数以后,一个自然而然的问题就是怎么能用计算机自己去计算矩阵的乘法、向量的乘法、向量的内积。因此引入了编程的学习。
不管同学的专业是什么,一定要在大学一年级尽早开始学编程。至于用哪种语言开始学习编程,我推荐Python,比较好的教材是麻省理工学院公开课:计算机科学及编程导论,比较好的Python开发学习环境是Anacoda 。熟悉Python以后,同学就可以开始玩玩Python的数值计算包Numpy,这个时候线性代数题基本上也刷的差不多,可以通过Numpy帮助自己解决线性代数问题了。
对任何人来说,Python是一把瑞士军刀,你可以用他干很多东西,比如自动回复邮件、自动收集信息。但是真要去造机器人,合适的工具并不是瑞士军刀,而是C/C++这样简单粗暴的锤子和螺丝刀般的工具。在学习Python学到一定程度的时候(比如你听说有一种叫做cython的东西),最好开始学习C,而且要强迫自己练习用C的一维数组和指针来实现矩阵的加法、乘法、求逆等操作。之所以有高级的Python或者Java(不要问我Java哪里高级了)这些语言以后我们还需要去学C,是因为机器人上常用的不是完整的电脑,而是计算量有局限的嵌入式系统,嵌入式系统开发基本只能用C或者更低级的语言。
学习C我个人入门用的是清华大学出版的《C++语言程序设计》。虽然这个书标题是C++,但其实没什么太大问题。不过国内的C语言教材都有个巨大的问题是不引导学生去用Linux。近年来更好的一个教材是http://songjinshan.com/akabook/zh/index.html,这个网站的教材非常好,因为他教育学生用Linux环境作为程序编译的环境,而且还引入了一些计算机体系结构的介绍。
IT行业的程序员都会争论高级语言和低级语言哪个好,Linux和Windows哪个好,而对于机器人工程师来说,从现在到可预见的未来里,C是最好的语言,Linux是最好的操作系统,这都毋庸置疑。甚至对于Linux的发行版该选哪个,我们都是很少有质疑的:Ubuntu(The leading OS for PC, tablet, phone and cloud)。原因是机器人操作系统ROS(ROS.org | Powering the world's robots)是基于Ubuntu开发的,因此在Ubuntu上运行最稳定。注意Ubuntu出了一个中文版叫做Kylin,个人感觉比较坑,建议大家不要装中文版。Ubuntu 作为一个开源操作系统,总是在快速迭代,2016年8月比较稳定的版本是14.04和16.04,建议同学安装14.04。
当你把C学得差不多,开始要学写包含多个头文件的程序时,一定要同时学习makefile的知识。这时候要上网去搜“Makefile详解”(Makefile详解(超级好)_mingw吧)这篇文章看。
我自己在大学一年级的时候还学习了HTML和Javascript,到大一结束的时候已经能够熟练用Javascript手写一些动态页面。我个人觉得HTML和Javascript也是机器人工程师必备的技术,而不只是软件工程师的玩具。这是因为web技术实际上已经渗透到了编程的方方面面,比如json开始是Javascript里的一种object定义的方式,但现在已经成为了一种很标准的数据交互、参数配置的格式。另外AJAX能够帮助初学者理解一定的网络技术原理,而网络技术也是机器人工程师必备的技能。再者,制作GUI(图形用户界面)是常规debug的办法,而近年来一个流行的趋势是用webkit嵌入程序用HTML和Javascript作为图形界面的后端,而在机器人操作系统ROS(ROS.org | Powering the world's robots)里,通过rosbridge可以非常方便地把机器人程序的数据传递到websocket上,这句话看不懂没关系,反正你知道学学HTML和Javascript很重要就是了。更重要的是,HTML文档背后的DOM (Document Object Model)深刻地体现了面向对象的思想。大学中的面向对象程序设计一般都讲C++,在我看来应该讲HTML和Javascript。这一点不细说了,如果同学们去学习HTML和Javascript,自然会体会到。学习HTML和Javascript比较好的资料是http://www.w3schools.com/,把网站左侧的“Learn HTML”、“Learn CSS”、“Learn Javascript”和“Learn JQuery”学完就行,别的部分还有很多花哨的技术,没有必要去学了。为了培养自己对Javascript的兴趣,可以上three.js / examples跪着看看热闹。
以上介绍的这些知识点、书和资料应该在大一期间就全部看完,然后利用大一的暑假好好巩固这些知识。比如开始用HTML和Javascript做一个自己的个人主页,刷一刷编程的题目,学用Python的奇技淫巧(比方说做一个自己的个人主页)。另外还可以抽时间学学数学知识,比如开始看看代数和离散数学。我大一的时候看到了两篇文章,认识到了数学的重要性,一篇是MIT的CV大牛林达华写的[转]MIT牛人解说数学体系,另一篇是前Goolge研究员吴军博士写的《数学之美》。当时林达华还在MIT读博士,而《数学之美》还没有成书。两篇文章看完以后我感觉自己整个人对数学的认识上了一个新的层次,此后一直在注意提高自己的数学水平,几年下来觉得收益很大。在之后的介绍里我还会多次强调需要学的数学知识和对应的教材。
上大二的时候,你已经会了基本的编程知识和基本的数学知识。大二这一年应该投入在嵌入式系统的学习中,同时继续拓展自己多方面的能力。学校的机器人社团,比如做Robocon,RoboMasters的团队应该在招新了,赶快去加入,有了学长学姐的指导以及同辈朋友的鞭策,应该会进步的快一点。
大二应该掌握的技能:Solidworks画基本的机械图,基本的数字电路知识、数模转换,51单片机、AVR单片机、STM32单片机原理,UART、SPI、I2C、CAN等协议的原理和数据收发,STM32开发板的使用,电机转动和驱动的原理,PID的原理,调试四轮机器人底盘的移动,基本的传感器如陀螺仪、码盘、红外线、超声波的原理和读取方式,网络知识如配置IP配置路由器等,微电子焊接,金工技术。我在知乎回答如果程序员每天都浅尝辄止地学一些不同的新技术,长久以往,人会变成什么样子呢?里谈过机器人工程师需要的技能数量是IT行业全栈工程师技能数量的三倍以上,这些技能的基础都应该在大二开始积累。
如果同学们的专业是机械工程相关,那么大二的时候要深入学习solidworks做图,买机械加工手册学习各种机械的奇技淫巧。你的专业知识还不足以让你进行缜密的受力分析,不过你可以尽量多做一些机械结构出来感受它们的乐趣。
如果同学们的专业是硬件、电路相关,那么大二的时候要深入学习Altium Designer做图、制板、焊板。你要从现在开始,就给自己积累一个工作记录,可以就是简单的txt文件,记录你做过所有板子的bug、解决方案、学到的原理图、PCB layout的注意事项等等。积累很多年以后,你的这个工作记录会值很多钱。
学习这些技能的最好的方式,就是参加自己学校机器人社团的训练和方案设计。一般来说,学校的机器人社团招新之后会有训练和测试,让新人分组去做机器人,这个过程中如果愿意努力学,提高得会很快。如果你所在的大学是机器人比赛强校,比如西安交通大学,电子科技大学,哈尔滨工业大学,华中科技大学,东北大学等等(排名不分先后,没有提到你们学校名字的话我表示抱歉),那么你很幸运,你们学校的机器人社团有很好的积淀,有很多资源可以帮助你学习。基本上只要天天泡实验室,保证自己每天只睡6-7个小时(但还是要多去跑步、游泳保持身体健康),勤于向学长学姐请教,那么一定会提高得很快。
大二阶段特别要强调的是对动手能力的培养,包括机械材料的加工、电路焊接、制作导线和接头、连接路由器、配置网络、做网线等等。机械加工的工具有螺丝刀、锯、钻、锤子、车床、铣床、钻床,进阶选手可以学一下氧焊,这个比较危险,我没尝试过;电路焊接的工具有焊机、焊锡、洗板水、松香、吸锡器;制作导线的工具有剪子、剥线钳、夹头钳、网线钳各种钳;网络配置就是连连路由器插插网线,但是Linux系统下配置网络有时会非常麻烦,一定要多积累这方面的知识,因为将来你造的机器人多半会顶着一个无线路由器跑来跑去,甚至有的机器人上各个模块自己就能组起一个小局域网。这些技能的熟练掌握需要你花很多时间去做真正能用的机器人来练手。
对于该选择造一个怎么样的“真正能用的机器人”练手,最好的选择肯定是机器人比赛中的机器人。如果参加Robocon,你会跟着学长学姐们学着造有人那么高的巨大机械;如果参加RoboMasters,你会学着造比汽车还要灵活的机器人以及快速发弹的机构。其他一些小型的比赛比如飞思卡尔智能车,也是很好的训练,因为飞思卡尔智能车已经发展得很成熟,参加这个比赛的参赛资料就够学一阵子的,学完以后能够获得比较多的机器人技能。
如果没有太多学校机器人社团的资源,同学们还有一些小型的比赛比如挑战杯、大创比赛等等可以选择,以三五个人的小团队参与这些比赛。如果同学所在的学校连这些比赛都不组织大家参与,那就只好自己花钱了。国内开源机器人社区有很多资源可以利用来学习,比如自己买Arduino STEM educational Robot kits Building Platform的各种开发套件做简单的机器人。Arduino的开发环境可能有些人不喜欢,因为它对硬件做了一级封装,如果更希望接触到单片机的本质,可以自己买STM32开发板学习。俗话说,没有什么嵌入式系统是一块STM32实现不了的,如果有,就用两块。STM32是ARM Cortex‑M家族中最为广泛应用的一款单片机,在网上也有很多的教材和开发板可供选择。在国内著名的电子论坛STM32/8 分论坛帖子清单 (amoBBS 阿莫电子论坛)上,有很多参考资料,有问题也可以在这里和大家讨论学习。
如果你很想参加机器人比赛,身边也恰好有一些志同道合的小伙伴,但是学校不支持。没关系,来找我,我尽量通过大疆的关系说服你们学校支持你们参加RoboMasters。
编者注:RoboMasters为大疆主办的全国大学生机器人竞技类比赛,第二届已于8月28日落下帷幕,电子科技大学的One Point Five S战队从32支总决赛参赛队中脱颖而出,摘得桂冠,成功卫冕全国总冠军。
虽然你是以机器人比赛为主线在探索机器人技术,但是要时刻记得,机器人比赛给你的理论方面的训练很差,还会让你养成一些坏习惯,比如凡事都希望用一些糙猛快的办法来解决。由于通常整个团队都没有太多的项目管理经验,到比赛前一段时间才会加紧功夫去做机器人,很多时候就会用“山寨”的办法去处理机器人的故障。比如说某个承重结构用久了会弯,为了赶比赛的进度,就拿锤子敲直了、再加一条辅助的结构在旁边继续用,而没有细致地去做建模、受力分析,思考是什么原因导致承重结构会变形。再比如说调PID参数就是生调乱改,而没有基于机器人的动力学模型去估测参数的大概范围。
大二的暑假,有可能你跟着学校的机器人队参加了一些机器人比赛。这是一个反思总结的好时机,为什么机器人队取得了这样那样的成绩?整个团队怎样才能更有效率?明年如何继续招新?暑假要把时间花在技术积累上面,这个时候可以回头思考思考之前准备比赛时用糙猛快的办法解决的问题如何能够细致地去解决。
如果大二的暑假没有参加机器人比赛,可以做一个舵机机器人,比如6条腿的蜘蛛,比如码垛机器人。舵机是机器人工程师的好朋友,一定要好好掌握。
另外你其他方面的能力也不能落下。大二结束的时候,你的Linux应该用的很熟练了,除了makefile,你也用起了cmake。你也应该开始理解Github存在的意义,因为你已经上去读了很多别人的代码,你也把自己的一些课程设计和小项目放在了Github上面。另外大二基本上了本专业一些比较难的基础课程,比如自动控制原理、机器学习、概率统计、材料和力学等课程,同学们会看到这些课程里又用到了线性代数和微积分的知识,以及建模的知识。这时候可以把大一的物理、线性代数和微积分再翻出来看看。
同学的学校应该给大二到大三的学生有开设面向对象的程序设计,一般用Java或C++教授。在面向对象的程序课里面,一定要积累3000行左右的代码的开发经验。经典的面向对象程序设计的练习通常是写游戏,比如俄罗斯方块,吃豆人等等,一定要自己能够做到完全手写一个完整的项目出来。
另外你可以开始学习Matlab当中的神器Simulink了。在大二这一年的学习中,你可能在不少课程里多多少少用到了Matlab。假设你已经在我的推荐下喜欢上了Python,你可能会觉得Matlab的计算工具没有比Python强多少;假设你自己在别人的推荐下喜欢上了mathematica(Mathematica 到底有多厉害? - Wolfram Mathematica),你可能会觉得和Mathematica这种神一样的语言比起来,Matlab弱爆了。但是要注意的是,Matlab最强大的工具是Simulink,通过它你几乎可以仿真一切的物理系统和控制系统。我建议同学可以通过Simulink实现一个倒立摆,然后理解Matlab的强大之处。对此我强烈推荐一个很好的教材(http://ctms.engin.umich.edu/CTMS/index.php?example=Introduction§ion=SimulinkControl),它详细介绍了一些经典的控制系统如何分析以及用Simulink实现。然后我再强烈推荐一个讲Simulink里面一个更加和物理仿真贴近的工具Simscape(Control of an Inverted Pendulum on a Cart)的文章。阅读并实现了这两篇文章里的内容,同学应该会对倒立摆有了比较深刻的认识。倒立摆是机器人学中一个非常重要的模型,因为火箭、导弹、双足机器人、四足机器人,基本都是倒立摆的变形。你自己实现出来的simulink模型一定要存好,以后可能还会再拿出来仔细看。
如果你按照我之前说的方法探索了一些HTML和Javascript的技术,那么JQuery,bootstrap,AngularJS你已经多多少少知道是怎么回事了。web后端的技术,比如PHP和MySQL,也可以了解一下,LAMP要学会怎么配置。如果有同学找你帮忙写小网站,尽量去帮个忙,帮别人做网站是提高自己系统编程能力的好练习。在做网站的过程中你可能还会顺便学一学如何用Photoshop和Illustrator让网站显得更漂亮。这些技能有最好,没空学也没关系。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。