大学的毕业季,为了吸引学生投简历,有很多公司回到学校来做宣讲。我在毕业之前找工作,也参加过很多这样的宣讲会。有一家公司的老总来我们学校做宣讲。这个老总叫刘景泰,当时是南开大学机器人研究所的副所长。他提到一个问题,我一直记得。他问我们:你们学了4年的自动化,谁能用一个词告诉我,自动化是什么?能坐满100人的教室鸦雀无声。最后,他揭示的答案只有2个字:反馈!于是大家恍然大悟,深以为然。
让我们做个最粗略的简化。一个自动控制的最简单反馈系统,比如你住的高层供水系统。由电机、变频器、PLC(可编程逻辑控制器 Programmable Logic Controller)和一个压力传感器组成。
压力传感器:实时检测水压的变化,将水压的值编译成电信号发送出去。
PLC:接受这个信号,和自己程序中的设定进行比对,比如当发现压力传感器的值高于自己设定值的时候,就给变频器发个指令。
变频器:接受PLC的这个指令,按照指令再编译成频率和电压等参数,再传给水泵上的电机。
电机:接受变频器的输入,改变转速。
当实际测量值和设定值不一样的时候,我们通过调整内部的参数,更好地输出,使得新的输出和设定逐渐接近,这样系统就越来越稳定了。
自动化就是通过反馈,稳定在目标的过程。
01
反馈开启了第一次工业革命
瓦特最大的贡献是改良了蒸汽机,而不是很多人以为的发明了蒸汽机。改良中的一个重大发明就是给蒸汽机提供一个反馈机制。这个机制叫做瓦特式飞轮调速器,也叫做离心式调速器。
它的工作原理可以简单地描述为:
将一个有两颗金属小球的锥摆,固定在蒸汽机的一个转动轴上,让锥摆和转轴同步转动。转轴快,锥摆的转速也快,小球就被甩起来,就像我们小时候玩的旋转木马。这时小球位置上升,带动一个连接装置,这个连接装置再带动控制蒸汽流动的阀门的倾角,让其靠近闭合的位置,这样的话蒸汽流速就会变慢。反过来也一样。
网上有一些视频可以看到详细的过程,我将链接放到文章的底部,可以搜来看看,挺有意思,设计得很巧妙。
在瓦特发明飞轮调速器之前,蒸汽机是一个开环控制系统,转轴的转速仅由蒸汽量决定。但是蒸汽量的大小难以精确把握,从而导致转速变化大。飞轮调速器采用负反馈控制思想,减小了转速变化量。再经过一系列优化后,正式开启了蒸汽时代,即第一次工业革命。
02
人工智能与反馈
大众眼中以为的人工智能是终结者那样的,能正常交流又能骑摩托还能和人打架,这叫做广义人工智能。而现实中我们真正用的是狭义人工智能,不是“能…又能…还能…”这种的,就是“能…”,它只能干某一类的。下围棋的下围棋,图像识别的识别图像,各忙各的。狭义人工智能的基本逻辑叫做机器学习。
所谓机器学习就是建模。你给机器一堆数据,然后用这堆数据建立一个统计上的模型,用这个模型对新数据进行预测。然后将预测和正确的结果进行对比。输入的数据越多,模型的准确度越高。就像是我们一样,通过输入新的知识来学习。这就是为什么这种技术叫做机器学习了。
从商业的角度,为了更好地让大众理解或者更好地让大众不理解,媒体和商业界将其称之为大数据或者人工智能。
进行一个简单的人工智能编程可以通过以下6步完成。
- 分类数据。将数据按照一定的规则整理好,然后分成两组,一组用来训练,也就是建立模型,一组用来进行检验。
- 整理数据。数据以数组的形式呈现。其中包含了目标信息也就是你想要预测的信息,还有尽可能多的各种对目标信息可能有影响的信息。
- 根据自己的判断选择几个对目标信息有影响的信息。
- 选择一个机器学习的算法。
- 输入目标和可能的影响信息,训练出一个模型。
- 用另一组数据对这个模型进行检验。
第6步检验就是一个反馈的过程。如果没有这个过程,系统就没法知道自己对了还是错了,那怎么提高?
所谓的机器学习,我们用一个简单的例子来说一下。
拿让机器识别猫和狗来说吧,我们给机器看成千上万张照片,告诉机器“这只是猫”、“那只是狗”。注意,一定要告诉机器结果。只有这样,机器才会根据结果反过来改变调整因子,最终让调整因子逼近现实,从而得到越来越靠谱的判断。这个不断看照片的学习过程,就叫“大数据训练”,或者叫“大数据喂养”。人工智能中的机器学习的核心就是建立反馈机制。
人工智能本质上也是一种智能,人类也是一种智能,那,人类是如何学习的?
03
什么是学习?
要搞清楚如何学习,先要明白什么是学习。
学习,说白了,就是一个猜想 → 反馈 → 改进 的过程。
你有个想法,通过反馈验证一下,行得通就说明这个想法OK,行不通就再改改,然后再验证。
这里的关键就是反馈。任何能降低不确定性的信息都是有效的反馈。
学习,就是降低世界在你心目中的不确定性;学习就是消化意外的过程,这个意外,就是反馈带来的。
有两种通过反馈学习的方法,一种叫做监督学习,一种叫做无监督学习。
监督学习,可以随时得到有效的反馈。就像是在学校中学习,完成家庭作业,交给老师,老师批改,错在哪里,然后改正,得到提高。
无监督学习,需要自己给自己提供反馈。成年人的学习很多都是这种类型的学习。这里的核心就是,如何才能找到反馈。
不论哪一种学习方法,反馈都是重中之重。
让我们先来看第一种学习,监督学习。
04
什么是监督学习
所谓的监督学习(Supervised Learning),指的是可以随时提供有效反馈的学习。监督过程,按照规则或者有老师的辅导,一步步地做事情。
比如,拼乐高积木。有图纸指导一步步地拼。每拼一步,用手里拼好的组件和图纸上的进行对比,这就是反馈。对了就继续,不对就拆下来重新装。
再比如,练习射击打靶。这一枪比靶心低了,低了大概8公分,那么好,下一枪就往上一点,这一点大概是8公分左右。再试试。这里有反馈,方向上的和距离上的。然后根据反馈进行调整。
或者请了一位教练,教你打乒乓球。教练会教给你一个动作,比如手肘要靠近身体。然后你练习,在练习的过程中,教练会帮助你调整,这里不对,在靠近一点,再低一点,身体跟着动不要光是胳膊动等等。
这里想重点说说在人的监督下学习。你需要主动找到可以为你提供反馈的三位老师。
第一位老师,是大师。我们说的不是江湖中传说的那种大师,我们说的是那些在某个领域真正厉害的人。
亚历山大大帝师从亚里士多德,亚里士多德师从柏拉图,柏拉图师从苏格拉底。所谓的师承关系很重要,牛顿说要站在巨人的肩膀之上就是这个意思。大师之所以是大师并不是沽名钓誉而来的,是由其智慧和能力的积淀被世人所感知而赢得的。巴菲特看了格雷厄姆所写的《聪明的投资者》一书后,跑到纽约拜师,加入了格雷厄姆的纽曼公司,多年后自立门户,自己也终成大师。
国内外的大学,每每提起自己,总是要说说大学里都有哪些大师。抗战时期清华大学的校长梅贻琦说:大学不在于有多少大楼,大学在于有多少大师。学校在鼓吹说起自己的哪个学院厉害,也总得提提这个学院有没有院士,学术带头人是谁。大学和大师是难解难分的,没有大师的大学最终很难有所成就。
前一段时间,看了一部纪录片《西南联大》,竟心生羡慕。生在那个时代是艰难的,但是,在那个时代中,你才能在一所学校之中同时得以听到那么多大师的课。
让我们看看那时的那些大师们:陈寅恪、吴有训、梁思成、金岳霖、陈省身、王力、朱自清、冯友兰、沈从文、闻一多、钱穆、钱钟书、吴大猷、周培源、费孝通、华罗庚、朱光潜、赵九章、李楷文、林徽因、吴晗、潘光旦、卞之琳、梅贻琦、张伯苓、蒋梦麟、杨武之、冯景兰、袁复礼、冯至、刘文典……。要说师承,比较典型的是吴大猷,他的学生是谁呢?杨振宁、李政道、朱光亚、邓稼先……。
所以说,能在那时的西南联大读书,是一件何其幸运的事情啊。
如果足够幸运,你可以直接拜师。有机会直接成为大师的学生、助手、下属是何其的幸运,能得到大师的教诲,一定请珍惜。
对于我们而言,得不到大师的耳提面命,退而求其次,看看大师们的书也是挺好的。你可能无法去上杨振宁给大一新生的物理课,但是你可以去看看他出的物理学讲义;你可能没法向丹尼尔·卡尼曼讨教经济学,但是你可以看看他出的书。
第二位老师是导师。先不说那么遥远的大师,如果在日常的生活和工作中,能找到一位导师也是极其幸运的事情。每个人在成长的过程中,都应该给自己找导师,在不同的阶段,找不同的导师。穷爸爸富爸爸的作者,罗伯特·清崎就是通过富爸爸不断地教导走上财富自由之路的。我也是在导师的教导之下,才开始了今天的创业之路的。导师是那个可以给你洞见,可以在大方向上给你指路的人。找一个导师,讨论想法和成长的价值观相关的事情。
第三位老师是教练。导师是给你方向的,教练是陪你一起走的。一位好的教练能带来事半功倍的效果。从别人的视角看自己可能会看得更清楚。教练能利用自己在此领域内的成就,更好地纠正你的偏差,提供准确的练习方向,并且给予即时反馈,提高你的练习效率。教练会在你做的过程中,进行观察,给你一定的反馈,使你知道应该如何纠正偏差。运动员通过教练来提升自己,在职场中我们也可以通过职场教练来帮助自己。
05
如何进行无监督学习?
无监督学习(unsupervised learning)本质上,是用结果进行学习。用结果检验过程。试错,不断地尝试,找到最为合适的解决问题方法。无监督学习最终是靠外部给你一个反馈,这个反馈就是你是不是达成了目标,成了还是败了。中间过程到底是哪里出了问题,对不起,没有人告诉你,你得自己想办法。
比如,你可能会收到来自失败的反馈。
打算30分钟跑5公里,结果用了32分钟,没成。那,问题出在哪里?节奏没掌握好?鞋不对?中间鞋带开了三次?心率太快了提不上去?呼吸乱了?没热身开始的时候身体太紧跑不快?反正结果要你自己找。
如果是自己做事情,那么你必须给你自己分出两个角色来。一个是行动者(actor),一个是批评者(critic)。这里的批评者就像是我们经常说的第三者视角,我们需要学会跳出自己来看自己,说白了,这就是自己的元认知。比如在跑步的时候,行动者跑着跑着呼吸节奏乱了,这时批评者就要出面了,告诉行动者,不行啊,节奏乱了,调整一下,两步吸,两步呼,两步吸,两步呼,好保持住。
跑一个客户,很辛苦,跟了半年多,但是最终客户还是没有选择你。心痛啊,难受啊,感觉失败啊,想放弃啊。这时,我们就需要再调出我们的批评者,帮助我们反思,到底在这个过程中自己哪里出了问题。是不是决策链没有分析清楚?没有旗手的支持?没看到反对者,是不是有人反对我还不知道?决策者口头上的支持是不是只是当时的场面话?等等,这些都是失败给我们的反馈,我们要接住,然后反思,才能有所提升。
我们说的打开元认知其实就是这个道理。自己成为自己的批评者,或者监督者,自己提升自己。
所谓的失败,不过只是一种反馈而已。
比如,你也可能会收到来自批评的反馈。
还有的时候,我们会接收到来自外部的反馈,但是,这些反馈都是核桃一样的东西:你需要打开外壳,才能吃到核桃仁。
这种外壳就是来自别人的异议、抱怨、投诉、批评、责备等等。
“那些看似异议的东西,其实是穿着伪装的提议”。
为什么我们没有听到这个提议?因为我们通常的做法是,一看到“伪装”之后,马上就在想着该如何反驳了。比如,作为销售,我们要发现这些来自亲爱的客户的“提议”,我们要做的是改变,先改变倾听的方式,再改变回应的方式。客户之所以有异议,大概率上是我们没有做好,这其实给了我们一个提高自己的机会。换个词,如果我们不将其说成异议、抱怨、投诉等等,而将其称之为反馈,这时是不是更能让我们有启发?
大家想想看我们是如何成长或者提高的,这和我们自动化的基本原理是一致的。当实际测量值和设计值不一样的时候,我们通过调整内部的参数,更好地输出,使得新的输出和设定逐渐接近,这样系统就越来越稳定了。
我们的成长也是这样,需要通过外界的反馈给出一个明确的指导,我们在哪里提高才会让我们更好?客户的抱怨和异议,就是给我们了一个免费的方向指导,这多好啊。
进行无监督学习的关键是建立正确的反馈心态。
不要把反馈当成了批评;不要把批评当成失败。
将批评和失败看成是一种反馈。
请把批评和失败从自己的字典中删去,用反馈一词来替换。
蒸汽机也好,人工智能也罢,本质上都需要反馈。对于我们来说,反馈就是一个学习的过程,一个改进的过程。难点在于,如何识别出反馈。因为它常常是带着伪装来的,这个伪装还经常会激怒我们。为了让我们感受更好一点,我们可以尝试着用不同的角度看看这些伪装,还原真实。当你撕掉名为批评或者失败的伪装之后,反馈才能显现出来,监督你,提升你,帮助你。
参考文献:
[1]瓦特式飞轮调速器的原理介绍:https://haokan.baidu.com/v?vid=13457609586525103945&pd=pcshare%EF%BC%89
[2]https://www.bilibili.com/video/av66286837