️This article has been over 2 years since the last update.
本文是对徐英瑾教授所著的《认知成见》《语境建模》,与Daniel Kahneman的《思考,快与慢》的部分阅读心得。
这两本书核心议题是一样的,其中《认》《语》更加偏向哲学类的入门,本书主要是先综述了名家观点然后再进行补充或批判,总体上比较散,过于“学院派”,对跨界读者比较困难,但是对概率贝叶斯的例子更加丰富;而《思考,快与慢》明显更加偏向于心理学,术语简单,提纲简洁,面向大众更广。
在部分章节,引用了《科学哲学》的部分参考。
(如下仅为某些学说的在一定时空下的理论观点,不同理论的分类范围均不同,仅供参考。如果需要系统学习,可以参考这个书单)
为什么要读认知/知识论?
我希望通过认知论的思维指导
- 在个人上,改变追求”完美框架“才实施(最终会导致拖延症)的思维。
- 在组织上,作为形而上指导原则,研发出SaaS协同系统,以完善框架与固化经验。
虽然看完了这些,该不会的还是不会,但是它可以提供一些范式(范式是指导你去如何定义、描述、建模、接近与验证问题的决策手段,它比方法论等框架更高维度)去改善。
两种认知框架
人是如何了解认知(cognitive/ˈkɔɡnitiv/)事物的呢?从神经科学上说,就是将外部感官接收到的信息以数字信号(神经递质)为载波、通过大脑皮层等神经系统进行“运算”的过程,这个本文跳过,可以查看Neuroscience相关tag。
本文讨论的主要是在心理层上的两种思考分类
- 快思考:无意识且快速,不费力的思考,无法停止,冲动的
- 慢思考:按部就班的计算,需要注意力(Attention and effort),当大脑冲刺/忘我/心流时,会屏蔽次要任务
两者并不是互斥割裂的认知方法,它们只是专家提出的分类理论,而是各有所长,甚至可以互相补充。
快思考 | 慢思考 | |
---|---|---|
媒介 | 经历、实验、感官、童年、家庭、社会文化 | 公式计算、算法、框架、演绎、形式化验证 |
认知过程 | 基于索引词进行原型归纳、相似、类比、锚定、延展、镜像等 | 使用演绎形式化符号等描述原理,一步步推导计算而来 |
优点 | 简单而快速;直觉 | 复杂而准确 |
缺点 | 过于主观模糊,容易产生谬论/成见;需要从白板塑造 | 组合爆炸,耗时耗力低内存,现实中使用比较苛刻 |
改进 | 多维度思考;更丰富的经历 | 剪枝算法;更精确的度量能力 |
相关/类比 | 系统一,经验主义,判例法,内隐知识,后验,主观,整体论,土法思考(heuristics),非理性,日本企业 | 系统二,理性主义,成文法,显性知识,先验,客观,简化论,通用求解器,理性,西方企业 |
在之前的文章中,也介绍过两者是螺旋上升,当对某个耗时任务熟练后,会固化到快思考。比如
- 学习电脑打字的开始阶段,需要先看键盘再核对屏幕(慢思考,需要中断任务);当习惯打字后,直接从大脑中默念就可以”自动“打出到屏幕上,这就是“固化”到快思考中了。
- 刚开始开车时,需要分辩刹车与离合;习惯开车后,甚至认为车是身体的延伸。
- 大前研一的“右脳による発散と左脳による収束を繰り返しながら”
这种组合分工其实在CPU设计中也有类似借鉴,比如现代CPU中可以集成两种类型的IP Core
- High-performance cores: 通用计算核,支持多种指令集
- Enenrgy-efficient cores: 专用ASIC电路(比如矩阵计算),用途单一,能耗比高效
通过这种组合,可以实现在同等面积下,大部分用户场景的低功耗与高性能。
什么是慢思考
基于形式化验证(比如贝叶斯公式)、古典逻辑、推导演绎、框架流程、方法论进行思考都是慢思考。
不足
这些场景在简单苛刻的先验条件下表现不错,但是在真实、复杂系统的场景中(比如股票交易)
- 无法获取到全部因素的精确值,导致结论出现偏差
- 就算能够获取全部精确值,但是运算成本与时间也可能非常大
- 就算有高性能计算集群,如果观察对象存在随机因素,也无法推导后续结论
它将导致
- 逻辑限制过于严格苛刻,信息密度低
- 只能在框架内运作,只能产生工程组合创新,但是无法突破框架本身
- 作为判断依据时,使用条件需要额外的限制方法
- 个人决策畏首畏尾,造成等待/拖延/懒
性能
- 容易被打断,比如走路时思考就不如坐下来思考
- 能耗高
快思考
直觉(intuition)中有两种子分类,一种是技能类(比如开车、打字);另一种是认知类,本文主要讲的内容是认知。爱因斯坦曾经说过“真正可贵的因素是直觉”,这句话就指认知层的直觉
人类的大部分推理是基于直觉思考的,是快速且非理性的,并不是按照贝叶斯等框架工具的流程来运作的。
符号学与索引词理论
有一种认知理论叫做皮尔斯的符号学(Semiotic)理论,在这个理论中,人是通过符号进行思考的
普通人对“苹果”的认知是这样固化的
1 | 我看到一个🍎 -> 用手拿起来了它 -> 吃下了它 |
那么你是否了解了“苹果”的定义呢?并没有,苹果在字典中一定是很苛刻的生物条目,普通人只是将“苹果”这个符号与感官过程(视觉/触觉/味觉等)或者几束特征/规格进行了关联。
相比于演绎推导,人类的认知是基于模糊的索引实现的
- Context是基于遗传进化与后天感知经验,并学习归类形成的“天经地义”的背景
- 基于Context,对先验的事实进行标记(比如归纳与分界,内部有覆盖、相似,因果等方法),标记后会形成索引词的集合
- 与搜索引擎的倒排索引类似,人类认知事物是基于时空上的
EditDistance
(更专业的叫做心理距离)进行匹配的。
比如普通人对“苹果”的认知是这样固化的
1 | `我刚刚吃了一个苹果` - Context ->`圆形` `红色` `甜的` |
然后当某人再吃了一个梨的时候,梨的认知是这样的圆形
绿色
甜的
那么就可以基于索引相似度,并与苹果类比、分类,得出认知结论,这个过程就叫做“联想/偏见”的概念性思考。当然这个例子只是事物特性的例子,更准确的属性是
- 相似性:符号的重叠程度
- 时空相接:A发生后B马上发生
- 因果关系:通过视觉就可以“看到”因果现象
再举一些例子
- 我被狗咬过,狗的标签含有“宠物” =>以后对任何宠物(不管表面看起来多么可爱)都会躲避
- 我被XX中介骗过,中介具有“销售”属性 => 以后具有“销售”属性的职业我都非常谨慎地面对
- 我被假简历项目忽悠了,这些简历与学历线形相关=>以后看到了低学历的直接绕过
这些例子就是基于直觉的单一认知产物,就算“我”的理智告诉我这样做是不妥当的,我也会下意识地去这么做。
诉诸直觉带来的谬论
基于索引词的启发法,直觉可以在有限的时间与算力中,更快地找到近似最优解,它既帮助了你日常的生活,但是人自身心理缺陷
- 过于自信
- 惧怕不确定性,惧怕失败,宁可付出更高的成本获取100%,而不计算加权因素
- 从众心态
- 无意识放大对自己有利的因素;贪婪
有可能产生先入为主导致的认知谬论。
谬论指将A、B两件相关、不相干的事情进行归因,认为是A导致了B。
- 锚定效应/启动效应:最常见的是“皇帝一定用金锄头耕地吧”,高级码农一定用的是“金键盘”吧
- 忽略概率/幸存者效应:当事情发生后,大脑第二次会做出“心理准备”,而不会考虑贝叶斯概率上的事实,比如彩票与期权
- 光环效应/曝光效应(mere exposure):人们更倾向对自己熟悉的内容有好感
- 时代局限性:知识视野限制
- 过拟合/单一归因:比如企业的成功是多方面因素照成的,但是某些书本将成功归纳为”成本改进“
- 因果倒置:比如美国好学区的房价高并不是因为教育好而涨,而是房产税可以让学校雇佣更好的老师。
最终导致你只能认知到表面、部分、甚至错误的结论,这个在海德格尔的存在理论有更深的介绍。
其他
- 在设计应用交互时,要符合“快思考”的思维模式,方便用户形成记忆,而不是层层嵌套组合
关于AI
现在很多的AI算法/芯片中,通过大量配置乘法器等专用电路电路来模拟“神经元”矩阵的认知,通过相关性算法进行拟合(比如biases vectors),最终形成特例框架的过程。针对什么是AI,有两个观点
从“自我”的角度,这个“学习成果”与现实世界交互时没有主客、共情、结论不可传承,得到的也只是统计维度的准确性,只能在特定约束下使用,尚不值得挂上“智能”的称号。特例是Chinese Room问题
从功能主义的角度,部分科学家认为只要表现出智能状态所应有的功能(就算内部只是正则表达式),那么它就应该被认为是有智能的