认知、直觉与成见
2020-06-07 / modified at 2022-04-04 / 2.7k words / 9 mins
️This article has been over 2 years since the last update.

本文是对徐英瑾教授所著的《认知成见》《语境建模》,与Daniel Kahneman的《思考,快与慢》的部分阅读心得。

这两本书核心议题是一样的,其中《认》《语》更加偏向哲学类的入门,本书主要是先综述了名家观点然后再进行补充或批判,总体上比较散,过于“学院派”,对跨界读者比较困难,但是对概率贝叶斯的例子更加丰富;而《思考,快与慢》明显更加偏向于心理学,术语简单,提纲简洁,面向大众更广。

在部分章节,引用了《科学哲学》的部分参考。

(如下仅为某些学说的在一定时空下的理论观点,不同理论的分类范围均不同,仅供参考。如果需要系统学习,可以参考这个书单)

为什么要读认知/知识论?

我希望通过认知论的思维指导

  • 在个人上,改变追求”完美框架“才实施(最终会导致拖延症)的思维。
  • 在组织上,作为形而上指导原则,研发出SaaS协同系统,以完善框架与固化经验。

虽然看完了这些,该不会的还是不会,但是它可以提供一些范式(范式是指导你去如何定义、描述、建模、接近与验证问题的决策手段,它比方法论等框架更高维度)去改善。

两种认知框架

人是如何了解认知(cognitive/ˈkɔɡnitiv/)事物的呢?从神经科学上说,就是将外部感官接收到的信息以数字信号(神经递质)为载波、通过大脑皮层等神经系统进行“运算”的过程,这个本文跳过,可以查看Neuroscience相关tag。

本文讨论的主要是在心理层上的两种思考分类

  • 快思考:无意识且快速,不费力的思考,无法停止,冲动的
  • 慢思考:按部就班的计算,需要注意力(Attention and effort),当大脑冲刺/忘我/心流时,会屏蔽次要任务

两者并不是互斥割裂的认知方法,它们只是专家提出的分类理论,而是各有所长,甚至可以互相补充。

快思考慢思考
媒介经历、实验、感官、童年、家庭、社会文化公式计算、算法、框架、演绎、形式化验证
认知过程基于索引词进行原型归纳、相似、类比、锚定、延展、镜像等使用演绎形式化符号等描述原理,一步步推导计算而来
优点简单而快速;直觉复杂而准确
缺点过于主观模糊,容易产生谬论/成见;需要从白板塑造组合爆炸,耗时耗力低内存,现实中使用比较苛刻
改进多维度思考;更丰富的经历剪枝算法;更精确的度量能力
相关/类比系统一,经验主义,判例法,内隐知识,后验,主观,整体论,土法思考(heuristics),非理性,日本企业系统二,理性主义,成文法,显性知识,先验,客观,简化论,通用求解器,理性,西方企业

在之前的文章中,也介绍过两者是螺旋上升,当对某个耗时任务熟练后,会固化到快思考。比如

  • 学习电脑打字的开始阶段,需要先看键盘再核对屏幕(慢思考,需要中断任务);当习惯打字后,直接从大脑中默念就可以”自动“打出到屏幕上,这就是“固化”到快思考中了。
  • 刚开始开车时,需要分辩刹车与离合;习惯开车后,甚至认为车是身体的延伸。
  • 大前研一的“右脳による発散と左脳による収束を繰り返しながら”

这种组合分工其实在CPU设计中也有类似借鉴,比如现代CPU中可以集成两种类型的IP Core

  • High-performance cores: 通用计算核,支持多种指令集
  • Enenrgy-efficient cores: 专用ASIC电路(比如矩阵计算),用途单一,能耗比高效

通过这种组合,可以实现在同等面积下,大部分用户场景的低功耗与高性能。

什么是慢思考

基于形式化验证(比如贝叶斯公式)、古典逻辑、推导演绎、框架流程、方法论进行思考都是慢思考。

不足

这些场景在简单苛刻的先验条件下表现不错,但是在真实、复杂系统的场景中(比如股票交易)

  • 无法获取到全部因素的精确值,导致结论出现偏差
  • 就算能够获取全部精确值,但是运算成本与时间也可能非常大
  • 就算有高性能计算集群,如果观察对象存在随机因素,也无法推导后续结论

它将导致

  • 逻辑限制过于严格苛刻,信息密度低
  • 只能在框架内运作,只能产生工程组合创新,但是无法突破框架本身
  • 作为判断依据时,使用条件需要额外的限制方法
  • 个人决策畏首畏尾,造成等待/拖延/懒

性能

  • 容易被打断,比如走路时思考就不如坐下来思考
  • 能耗高

快思考

直觉(intuition)中有两种子分类,一种是技能类(比如开车、打字);另一种是认知类,本文主要讲的内容是认知。爱因斯坦曾经说过“真正可贵的因素是直觉”,这句话就指认知层的直觉

人类的大部分推理是基于直觉思考的,是快速且非理性的,并不是按照贝叶斯等框架工具的流程来运作的。

符号学与索引词理论

有一种认知理论叫做皮尔斯的符号学(Semiotic)理论,在这个理论中,人是通过符号进行思考的

普通人对“苹果”的认知是这样固化的

1
2
我看到一个🍎 -> 用手拿起来了它 -> 吃下了它
总结了经验 -> `圆形` `红色` `甜的`

那么你是否了解了“苹果”的定义呢?并没有,苹果在字典中一定是很苛刻的生物条目,普通人只是将“苹果”这个符号与感官过程(视觉/触觉/味觉等)或者几束特征/规格进行了关联。

相比于演绎推导,人类的认知是基于模糊的索引实现的

  • Context是基于遗传进化与后天感知经验,并学习归类形成的“天经地义”的背景
  • 基于Context,对先验的事实进行标记(比如归纳与分界,内部有覆盖、相似,因果等方法),标记后会形成索引词的集合
  • 与搜索引擎的倒排索引类似,人类认知事物是基于时空上的EditDistance(更专业的叫做心理距离)进行匹配的。

比如普通人对“苹果”的认知是这样固化的

1
`我刚刚吃了一个苹果` - Context ->`圆形` `红色` `甜的`

然后当某人再吃了一个梨的时候,梨的认知是这样的圆形 绿色 甜的

那么就可以基于索引相似度,并与苹果类比、分类,得出认知结论,这个过程就叫做“联想/偏见”的概念性思考。当然这个例子只是事物特性的例子,更准确的属性是

  • 相似性:符号的重叠程度
  • 时空相接:A发生后B马上发生
  • 因果关系:通过视觉就可以“看到”因果现象

再举一些例子

  • 我被狗咬过,狗的标签含有“宠物” =>以后对任何宠物(不管表面看起来多么可爱)都会躲避
  • 我被XX中介骗过,中介具有“销售”属性 => 以后具有“销售”属性的职业我都非常谨慎地面对
  • 我被假简历项目忽悠了,这些简历与学历线形相关=>以后看到了低学历的直接绕过

这些例子就是基于直觉的单一认知产物,就算“我”的理智告诉我这样做是不妥当的,我也会下意识地去这么做。

诉诸直觉带来的谬论

基于索引词的启发法,直觉可以在有限的时间与算力中,更快地找到近似最优解,它既帮助了你日常的生活,但是人自身心理缺陷

  • 过于自信
  • 惧怕不确定性,惧怕失败,宁可付出更高的成本获取100%,而不计算加权因素
  • 从众心态
  • 无意识放大对自己有利的因素;贪婪

有可能产生先入为主导致的认知谬论。

谬论指将A、B两件相关、不相干的事情进行归因,认为是A导致了B。

  • 锚定效应/启动效应:最常见的是“皇帝一定用金锄头耕地吧”,高级码农一定用的是“金键盘”吧
  • 忽略概率/幸存者效应:当事情发生后,大脑第二次会做出“心理准备”,而不会考虑贝叶斯概率上的事实,比如彩票与期权
  • 光环效应/曝光效应(mere exposure):人们更倾向对自己熟悉的内容有好感
  • 时代局限性:知识视野限制
  • 过拟合/单一归因:比如企业的成功是多方面因素照成的,但是某些书本将成功归纳为”成本改进“
  • 因果倒置:比如美国好学区的房价高并不是因为教育好而涨,而是房产税可以让学校雇佣更好的老师。

最终导致你只能认知到表面、部分、甚至错误的结论,这个在海德格尔的存在理论有更深的介绍。

其他

  • 在设计应用交互时,要符合“快思考”的思维模式,方便用户形成记忆,而不是层层嵌套组合

关于AI

现在很多的AI算法/芯片中,通过大量配置乘法器等专用电路电路来模拟“神经元”矩阵的认知,通过相关性算法进行拟合(比如biases vectors),最终形成特例框架的过程。针对什么是AI,有两个观点

  • 从“自我”的角度,这个“学习成果”与现实世界交互时没有主客、共情、结论不可传承,得到的也只是统计维度的准确性,只能在特定约束下使用,尚不值得挂上“智能”的称号。特例是Chinese Room问题

  • 从功能主义的角度,部分科学家认为只要表现出智能状态所应有的功能(就算内部只是正则表达式),那么它就应该被认为是有智能的