认知、直觉与成见

2020-06-07 / modified at 2022-04-04 / 2.7k words / 9 mins

️This article has been over 2 years since the last update.

本文是对徐英瑾教授所著的《认知成见》《语境建模》，与Daniel Kahneman的《思考，快与慢》的部分阅读心得。

这两本书核心议题是一样的，其中《认》《语》更加偏向哲学类的入门，本书主要是先综述了名家观点然后再进行补充或批判，总体上比较散，过于“学院派”，对跨界读者比较困难，但是对概率贝叶斯的例子更加丰富；而《思考，快与慢》明显更加偏向于心理学，术语简单，提纲简洁，面向大众更广。

在部分章节，引用了《科学哲学》的部分参考。

(如下仅为某些学说的在一定时空下的理论观点，不同理论的分类范围均不同，仅供参考。如果需要系统学习，可以参考这个书单)

为什么要读认知/知识论？

我希望通过认知论的思维指导

在个人上，改变追求”完美框架“才实施（最终会导致拖延症）的思维。
在组织上，作为形而上指导原则，研发出SaaS协同系统，以完善框架与固化经验。

虽然看完了这些，该不会的还是不会，但是它可以提供一些范式（范式是指导你去如何定义、描述、建模、接近与验证问题的决策手段，它比方法论等框架更高维度）去改善。

两种认知框架

人是如何了解认知（cognitive/ˈkɔɡnitiv/）事物的呢？从神经科学上说，就是将外部感官接收到的信息以数字信号（神经递质）为载波、通过大脑皮层等神经系统进行“运算”的过程，这个本文跳过，可以查看Neuroscience相关tag。

本文讨论的主要是在心理层上的两种思考分类

快思考：无意识且快速，不费力的思考，无法停止，冲动的
慢思考：按部就班的计算，需要注意力(Attention and effort)，当大脑冲刺/忘我/心流时，会屏蔽次要任务

两者并不是互斥割裂的认知方法，它们只是专家提出的分类理论，而是各有所长，甚至可以互相补充。

	快思考	慢思考
媒介	经历、实验、感官、童年、家庭、社会文化	公式计算、算法、框架、演绎、形式化验证
认知过程	基于索引词进行原型归纳、相似、类比、锚定、延展、镜像等	使用演绎形式化符号等描述原理，一步步推导计算而来
优点	简单而快速；直觉	复杂而准确
缺点	过于主观模糊，容易产生谬论/成见；需要从白板塑造	组合爆炸，耗时耗力低内存，现实中使用比较苛刻
改进	多维度思考；更丰富的经历	剪枝算法；更精确的度量能力
相关/类比	系统一，经验主义，判例法，内隐知识，后验，主观，整体论，土法思考(heuristics)，非理性，日本企业	系统二，理性主义，成文法，显性知识，先验，客观，简化论，通用求解器，理性，西方企业

在之前的文章中，也介绍过两者是螺旋上升，当对某个耗时任务熟练后，会固化到快思考。比如

学习电脑打字的开始阶段，需要先看键盘再核对屏幕（慢思考，需要中断任务）；当习惯打字后，直接从大脑中默念就可以”自动“打出到屏幕上，这就是“固化”到快思考中了。
刚开始开车时，需要分辩刹车与离合；习惯开车后，甚至认为车是身体的延伸。
大前研一的“右脳による発散と左脳による収束を繰り返しながら”

这种组合分工其实在CPU设计中也有类似借鉴，比如现代CPU中可以集成两种类型的IP Core

High-performance cores: 通用计算核，支持多种指令集
Enenrgy-efficient cores: 专用ASIC电路（比如矩阵计算），用途单一，能耗比高效

通过这种组合，可以实现在同等面积下，大部分用户场景的低功耗与高性能。

什么是慢思考

基于形式化验证（比如贝叶斯公式）、古典逻辑、推导演绎、框架流程、方法论进行思考都是慢思考。

不足

这些场景在简单苛刻的先验条件下表现不错，但是在真实、复杂系统的场景中（比如股票交易）

无法获取到全部因素的精确值，导致结论出现偏差
就算能够获取全部精确值，但是运算成本与时间也可能非常大
就算有高性能计算集群，如果观察对象存在随机因素，也无法推导后续结论

它将导致

逻辑限制过于严格苛刻，信息密度低
只能在框架内运作，只能产生工程组合创新，但是无法突破框架本身
作为判断依据时，使用条件需要额外的限制方法
个人决策畏首畏尾，造成等待/拖延/懒

性能

容易被打断，比如走路时思考就不如坐下来思考
能耗高

快思考

直觉（intuition）中有两种子分类，一种是技能类（比如开车、打字）；另一种是认知类，本文主要讲的内容是认知。爱因斯坦曾经说过“真正可贵的因素是直觉”，这句话就指认知层的直觉

人类的大部分推理是基于直觉思考的，是快速且非理性的，并不是按照贝叶斯等框架工具的流程来运作的。

符号学与索引词理论

有一种认知理论叫做皮尔斯的符号学(Semiotic)理论，在这个理论中，人是通过符号进行思考的

普通人对“苹果”的认知是这样固化的

1 2	我看到一个🍎 -> 用手拿起来了它 -> 吃下了它总结了经验 -> `圆形` `红色` `甜的`

那么你是否了解了“苹果”的定义呢？并没有，苹果在字典中一定是很苛刻的生物条目，普通人只是将“苹果”这个符号与感官过程（视觉/触觉/味觉等）或者几束特征/规格进行了关联。

相比于演绎推导，人类的认知是基于模糊的索引实现的

Context是基于遗传进化与后天感知经验，并学习归类形成的“天经地义”的背景
基于Context，对先验的事实进行标记（比如归纳与分界，内部有覆盖、相似，因果等方法），标记后会形成索引词的集合
与搜索引擎的倒排索引类似，人类认知事物是基于时空上的EditDistance（更专业的叫做心理距离）进行匹配的。

比如普通人对“苹果”的认知是这样固化的

1	`我刚刚吃了一个苹果` - Context ->`圆形` `红色` `甜的`

然后当某人再吃了一个梨的时候，梨的认知是这样的圆形 绿色 甜的

那么就可以基于索引相似度，并与苹果类比、分类，得出认知结论，这个过程就叫做“联想/偏见”的概念性思考。当然这个例子只是事物特性的例子，更准确的属性是

相似性：符号的重叠程度
时空相接：A发生后B马上发生
因果关系：通过视觉就可以“看到”因果现象

再举一些例子

我被狗咬过，狗的标签含有“宠物” =>以后对任何宠物（不管表面看起来多么可爱）都会躲避
我被XX中介骗过，中介具有“销售”属性 => 以后具有“销售”属性的职业我都非常谨慎地面对
我被假简历项目忽悠了，这些简历与学历线形相关=>以后看到了低学历的直接绕过

这些例子就是基于直觉的单一认知产物，就算“我”的理智告诉我这样做是不妥当的，我也会下意识地去这么做。

诉诸直觉带来的谬论

基于索引词的启发法，直觉可以在有限的时间与算力中，更快地找到近似最优解，它既帮助了你日常的生活，但是人自身心理缺陷

过于自信
惧怕不确定性，惧怕失败，宁可付出更高的成本获取100%，而不计算加权因素
从众心态
无意识放大对自己有利的因素；贪婪

有可能产生先入为主导致的认知谬论。

谬论指将A、B两件相关、不相干的事情进行归因，认为是A导致了B。

锚定效应/启动效应：最常见的是“皇帝一定用金锄头耕地吧”，高级码农一定用的是“金键盘”吧
忽略概率/幸存者效应：当事情发生后，大脑第二次会做出“心理准备”，而不会考虑贝叶斯概率上的事实，比如彩票与期权
光环效应/曝光效应（mere exposure）：人们更倾向对自己熟悉的内容有好感
时代局限性：知识视野限制
过拟合/单一归因：比如企业的成功是多方面因素照成的，但是某些书本将成功归纳为”成本改进“
因果倒置：比如美国好学区的房价高并不是因为教育好而涨，而是房产税可以让学校雇佣更好的老师。

最终导致你只能认知到表面、部分、甚至错误的结论，这个在海德格尔的存在理论有更深的介绍。

其他

在设计应用交互时，要符合“快思考”的思维模式，方便用户形成记忆，而不是层层嵌套组合

关于AI

现在很多的AI算法/芯片中，通过大量配置乘法器等专用电路电路来模拟“神经元”矩阵的认知，通过相关性算法进行拟合（比如biases vectors），最终形成特例框架的过程。针对什么是AI，有两个观点

从“自我”的角度，这个“学习成果”与现实世界交互时没有主客、共情、结论不可传承，得到的也只是统计维度的准确性，只能在特定约束下使用，尚不值得挂上“智能”的称号。特例是Chinese Room问题
从功能主义的角度，部分科学家认为只要表现出智能状态所应有的功能（就算内部只是正则表达式），那么它就应该被认为是有智能的