《模型思维》读书笔记(二)
以下文章选自《思维bingo》
09| 与价值和权力有关的模型
你的价值不在于你知道了什么,而在于你能够分享什么。
——罗睿兰(GinniRometty)
度量价值和权力的两个标准:
1、“最后上车者价值”(last-on-the-bus value,简称LOTB):
一位行动者在团队已经形成的情况下加入团队时的边际贡献。
2、夏普利值(Shapley value):
行动者遍历所有可能的加入团队的序列,加入团队时的边际贡献平均值。例如,在一个由三人组成的团队中,要求出一位行动者的夏普利值,先要求出他以第一、第二、第三位加入者的身份加入时的边际贡献,再计算平局值。
10| 网络模型
网络的结构
网络由节点以及连接节点的边(edge)组成。由边连接起来的节点互为邻居。如果沿着边,可以从任何一个节点到达任何其他节点,就将这样的网络称为连接的网络。
网络以一组网络统计数据为特征。对于每个统计量,我们可以计算网络平均值和所有节点的分布。例如,友谊网络的平均程度告诉我们平均每个人有多少个朋友。
度分布(degree distribution)告诉我们某些节点是否比其他节点连接得更多。社交网络的分布比万维网、互联网和引文网络更加平等,后面这几类网络都有很长的尾巴。
网络统计量
度:节点的邻居数(即边数)。
路径长度:从一个节点到另一个节点必须遍历的最小边数。
介数:经过某个节点连接两个其他节点的最短路径数量。
聚类系数:一个节点的邻居对当中,同样也由一条边连接的邻居对所占的百分比。
常见的网络结构
1、随机网络:聚类系数等于一条随机的边的概率,因为一个节点的两个邻居并不比任何其他随机选择的节点更能包含一条边。
2、地理网络:节点排列成圆形且每个节点在每个方向上都连接到最近的节点。
3、幂律网络:度分布是幂律的,即少数节点有很多连接,同时大多数节点的连接非常少。
4、小世界网络:结合了地理网络和随机网络的特征。社交网络类似于小世界网络。
友谊悖论
如果网络中任何两个节点的度不同,那么平均而言,节点的度会低于其相邻节点。换句话说,平均而言,人们的朋友比他们自己更受欢迎。
在社会网络中,一个人的成功、行为、信息或信念,会影响他们的朋友的成功、行为、信息或信念。一个人的行为既可能是依赖于情境的,也可能是由内在因素决定的;个人对共同事业的价值或贡献也是如此。一个人的价值或贡献可能是源于他本身的某种性质,例如聪明才智、努力水平或好运气,但是,一个人的成功或许也可以归功于其朋友和同事的网络。这其实是一个非常古老的问题:成功到底取决于你所知道的东西,还是取决于你所认识的人?
许多文献(其中有一些是基于模型的)都表明,一个人在一个组织中的位置会影响他的成功。
11 |广播模型、扩散模型和传染模型
1、广播模型
It=Pspread×NPOP
It+1=It+Pspread×St
其中, NPOP表示假设存在的一个相关人群。Pbroad表示广播概率,It和St分别等于时间t上的感染者(知情者)和易感者的数字。
广播模型的目标是描述一个信息源传播信息的过程,可以是政府、企业或报纸。但不适用于在人与人之间传播的传染病或思想。由于广播模型更适合描述思想和信息的传播(而不是传染病的传播),所以我们在这里说知情者的人数,而不说感染者的人数。
假设一家企业为练习太极拳的人推出了新设计的运动鞋,并在第一个星期就收到了20 000双鞋的订单。如果在第二个星期收到了16 000双鞋的订单,那么我们可以大致估计出他们最终的总销售量,也就是相关人群的规模为100 000。
用广播模型拟合销售数据
第1期:I1=20 000=Pbroad×NPOP;
第2期:I2=36 000=20000+Pbroad×(NPOP-20 000)
于是,总销售量为:Pbroad=0.2, NPOP=100 000
2、扩散模型
It+1=It+Pdiffuse×It/NPOP×St
其中Pdiffuse=Pspread×Pcontact
大多数传染病,以及关于产品、思想和技术突破的信息,都是通过口口相传而传播开来的,扩散模型刻画了这些过程。
3、SIR模型(易感者、感染者和痊愈者模型)
It+1=It+Pcontact×Pspread×It/NPOP×St –Precover It
SIR模型在流行病学中占据了中心位置。
接触概率取决于传染病如何从一个人传播到另一个人。艾滋病通过性接触传播;白喉通过唾液传播;流感病毒通过空气传播。因此,流感的接触概率高于白喉,白喉的接触概率又高于艾滋病。而且,在发生接触后,各种传染病的传播概率也会有所不同。白喉比SARS更容易传染给另一个人。
SIR模型会产生一个临界点,就是所谓的基本再生数R0,也就是接触概率乘以扩散概率与痊愈概率之比。
R0=Pcontact×Pspread/Precover
某种传染病,如果R0大于1,那么这种传染病就可以传遍整个人群,而R0小于1的传染病则趋于消失。
疾病控制中心必须依据对R0的估计来指导政策制定。
疫苗接种阈值随R0的增加而提高。
疫苗接种阈值:V≥R0-1/R0
例如,脊髓灰质炎的R0为6,因此为了防止脊髓灰质炎的传播,疫苗必须覆盖5/6的人群。
如果传染病传播的概率超过了1/4,传染病就会蔓延。
辐射型网络
第一个患上传染病的节点可能是中心节点,也可能是外围节点。如果中心节点患上了某种传染病,那么它可以将传染病传播到任何一个其他节点。我们预计这种传染病会扩散,即便传播的概率很低也是如此。
如果中心节点患上了传染病,那么即使传播的可能性很小,传染病也会蔓延。
流行病学家们将位置在度很高的中心节点上的人称为“超级传播者”(superspreaders)。超级传播者加速了艾滋病和SARS的早期传播。超级传播者不一定是社交明星或“人脉”特别广的人,可能从事某种特定的行业职业,比如收费站的收费员、银行柜员、牙科医生,这类职业使他会与属于不同社交网络的人接触。
高度数节点不但能够更快地传播传染病,而且会更快地患上传染病。如果一个人朋友的数量是另一人的三倍,那么他患上传染病的可能性也是后者的三倍,同时传播这种传染病的可能性也是后者的三倍。因此,他对传染病传播的总贡献将是另一个人的九倍。
一对多
尽管SIR模型原本是用来分析传染病传播的,但是我们也可以将它应用于所有先通过扩散传播,然后趋于消失的社会现象,例如书的销售、歌曲的流行、舞步的风行,“热词”的传播、食谱和健身方法的流传等。
成功可能取决于非常微小的差异,正如美国作家约翰·厄普代克(JohnUpdike)在描述棒球明星特德·威廉姆斯(Ted Williams)最后一次击球时所说的:“一件事情做得很好与搞砸了之间,只有极其细微的差异。”
假设你构思了一个新的笑话;只要让这个笑话更有趣一点点,就可能会把R0推到高于1的水平,从而使这个笑话广泛传播开来。同样的逻辑也适用于想法的“黏性”。如果一个想法能够在人们的思维中再坚持一小段时间,那么他们摆脱它的“痊愈”率就会降低,从而提高了R0。
在SIR模型中,我们推导出了两个关键阈值,即R0和疫苗接种阈值。这两个阈值都是属于敏感依赖于环境的临界点,环境(情境)中的微小变化都会对结果产生很大的影响。
要想扭转肥胖这种流行病,我们必须降低它的R0。而要降低R0,则可以通过降低接触概率或者提高分享概率和痊愈概率来实现。
12| 熵:对不确定性建模
信息是不确定性的解。——克劳德·香农(Claude Shannon)
熵是对不确定性的一个正式测度。利用熵,我们可以证明不确定性、信息内容与惊喜之间的等价性。低熵对应于低不确定性,同时揭示的信息很少。而在高熵系统中,比如在抽奖时抽中了某个数字,结果是不确定的,并且实现的结果能够揭示信息。在这个过程中,我们经历了惊喜。
我们还可以使用熵来表征分布。在没有控制或调节力量的情况下, 一些群体可能会向最大熵漂移。
信息熵
熵是用来度量与结果的概率分布相关的不确定性的。因此,它也可以衡量意外。
熵与方差不同,方差度量一个数值集合或数值分布的离散程度。不确定性与离散程度有关,但是两者并不是一回事。在具有高不确定性的分布中,许多结果的概率都是有意义的,这些结果并不一定有数值,具有高离散度的分布则只是具有一些极端的数值。
熵在数学上等于概率与它们的对数之和的相反数。
对于信息熵,可以把它理解为根据随机抛硬币的结果来衡量不确定性的一种方法。
熵的实证含义和规范含义
我们想要多少熵,取决于具体情况。在制定税法时,我们可能需要一种均衡行为模型,并不希望有随机性。在规划城市时,我们可能会希望看到复杂性,均衡或者周期性都会显得过于平淡。我们希望一个城市充满生机活力,为偶然的相遇和互动提供无限机会。在这种情况下,更多的熵会更好,但是又不能太多。我们不喜欢随机性,随机性会使计划变得非常困难,并可能导致我们的认知能力崩溃。最理想的情况是,世界会产生适度的复杂性,以保证我们生活在一个有趣的时代。
09| 与价值和权力有关的模型
你的价值不在于你知道了什么,而在于你能够分享什么。
——罗睿兰(GinniRometty)
度量价值和权力的两个标准:
1、“最后上车者价值”(last-on-the-bus value,简称LOTB):
一位行动者在团队已经形成的情况下加入团队时的边际贡献。
2、夏普利值(Shapley value):
行动者遍历所有可能的加入团队的序列,加入团队时的边际贡献平均值。例如,在一个由三人组成的团队中,要求出一位行动者的夏普利值,先要求出他以第一、第二、第三位加入者的身份加入时的边际贡献,再计算平局值。
10| 网络模型
网络的结构
网络由节点以及连接节点的边(edge)组成。由边连接起来的节点互为邻居。如果沿着边,可以从任何一个节点到达任何其他节点,就将这样的网络称为连接的网络。
网络以一组网络统计数据为特征。对于每个统计量,我们可以计算网络平均值和所有节点的分布。例如,友谊网络的平均程度告诉我们平均每个人有多少个朋友。
度分布(degree distribution)告诉我们某些节点是否比其他节点连接得更多。社交网络的分布比万维网、互联网和引文网络更加平等,后面这几类网络都有很长的尾巴。
网络统计量
度:节点的邻居数(即边数)。
路径长度:从一个节点到另一个节点必须遍历的最小边数。
介数:经过某个节点连接两个其他节点的最短路径数量。
聚类系数:一个节点的邻居对当中,同样也由一条边连接的邻居对所占的百分比。
常见的网络结构
1、随机网络:聚类系数等于一条随机的边的概率,因为一个节点的两个邻居并不比任何其他随机选择的节点更能包含一条边。
2、地理网络:节点排列成圆形且每个节点在每个方向上都连接到最近的节点。
3、幂律网络:度分布是幂律的,即少数节点有很多连接,同时大多数节点的连接非常少。
4、小世界网络:结合了地理网络和随机网络的特征。社交网络类似于小世界网络。
友谊悖论
如果网络中任何两个节点的度不同,那么平均而言,节点的度会低于其相邻节点。换句话说,平均而言,人们的朋友比他们自己更受欢迎。
在社会网络中,一个人的成功、行为、信息或信念,会影响他们的朋友的成功、行为、信息或信念。一个人的行为既可能是依赖于情境的,也可能是由内在因素决定的;个人对共同事业的价值或贡献也是如此。一个人的价值或贡献可能是源于他本身的某种性质,例如聪明才智、努力水平或好运气,但是,一个人的成功或许也可以归功于其朋友和同事的网络。这其实是一个非常古老的问题:成功到底取决于你所知道的东西,还是取决于你所认识的人?
许多文献(其中有一些是基于模型的)都表明,一个人在一个组织中的位置会影响他的成功。
11 |广播模型、扩散模型和传染模型
1、广播模型
It=Pspread×NPOP
It+1=It+Pspread×St
其中, NPOP表示假设存在的一个相关人群。Pbroad表示广播概率,It和St分别等于时间t上的感染者(知情者)和易感者的数字。
广播模型的目标是描述一个信息源传播信息的过程,可以是政府、企业或报纸。但不适用于在人与人之间传播的传染病或思想。由于广播模型更适合描述思想和信息的传播(而不是传染病的传播),所以我们在这里说知情者的人数,而不说感染者的人数。
假设一家企业为练习太极拳的人推出了新设计的运动鞋,并在第一个星期就收到了20 000双鞋的订单。如果在第二个星期收到了16 000双鞋的订单,那么我们可以大致估计出他们最终的总销售量,也就是相关人群的规模为100 000。
用广播模型拟合销售数据
第1期:I1=20 000=Pbroad×NPOP;
第2期:I2=36 000=20000+Pbroad×(NPOP-20 000)
于是,总销售量为:Pbroad=0.2, NPOP=100 000
2、扩散模型
It+1=It+Pdiffuse×It/NPOP×St
其中Pdiffuse=Pspread×Pcontact
大多数传染病,以及关于产品、思想和技术突破的信息,都是通过口口相传而传播开来的,扩散模型刻画了这些过程。
3、SIR模型(易感者、感染者和痊愈者模型)
It+1=It+Pcontact×Pspread×It/NPOP×St –Precover It
SIR模型在流行病学中占据了中心位置。
接触概率取决于传染病如何从一个人传播到另一个人。艾滋病通过性接触传播;白喉通过唾液传播;流感病毒通过空气传播。因此,流感的接触概率高于白喉,白喉的接触概率又高于艾滋病。而且,在发生接触后,各种传染病的传播概率也会有所不同。白喉比SARS更容易传染给另一个人。
SIR模型会产生一个临界点,就是所谓的基本再生数R0,也就是接触概率乘以扩散概率与痊愈概率之比。
R0=Pcontact×Pspread/Precover
某种传染病,如果R0大于1,那么这种传染病就可以传遍整个人群,而R0小于1的传染病则趋于消失。
疾病控制中心必须依据对R0的估计来指导政策制定。
疫苗接种阈值随R0的增加而提高。
疫苗接种阈值:V≥R0-1/R0
例如,脊髓灰质炎的R0为6,因此为了防止脊髓灰质炎的传播,疫苗必须覆盖5/6的人群。
如果传染病传播的概率超过了1/4,传染病就会蔓延。
辐射型网络
第一个患上传染病的节点可能是中心节点,也可能是外围节点。如果中心节点患上了某种传染病,那么它可以将传染病传播到任何一个其他节点。我们预计这种传染病会扩散,即便传播的概率很低也是如此。
如果中心节点患上了传染病,那么即使传播的可能性很小,传染病也会蔓延。
流行病学家们将位置在度很高的中心节点上的人称为“超级传播者”(superspreaders)。超级传播者加速了艾滋病和SARS的早期传播。超级传播者不一定是社交明星或“人脉”特别广的人,可能从事某种特定的行业职业,比如收费站的收费员、银行柜员、牙科医生,这类职业使他会与属于不同社交网络的人接触。
高度数节点不但能够更快地传播传染病,而且会更快地患上传染病。如果一个人朋友的数量是另一人的三倍,那么他患上传染病的可能性也是后者的三倍,同时传播这种传染病的可能性也是后者的三倍。因此,他对传染病传播的总贡献将是另一个人的九倍。
一对多
尽管SIR模型原本是用来分析传染病传播的,但是我们也可以将它应用于所有先通过扩散传播,然后趋于消失的社会现象,例如书的销售、歌曲的流行、舞步的风行,“热词”的传播、食谱和健身方法的流传等。
成功可能取决于非常微小的差异,正如美国作家约翰·厄普代克(JohnUpdike)在描述棒球明星特德·威廉姆斯(Ted Williams)最后一次击球时所说的:“一件事情做得很好与搞砸了之间,只有极其细微的差异。”
假设你构思了一个新的笑话;只要让这个笑话更有趣一点点,就可能会把R0推到高于1的水平,从而使这个笑话广泛传播开来。同样的逻辑也适用于想法的“黏性”。如果一个想法能够在人们的思维中再坚持一小段时间,那么他们摆脱它的“痊愈”率就会降低,从而提高了R0。
在SIR模型中,我们推导出了两个关键阈值,即R0和疫苗接种阈值。这两个阈值都是属于敏感依赖于环境的临界点,环境(情境)中的微小变化都会对结果产生很大的影响。
要想扭转肥胖这种流行病,我们必须降低它的R0。而要降低R0,则可以通过降低接触概率或者提高分享概率和痊愈概率来实现。
12| 熵:对不确定性建模
信息是不确定性的解。——克劳德·香农(Claude Shannon)
熵是对不确定性的一个正式测度。利用熵,我们可以证明不确定性、信息内容与惊喜之间的等价性。低熵对应于低不确定性,同时揭示的信息很少。而在高熵系统中,比如在抽奖时抽中了某个数字,结果是不确定的,并且实现的结果能够揭示信息。在这个过程中,我们经历了惊喜。
我们还可以使用熵来表征分布。在没有控制或调节力量的情况下, 一些群体可能会向最大熵漂移。
信息熵
熵是用来度量与结果的概率分布相关的不确定性的。因此,它也可以衡量意外。
熵与方差不同,方差度量一个数值集合或数值分布的离散程度。不确定性与离散程度有关,但是两者并不是一回事。在具有高不确定性的分布中,许多结果的概率都是有意义的,这些结果并不一定有数值,具有高离散度的分布则只是具有一些极端的数值。
熵在数学上等于概率与它们的对数之和的相反数。
对于信息熵,可以把它理解为根据随机抛硬币的结果来衡量不确定性的一种方法。
熵的实证含义和规范含义
我们想要多少熵,取决于具体情况。在制定税法时,我们可能需要一种均衡行为模型,并不希望有随机性。在规划城市时,我们可能会希望看到复杂性,均衡或者周期性都会显得过于平淡。我们希望一个城市充满生机活力,为偶然的相遇和互动提供无限机会。在这种情况下,更多的熵会更好,但是又不能太多。我们不喜欢随机性,随机性会使计划变得非常困难,并可能导致我们的认知能力崩溃。最理想的情况是,世界会产生适度的复杂性,以保证我们生活在一个有趣的时代。