不同类型的复杂关系形成都可以以网络模型来表示,而不同的网络具有相似的性质,而且网络内部不同层次也具有一定的相似性。其中的一个重要性质是多层次的幂律分布(以不同的对象构建关系),而且局部的模块的边界/平均距离是一定的。纵向的层级结构在横向结构可以表示为不同的聚类的模块。
我们希望通过对社会网络的性质的研究为生物网络的研究提供一定的方向。因为相对来说这是比较宏观的研究,与我们想要的生物研究的微观层次具有一定的相似性(不同系统可能具有相同的网络拓扑性质),而且其数据比较好获得。
度分布、聚类系数等等统计学的度量是我们各种算法研究的基础。
中心节点是高连接度的节点,这存在着一定的分布,如同分子形成的的能量分布,在网络的概念中,连接度等等的指标也存在着一定的分布,会天然分化出不同的部分。而一个宏观的个体可以在不同分布曲线的不同部位,这可以抽象表示为一定的序列。
将分子看作节点,分子之间的相互作用看作边,而我们已有的各种文献就是对这些作用的数据库,我们认为特定位置的分子的浓度和其变化率可以揭示一定的作用关系。在统计层次,我们知道其会自然地产生一定的分化,从而具有各种分布,如幂律分布。而根据网络的分形结构假设,其分布的函数具有的相似性使得我们倾向于使用指数函数来表示(e^ax的导是其本身e^ax与a的乘积,这是一种自相似性质)。
由于网络的多层次,我们需要找到特定的对象从而形成比较本征的关系其实是一种不动点的寻找,这是一种如同原子层次的基本关系,能够大概率地成立。这样我们才能找到各种漂亮的曲线,如幂律分布就是很好的例证。当然这种关系是可以确信存在的,我们只是需要找到它们,而这需要我们选择特定的对象。其实在不动点的周围也存在着相对高连接度的节点,于是其也可以形成具有一定概率连接的关系,只是可能没有本征的关系那么明显,但也是存在的。
多层次的交互可以组合成为多种可能,其中特定的路径可能相对于其他可能路径更具对环境的适应度,从而能够产生如同干涉的效果,也可以理解为自然选择的适者生存,而在网络中是涌现。
存在局部最优和整体最优的博弈,最终达成的结果是一种均衡。
根据大规模的数据进行一定的分类乃至聚类,这是根据一定的相似性,如分布的模式,位置等等。可以根据一定的判断,即层次内部的连接度高于一定阈值,层次之间的连接度低于一定阈值,对这个阈值的选择可以进不同程度的划分。也可以使用距离作为相似性度量。然后构建算法,我们首先需要抽象化为集合的对象,然后选择一定的函数和数学对象作为工具,根据我们想要达到的目的选择一定的语句结构(顺序、循环、分支),然后进行多次计算最终收敛于一定结果。
网络建模,能够以高维的视角来理解各种情况的表达,以分布的层次来理解不同对象之间的联系,从而找到不同对象综合作用对特定对象的高概率影响。寻找特定序列的相关性,如同程序设计的底层变量定义和运算式,在这个基础上往上遍历形成的宏观网络结构可以以很大的精度来比较具体情况。最后能够对各种情况的发生做出良好的推测。
聚类,模块分化,这是网络的分布导致的结果。我们需要不同的统计指标如距离来定量测量。我们倾向于使用概率来解释,如聚类的产生是路径的增强,因为朋友的朋友更趋向于形成新的朋友关系,这是一种分布的基础,如同熵增趋势。
信息的扩散过程可以用于指代其他的层次的信息,如同计算机的就是过程,我们认为这种网络连接可以形成强有力的计算工具。网络结构就是底层,其功能的表达就是一种选择性表达的结果。网络的多层次之间存在竞争博弈,这是一种宏观的运算过程,这是一个马尔科夫过程,是基于一定高维的分布矩阵的选择性表达的序列。
网络的算法开发,快速收敛特定的路径。然后是网络分析
,可视化是一种高维模式的提取。网络的模式识别,网络是对基本数据解释的关系的高维层次的观察,通过一定的变换可以提取出更高维度的信息。网络层次的运算是几何,序列的运算是代数。邻接矩阵对关系的表示,这些矩阵元可以表示为各种基因,从而使得我们能够挖掘可能的模式。
网络结构的拓扑变构,可以发现新的模式,当然在这个过程还保持不变的就是比较本征的对象。这对应于原子的热运动,可以形成一定的稳定状态,即退火形成的能量分布。
网络的大基底的概率连接是具体连接的底层,这是一种期望的运算,比如说我们只有认识足够多的人才可能拥有少数朋友。
连接的度,可以具有一定的方向,可以考虑其拓扑变化形成的新关系,就是我们对应的序列运算的结果。我们还可以考虑其他的统计指标来指代其网络性质。
多层次的考虑,具体的网络经过,高连接的少数节点比低连接的多数节点更具价值,但必须达成一定的均衡,网络不允许极端。我们必须和整体社会挂钩才能成长,即避免形成孤立节点。虽然作为边界可能是网络的一种分布。
建立网络模型
喜欢学医路漫漫请大家收藏:(m.dmshu.win),耽美读书网更新速度最快。