当前位置: 首页 > 数据观点 > 正文

生存分析简介

生存分析是对生存时间进行分析的统计技术的总称。生存时间(Survival Time),也称为寿命时间(Life Time)、失败时间(Failure Time)或生存数据(Survival Data),定义为从某一起点开始到所关心事件发生的时间。

1、事件(Event)
事件指由研究者所规定的生存时间的终点。例如,在医学研究中,事件可以指死亡、疾病的复发;在工业上,事件可以指机器发生故障。有一点需要指出的是,这里指的事件既可以是消极的也可以是积极的,只要是研究关系的事件都是可以。

2、生存时间(Survival Time)
生存时间是指从某一起点开始到所关心事件发生的时间。对于这个概念“生存”不是严格意义中的生物体的生与死,而是指我们研究关系的某个事件或某种状态的发生。它可以是生病、死亡,也可以是指刮风、下雨,也可以是电脑出现故障等等。而概念中的“时间”也不一定是就是严格指定是Time,也可以是其他的度量单位,比如汽车形式的里程数,硬盘的读写次数等。

3、删失(Censoring)
删失也被称为失访,删失是指由于所关心事件的发生未被观测到或无法被观测到以至生存时间无法被准确记录下来的情况。删失包括右删失、左删失、期间删失。

4、生存函数(Survival Distribution Function)
生存函数(简称SDF)的定义为随机变量T越过时点t的概率。当t=0时,生存函数的取值为1,随着时间的推移(t逐渐增大),生存函数的取值逐渐减小。因此,生存函数是时间t的单调递减函数(严格地说应为单调不增加函数)。生存函数的数学表达式为:

S(t)=Pr(T>t)

其中,S(t)表示生存函数,T为随机抽取的研究对象的生存时间。生存函数的估计方法为非参数方法,常用的方法有Kaplan-Meier法(也称乘积极限法Product-Limit Method)和寿命表法(Life-Table Method)。

累积分布函数记为F(t),定义为1-S (t),表示随机变量T 未超过时点t的概率。

概率密度函数记为f(t) ,定义为F(t)的导数。

风险函数,记为h(t),定义为f(t) /S(t) , 表示随机变量T己至时点t的条件下,在接下来一瞬间所关心事件发生的概率。风险函数的公式为:

01-风险函数公式

 

累积风险函数公式:

02-累积风险函数公式

风险函数、累积风险函数、生存函数图

生存函数、风险函数、累积风险函数图

本文固定链接: http://datakung.com/?p=419 | 数据控

版权声明:本原创文章由 数据控 于2014年12月31日发表在 数据观点 分类下, 你可以发表评论,并在保留原文地址及作者的情况下引用到你的网站或博客。
转载请注明: 生存分析简介 | 数据控
关键字:

生存分析简介:等您坐沙发呢!

发表评论


快捷键:Ctrl+Enter