数学建模
人气:
【字体:大 中 小】
发布时间:2005-09-19 08:32:19
>>>>>>>>提问2006高教社杯全国大学生数学建模竞赛题目
(请先阅读 “对论文格式的统一要求”)
休 闲 居 编 辑
B题: 艾滋病疗法的评价及疗效的预测
艾滋病是当前人类社会最严重的瘟疫之一,从1981年发现以来的20多年间,它已经吞噬了近3000万人的生命。
艾滋病的医学全名为“获得性免疫缺损综合症”,英文简称AIDS,它是由艾滋病毒(医学全名为“人体免疫缺损病毒”, 英文简称HIV)引起的。这种病毒破坏人的免疫系统,使人体丧失抵抗各种疾病的能力,从而严重危害人的生命。人类免疫系统的CD4细胞在抵御HIV的入侵中起着重要作用,当CD4被HIV感染而裂解时,其数量会急剧减少,HIV将迅速增加,导致AIDS发作。
艾滋病治疗的目的,是尽量减少人体内HIV的数量,同时产生更多的CD4,至少要有效地降低CD4减少的速度,以提高人体免疫能力。
迄今为止人类还没有找到能根治AIDS的疗法,目前的一些AIDS疗法不仅对人体有副作用,而且成本也很高。许多国家和医疗组织都在积极试验、寻找更好的AIDS疗法。
现在得到了美国艾滋病医疗试验机构ACTG公布的两组数据。 ACTG320(见附件1)是同时服用zidovudine(齐多夫定),lamivudine(拉美夫定)和indinavir(茚地那韦)3种药物的300多名病人每隔几周测试的CD4和HIV的浓度(每毫升血液里的数量)。193A(见附件2)是将1300多名病人随机地分为4组,每组按下述4种疗法中的一种服药,大约每隔8周测试的CD4浓度(这组数据缺HIV浓度,它的测试成本很高)。4种疗法的日用药分别为:600mg zidovudine或400mg didanosine(去羟基苷),这两种药按月轮换使用;600 mg zidovudine加2.25 mg zalcitabine(扎西他滨);600 mg zidovudine加400 mg didanosine;600 mg zidovudine加400 mg didanosine,再加400 mg nevirapine(奈韦拉平)。
请你完成以下问题:
(1)利用附件1的数据,预测继续治疗的效果,或者确定最佳治疗终止时间(继续治疗指在测试终止后继续服药,如果认为继续服药效果不好,则可选择提前终止治疗)。
(2)利用附件2的数据,评价4种疗法的优劣(仅以CD4为标准),并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间。
(3) 艾滋病药品的主要供给商对不发达国家提供的药品价格如下:600mg zidovudine 1.60美元,400mg didanosine 0.85美元,2.25 mg zalcitabine 1.85美元,400 mg nevirapine 1.20美元。如果病人需要考虑4种疗法的费用,对(2)中的评价和预测(或者提前终止)有什么改变。
>>>>>>>>休闲养生网回答:统计回归模型
班级: 八班
姓名: 罗军
学号:1033710812
摘要:
当人们对研究对象的内在特征和各因素间的关系有比较充分的认识时,一般用机理分析方法建立数学模型,如果由于客观事物内部规律的复杂性及人们认识程度的限制,无法分析对象内在的因素关系,建立合乎机理规律的数学模型,那么通常的办法是搜集大量的数据,基于对数据的统计分析去建立模型,建立统计回归模型。医药上的药物疗效也是通过大量的实验得出的数据来分析药物的作用的,下面我们就此建立统计回归数学模型来进行合理的分析。
关键词:
疼痛减轻时间,用药剂量,性别,血压组别
一 问题的提出:
一个医药公司的新药研究部门为了掌握一种新止痛剂的疗效,设计了一个药物试验,给患有同种疾病的病人使用这种新止痛剂的以下4个剂量中的某一个:2g,5g,和 10g ,并记录每个病人病痛明显减轻的时间。为了了解新药的疗效与病人性别和血压有什么关系,试验过程中研究人员把病人按性别及血压得低,中,高三档平均分配来进行测试,通过比较每个人病人的血压历史数据,从高到低分称三组,分别计作0.25,0.50,0.75。实验结束后,公司的记录结果见下表(性别以0表示女,1表示男)
请根据这些数据为公司建立模型,根据病人的用药剂量,性别和血压组别,预测出服药后病痛明显减轻的时间
病人序号 疼痛减轻时间 用药剂量 性别 血压组别
1 35 2 0 0.25
2 43 2 0 0.5
3 55 2 0 0.75
4 47 2 1 0.25
5 43 2 1 0.5
6 57 2 1 0.75
7 26 5 0 0.25
8 27 5 0 0.5
9 28 5 0 0.75
10 29 5 1 0.25
11 22 5 1 0.5
12 29 5 1 0.75
13 19 7 0 0.25
14 11 7 0 0.5
15 14 7 0 0.75
16 23 7 1 0.25
17 20 7 1 0.5
18 22 7 1 0.75
19 13 10 0 0.25
20 8 10 0 0.5
21 3 10 0 0.75
22 27 10 1 0.25
23 26 10 1 0.5
24 5 10 1 0.75
二 模型分析与假设:
从我们所得到的数据可以分析出疼痛减轻时间与血压,用药量,性别有关系。
设疼痛时间为Y,用药量为x1,血压为x2,性别为x3。数据中同列相同值但是疼痛时间不同,这说明疼痛时间的确是与我们索要找的三个因变量有关的。
下面,我们利用matlab工具来分析一下Y与 三个变量的关系
其中红色代表x2与Y之间的关系,绿色代表x1与Y之间的关系,蓝色代表x3与Y之间的关系。
从上面的图,我们估计Y与x1,x2,x3之间是一个非常复杂的关系,这是一个多元的关系,这样我们假设一个数学模型:
Y=b0+ b1*x1^(-1) +b2*x2+b3*x3 +b4*x2.^2+b5*x1.^2+b6*x1*x2+b7*x3*x2+b8*x1*x3+ε
模型就这样假设了。
三 模型的建立与求解
Y=b0+b1*x1^(-1) +b2*x2+ b3*x3 +b4*x2.^2+b5*x1.^2+b6*x1*x2+b7*x3*x2+b8*x1*x3+ε这样一个模型是否合理,需要我们求证。用matlab下的regress命令求结果
初次求出来的结果为
B = [b bint] =
13.662 -5.6564 32.98
42.81 17.188 68.432
23.428 -52.668 99.524
3.439 -10.701 17.579
0.011172 -0.13567 0.15801
12 -59.606 83.606
-5.3213 -8.8549 -1.7877
-20 -40.671 0.67096
1.7602 0.31369 3.2067
R=[r rint]=
-4.0578 -10.85 2.7348
-1.5042 -9.9542 6.9459
3.5495 -3.3525 10.452
5.9829 -0.33157 12.297
1.5365 -6.9187 9.9917
-6.4098 -12.625 -0.19447
3.5415 -5.1727 12.256
3.0861 -6.107 12.279
1.1308 -7.7466 10.008
-0.69838 -9.6193 8.2225
-4.1537 -13.195 4.8877
4.891 -3.5476 13.33
1.3802 -7.7566 10.517
-5.4144 -14.475 3.6458
-2.7091 -11.695 6.2764
-5.3799 -14.004 3.2443
-2.1746 -11.648 7.2986
4.5307 -4.1953 13.257
0.63615 -6.5528 7.8251
0.83246 -7.6901 9.355
-0.47123 -7.7354 6.793
-1.4045 -8.5766 5.7675
7.7918 0.47479 15.109
-4.5119 -11.348 2.3241
Stats =[ 0.91844 21.113 7.7489e-007]
从中我们可以看出,R.^2值为91.844%,F值为21.113。R^2的值还不够合符要求,而F却很小,这样我们建立的模型不太符合要求。我们可以用残差分析,来建立相对较好的模型。于是,我们考虑是否其中有的项不需要呢,或者还需要添一些项呢。然后我们用stepwise的命令来进行分析:
当我们建立Y= b0*x0+ b1*x1.^(-1) +b2*x2 +b3*x3 +b4*x2.^(-1) +b5*x1.*x2 +b6*x1.*x3 b7*x2.*x3统计模型时,进行残差分析
所得的最好的残差的效果图为
这时,R.^2=91.0316% F = 36.5407,这样F的值大一点了,残差分析说明b0,b3,b4的值为0,他们的对应项对目标函数的影响很少,可以忽略不计。
但是我们是否能找到更好的模型来取代当前所求得的这个模型呢,因为F的纸还不是很合理。
我们继续分析题中要求。题中用药量根据常识应该是跟疼痛时间成反比,因为用药量越少,疼痛时间越大。还有,血压大的话,疼痛时间应该越大。另外血压应该是与性别有联系的,
当我们建立Y= b0*x0+ b1*x1+b2*x2 +b3*x3+ b4*x2.^2 +b5*x1.*x2 +b6*x1.*x3 b7*x2.*x3+b8*x.^2 统计模型时,进行残差分析,所得的结果如图所示
明显比刚才的数据要好很多了,我们继续对此模型进行调整,或许能够找到一组比如上图形更好的数据。
继续查找后,所得又一结果如图
从上图我们可以看出,R^2 = 94.0512% , F = 56.9166,这又是一个好的数据结果,
依此图建立的数学模型为
Y= b0*x0+ b1*x1+b2*x.1^2+ b3*x2.^2 +b4*x1.*x2 +b5*x1.*x3 + b6*x2.*x3
这说明,疼痛的时间与用药量成二次项关系,与血压成二次项关系,模型中含有所有变量的交叉项。
而对其他模型
如Y= b0*x0+ b1*x1.^(-1)+b2*x2 +b3*x3+ b4*x2.^2 +b5*x1.*x2 +b6*x1.*x3 b7*x2.*x3+b8*x.^2
所得的结果如下图
这样的结果明显较上面结果不好。
R.^2 很小。
所以我们确定了模型
Y= b0*x0+ b1*x1+b2*x.1^2+ b3*x2.^2 +b4*x1.*x2 +b5*x1.*x3 + b6*x2.*x3
再来看看它的置信区间
bint=
43.642 61.974
-10.213 -3.9083
0.28145 0.74077
24.195 60.862
-10.151 -4.5978
0.43864 1.4715
所有的系数的置信区间不通过原点,且数据比较合理,
再看残差
r =
-4.7019
-0.98862
1.4086
5.388
-2.8987
1.4985
2.2782
4.5224
1.4506
0.50291
-5.2529
-2.3247
0.82047
-2.248
0.36743
-1.8649
0.066566
1.682
-4.5328
0.92964
1.0761
-0.083352
9.3791
-6.4745
每个数据的大小不是很大,这样那么我们将所有变量的实际值拿出来建立实际模型
Y= 52.808-7.0608*x1+0.51111*x.1^2+ 42.528*x2.^2 -7.3746*x1.*x2 +0.95506*x1.*x3
这个模型基本上是满足要求的。
所以我就确定了该模型。
四 模型结果
Y= 52.808-7.0608*x1+0.51111*x.1^2+ 42.528*x2.^2 -7.3746*x1.*x2 +0.95506*x1.*x3
五 模型应用
当利用此模型来求疼痛时间时,只要给了我们三个变量基本的数据,我们可以很好的求出结果来。
比如 x1 = 2 x2 = 0.5 ,x3 = 0
则 Y = 40.7308 与所给数据 43 相差不大,模型得到很好的应用。
《数学建模》
出版社:高等教育出版社 作者:姜启源 谢金星 叶 俊
骆吉洲老师的课件 MATLAB软件简介 数学建模课件
≡ 查看、发表评论 ≡