网络侧估计终端用户视频体验建模
摘要
现代社会,使用手机APP观看视频已经成为当代社会的一种普遍形式,本文依据统计回归方法,对网络侧变量和用户体验变量之间的函数关系进行拟合,令其余无关变量均近似地服从正态分布。采用多重拟合方式拟合出不同的评价函数,并进行误差检验。选择误差最小的评价函数。并基于评价函数,两个用户体验变量进行预测。
同时对用户观看视频体验进行综合评价,采用多级指标,运用AHP及模糊综合评价法评价用户观看视频的满意度。求出权重,建立评价矩阵。得到用户观看视频满意度处在较满意和一般满意之间。
最后,由于多种原因,本文建立的用户体验变量评价函数具有一定程度的误差,因此基于原有数据,建立灰色系统模型,再次进行预测,比较结果。建立GM(1,1)模型对相关指标进行预测,取预测区间长度为100,得出预测值,并绘制残差图对预测值进行检验。并与评价函数预测结果进行对比。验证评价函数的正确性。同时得到结论,基于原始数据直接建立灰色系统,预测相对更加准确。
关键词:统计回归;综合评价;灰色预测;残差检验
一.问题重述
随着科技的日益进步,无线宽带网络也随之无限升级。智能终端在大众生活中普及,越来越多的用户选择在智能终端上(以手机为主)应用客户端APP来观看网络视频,这是一种基于TCP(是一种面向连接的、可靠的、基于字节流的传输层通信协议)的视频传输以及播放。在观看网络视频时,有很多因素指标会影响用户对于视频的观看体验,而其中两个关键指标是初始缓冲等待时间和卡顿缓冲时间,我们可以用初始缓冲时延和卡顿时长占比(卡顿时长占比=卡顿时长/视频播放时长)来定量评价用户体验。研究表明影响初始缓冲时延和卡顿时长占比的主要因素有初始缓冲峰值速率、播放阶段平均下载速率、端到端环回时间(E2ERTT)以及视频参数。然而这些因素和初始缓冲时延以及卡顿时长占比之间的关系并不明确。本文拟通过数学建模的方式对网络端视频用户体验做综合评价和预测,以采取针对性的措施提高网络端视频用户体验的满意程度。本文尝试解决以下问题:
1、根据实验数据建立起用户体验评价变量和网络侧变量之间的函数关系。 2、对网络侧终端用户体验进行定量的综合评价。
3、针对网络侧用户体验进行预测。
二.问题分析与思考
本题目附件中提供试验数据共89266组,由于希望提高问题分析的准确性,首先要对数据进行考察,并将不合理数据予以剔除,因此,进行数据的信度与效度检验就必不可少。 2.1数据信度检验
信度检验为判断分析数据结果准确性,即数据结果的可靠性检验。常用的方法有:拉以达准则,Dixon准则以及Crubbs准则法等,然这三种方法都是基于样本大致服从正态分布而给出的,因此,我们采取最常见也是最可信的拉以达准则进行数据的信度检验。
拉以达准则又称3原则,是先假设一组检测数据只含有随机误差,对其进行计算处理得到标准偏差,按一定概率确定一个区间,认为凡超过这个区间的误差,就不属于随机误差而是粗大误差,含有该误差的数据应予以剔除。这种判别处理原理及方法仅局限于对正态或近似正态分布的样本数据处理,它是以测量次数充分大为前提的,由于本模型中测量次数较多,因此拉以达原则在合理范围之内。
图1:统计数据分析结构图
本文利用Matlab软件,将附件中的各指标数据利用程序进行分析以及剔除(详见附录1)。共剔除数据7713组,剩余81553组数据。剔除数据总数小于
,
在合理范围之内。
图2:剔除异常数据后的数据分布结构图
在此后的建模过程中,只针对这81553组数据进行分析。
拉依达准则判断粗大误差的基本思想是以给定的置信概率99.73%为标准,以三倍测量列的标准偏差限为依据,凡超过此界限的误差,就认为它不属于随机误差的范畴,而是粗大误差。含有粗大误差的测量值称为异常值,异常值是不可取的,应该从测量数据中剔除。
用拉依达准则判断和剔除含有粗大误差的异常值时,应先算出等精度独立测量列Xi(i=1,2,…,n)的平均值
,残余误差
的残余误差
,并按贝塞尔公式算出该测
,满足
量列的标准偏差S,如果某测量值下式达准则 2.2相关方法
,则认为
是含有误差的异常值,须剔除不要。该判别式即为拉依
评价是基于研究对象的某些属性(指标),将之变为客观客观定量计值或者主观效度的行为。本文介绍几种本文涉及的方法: (1)统计回归分析法
由于客观事物内部规律的复杂性以及人们认识程度的限制,无法准确的分析实际对象内在的因果关系,因此需要建立合乎机理规律的数学模型。动态测量数据的数学处理问题大多可以转化为回归分析问题。确定变量之间的数学关系式并对其进行可信度检验。根据所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值。并给出这种预测却控制的精确程度。 (2)层次分析法(AHP)
层次分析法指的是将决策问题的有关元素分解成目标、准则、方案等层次,在此基础上进行定性分析和定量分析的一种决策方法。它的特点是对复杂决策问题的本质、影响因素及内在关系等进行深入分析后,构建层次结构模型,把决策的思维过程数学化,进而提供一种简单的决策方法。层次分析法的结果合理性较大,在本文中也会有涉及,用以权重的求解。 (3)模糊综合评价法
客观世界中,存在着许多不确定的现象,这种不确定性主要表现在两个方面:一是随机性,二是模糊性。在概率论研究中,通常以在来描述这种随机性。同样,在
上的取值的分布函数
上取值的隶属函数就描述了事件的模糊性。
模糊数学是描述模糊问题的不可或缺的工具。模糊综合评价同时可以实现模糊识别,模糊分析,模糊聚类以及预测的功能,是一种非常优越的分析方式。由于本题中各指标之间的关系并不明确,其具有模糊性,因此本文主要采用模糊分析来对该问题进行综合评价。 (4)灰色预测法
灰色预测是通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型从而预测事物未来发展趋势的状况。预测某一特征量或达到此特征量的经历时间。
三.模型基本假设
1,假设用户观看视频时,在网络传输速率基本一致的情况下,视频卡顿的出现是随机的;
2,假设卡顿时长与在同一网络环境下,使用客户端观看视频的人数基本成线性的正比关系;
3,经过剔除后的统计数据真实可信且抽样样本能够完全反应总体的特征; 4,假设除网络侧变量和用户体验变量外的其余变量均近似地服从正态分布。
四.基本符号说明
:自变量与因变量间的回归模型系数,:子变量与子变量间的回归模型系数,
; ;
;
模糊综合评价因素集,,各因素,
模糊综合评价评语论域(评价集),
判断矩阵;
模糊关系矩阵;
权重向量; 综合评价矩阵。
;
五.模型的建立与求解
5.1统计回归模型
统计回归是基于数据的统计分析,对于内部规律具有复杂性的客观事物,建立合乎机理的数学模型,其基本思路结构如下:
现实问N分类研修统计检Y应结构简相关分预测决提炼问根据定性理论设置收集整根据目标和进行统计计算 图3:统计回归模型结构流程图
由于采样数据的随机性,在上步利用拉以达原则剔除后,以现有的数据进行分析。首先进行标准化处理。
数据的标准化(normalization)是将数据按照一定规则缩放,使之落入一个小的特定区间。这样去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。其中最典型的就是0-1标准化和Z标准化,当然,也有一些其他的标准化方法,用在不同场景。本文采用Z-score标准化(标准差标准化)。转化函数为:
。其中为所有样本
数据的均值,为样本数据的标准差。经过Z-score标准化后,变量的平均值为0,标准差为1。为了数据处理的简便性,将均值迁移到1。 5.1.2模型建立与求解
1、针对初始缓冲时延的回归模型 (1)模型的建立
记用户体验变量分别为(初始缓冲时延),(卡顿时长占比);网络侧变量分别为(初始缓冲峰值速率),(播放阶段平均下载速率),(E2ERTT)。 首先,为了能大致的分析与,,之间的关系,利用剔除后的数据分别作出对,,的散点图。
图4:对的散点图
图5:对的散点图 图6:对的散点图
从图4中可以发现,对有比较明显的反比关系,对虽然较为模糊,但大体上则类似于一次或二次函数关系,对关系比较模糊,但大体上呈现一种线性关系。综合以上分析,建立如下的回归模型:
经过多次利用MATLAB软件多次拟合实验,最终选择如下的回归模型:
其中,,,即为回归变量,而影响的其他因素均包含在随机误差中,应大致的服从均值为零的正态分布。 (2)模型的求解
直接利用MATLAB统计工具箱中的命令regress求解:
[b,bint,rint,stats]=regress(y,x,alpha) 输入回归模型中的数据(n维向量形式),为对应于回归系数
的数据矩阵,alpha为置信水平(缺省时
出是的估计值,常记作,bint是的置信区间,为残差向量
),输,rint为
r的置信区间,stats为回归模型的检验统计量,有三个值,第一个是回归方程
的决定系数的概率值。
(是相关系数),第二个是的统计量值,第三个是与统计量对应
针对以上回归模型的回归系数估计值及其置信区间(取置信水平验统计量
,,的结果如下: 参数 ),检
表1:统计模型(1)的求解结果 参数估计值 参数置信区间 -596.7539 [-601.1,-592.25] 718.6450 -115.8773 1215.3 [712.9,724.3] [-139.2,-92.6] [119.16,123.9] =0.8641=54467<0.0000001 (3)结果分析与预测 表1显示,
=0.8641指的是因变量的86.41%可由模型确定,值远远超过检
验的临界值,远小于,因此以上模型整体来看是可用的。 表1中的回归系数给出了以上模型
的估计值,即=-596.7539,
=718.6450,=-115.8773,=1215.3,检查置信区间后发现,没有参数的置信区间内包含零点,表明回归变量对估计值都是显着的。
将回归系数的估计值代入上述模型,即可预测用户体验变量(初始缓冲时延)的预测值,得到预测方程:
因此,依据以上方程,就可以预测用户体验变量(初始缓冲时延)的预测值,使用MATLAB软件,预测出100组数据,由于数据过于庞大,只节选几组放在这
里。
表2:统计模型的预测结果(节选)
初始缓E2ERTT(播放阶初始缓冲峰值ms) 段平均冲时延速率速率(ms) (kbps) (kbps) 49450 54 3719 1108 50517 52 5902 1095 47988 47 5806 1051 56457 55 5978 1099 56690 54 5931 1133 74000 58 6212 1132 58178 54 6146 1020 66762 58 6154 1029 48445 57 6127 1133 经过统计,预测合理的数据为86%,与结果分析中测结果残差图
预测 1085.936368 1029.70971 948.4334083 1111.962852 1101.852193 1280.115924 1109.395913 1225.807954 1073.506341 的取值基本一致。以下是预
图7:模型(1)预测结果残差图
由残差图可知,预测值基本符合相应指标的置信区间,因此,预测方程基本合理。 2、针对卡顿时长占比的回归模型
按照上部的原有步骤,记用户体验变量分别为(初始缓冲时延),(卡顿时长占比);网络侧变量分别为(初始缓冲峰值速率),(播放阶段平均下载速率),(E2ERTT)。
首先,为了能大致的分析与,,之间的关系,利用剔除后的数据分别作出对,,的散点图。
图8,对的散点图 图9:对的散点图
从图7,图8可以明显的看出来,对的函数关系并不明确,而对之间的关系几乎是杂乱无章的,根本无法选择合适的拟合函数,经多次试验,最高拟合度仅有34%。因此,,,与之间无法拟合出一个合适的函数。 (1)模型的建立
基于模型(1)中的方程,可取播放阶段平均速率为,初始缓冲时延为,VMOS为,视频全程感知速率为,视频码率。经过多次试验,得到与之间近似的服从一种正比关系。于是得到回归模型如下:
其中,,,,,
即为回归变量,而影响的其他因素均包含在随机误
差中,应大致的服从均值为零的正态分布。
(2)模型的求解
直接利用MATLAB统计工具箱中的命令regress求解:
[b,bint,rint,stats]=regress(y,x,alpha) 输入回归模型中的数据(n维向量形式),为对应于回归系数
的数据矩阵,alpha为置信水平(缺省时
),输出是的估计值,常记作,bint是的置信区间,为残差向量,rint为r的置信区间,stats为回归模型的检验统计量,有三个值,第一个是回归方程的决定系数
(是相关系数),第二个是的统计量值,第三个
是与统计量对应的概率值。
表3:统计模型(2)的求解结果 参数 参数估计值 -0.0015 -0.0361 -0.3897 0.0015 0.0241 0.4023 参数置信区间 [-0.0016,-0.0013] [-0.0361,-0.0361] [-0.3900,-0.3894] [0.0013,0.0016] [0.0236,0.0245] [0.4017,0.4028] =0.9901=163730<0.000000001 (3)结果分析 表3显示,=0.9901指的是因变量的99.01%可由模型确定,拟合度非常高。值远远超过检验的临界值,远小于,因此以上模型是合理的。
表3中的回归系数给出了以上模型的估计值,即=-0.0015,
=-0.0361,=-0.3897,=0.0015,=0.0241,=0.4023。检查置信区间后发现,没有参数的置信区间内包含零点,表明回归变量对估计值都是显着的。 (4)自变量间的拟合分析
由于我们选择的回归变量并不完全是题目中给定的回归变量,于是,我们需要对回归变量进行分析。
由于播放阶段平均速率是题目中给出的网络侧变量,同时,根据模型(1),初始缓冲时延能够和三个网络侧变量建立函数关系。因此,我们只需要给出VMOS,视频全程感知速率与网络侧变量间的关系。VMOS表示视频流的传输,它与初始缓冲时延近似的成反比关系,我们利用MATLAB软件,尽量通过多元函数建立拟合关系。
为节约篇幅,具体步骤的分析过程略。经过多次拟合尝试,以VOMS为因变量,视频全程感知速率与播放阶段平均速率分别为自变量,利用多项式函数进行拟合,拟合结果如下表:
表4:变量间的拟合结果 参数 参数估计值 参数置信区间 1.523e+04 [1.436e+04,1.61e+04] -1.027e+04 -2.107 2796 0.7789 -329.1 [-1.099e+04,-9562] [-2.322,-1.893] [2796,2796] [0.7789,0.7789] [7.112e-10,2.919e-09] =0.95<0.000000001 同样,表4给出了回归模型系数的估计值,检查置信区间后发现,没有参数的置信区间内包含零点,表明回归变量对估计值都是显着的。=0.95指的是因变量的95%可由模型确定,拟合度非常高。远小于,因此以上模型是合理的。 于是,我们根据上表给出的数据,得到回归方程如下:
下图为拟合的散点图:
图10:自变量间二元拟合散点图(1)
以下的过程与上面的类似,在实际生活中,视频码率与视频流(即VOMS)之间有着相应的客观关系,因此,近似的取视频码率和VOMS之间为正比关系,则亦可描述相应变量之间的关系。
最后,关于初始缓冲峰值速率,初始缓冲时延()与VOMS()之间的函数关系拟合过程不再赘述,以下给出拟合结果和散点图。 得到的方程为:
=0.8576。基本符合要求。拟合散点图如下;
图11:自变量间二元拟合散点图(2)
(5)模型预测与误差
根据以上的分析过程,就可以预测用户体验变量(卡顿时长占比)的预测值,使用MATLAB软件,预测出100组数据,以下是数据的残差图。
图12:模型(2)预测残差图
由残差图可知,预测值基本符合相应指标的置信区间,因此,预测方程基本合理。 5.2模糊综合评价模型
模糊综合评价是基于模糊数学,对各指标之间具有模糊性的变量进行评价的评价方法,其一般思路如下:
确定评确定隶确定权计算权确定隶形成判模糊综评价结 图13:模糊综合评价流程图
由于数据的信度检验和剔除工作已经完成,因此建模的第一步由确定各指标的权重开始。
5.2.1层次分析法(AHP)确定权重
1、层次分析法
思维过程数学化,从而为多目标、多准则或无结构特性的复杂决策问题提供简便的决策方法。尤其适合于对决策结果难于直接准确计量的场合。 2、层次分析法的步骤
(1)、确定目标和评价因素
P个评价指标,u??u1,u2,LL,up?。
(2)、构造判断矩阵
判断矩阵元素的值反映了人们对各元素相对重要性的认识,一般采用1—9及其倒数的标度方法。但当相互比较因素的重要性能够用具有实际意义的比值说明时,判断矩阵相应元素的值则取这个比值。即得到判断矩阵S??uij?。
p?p(3)、计算判断矩阵
表5元素相对重要性的比例标度
含义 两个元素相比同等重要 两个元素相比,前者比后者略为重要 两个元素相比,前者比后者相当重要 两个元素相比,前者比后者明显重要 两个元素相比,前者比后者绝对重要 上述相邻判断的中间值 若元素i与元素j相比的aij,则元素j与元素i相比得1/aij 利用Mathematic软件计算判断矩阵S的最大特征根?max,及其对应的特征向量标度 1 3 5 7 9 2,4,6,8 倒数 A,此特征向量就是各评价因素的重要性排序,也即是权系数的分配。 4、一致性检验
为进行判断矩阵的一致性检验,需计算一致性指标
平均随机一致性指标RI。它是用随机的方法构造500个样本矩阵,构造方法是随机地用标度以及它们的倒数填满样本矩阵的上三角各项,主对角线各项数值始终为1,对应转置位置项则采用上述对应位置随机数的倒数。然后对各个随机样本矩阵计算其一致性指标值,对这些CI值平均即得到平均随机一致性指标RICI?0.10时,认为层次分析排序的结果有满意的值[12]。当随机一致性比率CR?RI一致性,即权系数的分配是合理的;否则,要调整判断矩阵的元素取值,重新分配权系数的值。
查找一致性指标RI参考表平均随机一致性指标
表6平均随机一致性指标
n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
0.0.1.1.1.1.1.1.1.1.1.1.1.58 90 12 24 32 41 45 49 51 54 56 58 59
指标权重求解的层次分析法步骤: 指标权重,我们采用层次分析的方法求出指标权重。构造判断矩阵S??uij?p?p即:
0 0
视频等待时间 视频播放速率 视频等待时视频播放速间 率 1 4 1/4 1 用户体验 1/2 2 传输效率与设备 3 4 用户体验 2 1/2 1 3 传输效率与1/3 1/4 1/3 1 设备 用MATLAB软件计算判断矩阵S的最大特征根得?max?4.1179。为进行判断矩阵的一致性检验,需计算一致性指标:
平均随机一致性指标RI?0.9。随机一致性比率:
因此认为层次分析排序的结果有满意的一致性,即权系数的分配是非常合理的。
表7:一级指标权重 指标层 权重 视频等待时间 0.1631 视频播放速率 0.4877 用户体验 0.2644 传输效率与设备 0.0848 各项指标权重,我们采用层次分析的方法求出指标权重。构造判断矩阵S??uij?即:
p?p 初始缓冲时延 卡顿时长 2 1 4 初始缓冲1/3 1/4 1 峰值速率 用MATLAB软件计算判断矩阵S的最大特征根得?max? 3.0183。为进行判断矩阵的一致性检验,需计算一致性指标:
平均随机一致性指标RI?0.58。随机一致性比率: 因此认为层次分析排序的结果有满意的一致性,即权系数的分配是非常合理的。
表8:指标层权数分配 指标层 权重 初始缓冲时延 0.3196 卡顿时长 0.5584 初始缓冲峰值速率 0.1220 指标的权重,我们采用层次分析的方法求出指标权重。构造判断矩阵S??uij?即:
p?p播放阶播放阶段平均段总时速率 长 播放阶段平均速率 1 2 播放阶段总时长 1/2 1 用MATLAB软件计算判断矩阵S的最大特征根得?max?2。 初始缓冲时延 1 卡顿时长 初始缓冲峰值速率 1/2 3 表9:两指标权重
指标 播放阶段平均速率 播放阶段总时长 权重 0.6667 0.3333 p?p指标权重,我们采用层次分析的方法求出指标权重。构造判断矩阵S??uij?即:
VMOS 视频码率 卡顿次数 VMOS 1 1/2 1/5 视频码2 1 1/2 率 卡顿次5 2 1 1 数 视频全7 4 1 1 程感知速率 用MATLAB软件计算判断矩阵S的最大特征根得?max?4.0417。为进行判断矩阵的一致性检验,需计算一致性指标:
平均随机一致性指标RI?0.9。随机一致性比率: 因此认为层次分析排序的结果有满意的一致性,即权系数的分配是非常合理的。
表10:二级指标权重(1) 指标层 权重 VMOS 0.0665 视频码率 0.1377 卡顿次数 0.3473 视频全程感知速率 0.4484 指标的权重,我们采用层次分析的方法求出指标权重。构造判断矩阵S??uij?即:
p?p视频全程感知速率 1/7 1/4 E2ERTT E2ERTT 1 2 1/2 初始缓冲下1/4 1/2 1/3 载数据量 播放时长 1/2 2 1 1/2 卡顿占比 2 3 2 1 用MATLAB软件计算判断矩阵S的最大特征根得?max?4.0968。为进行判断矩阵的一致性检验,需计算一致性指标:
平均随机一致性指标RI?0.9。随机一致性比率: 因此认为层次分析排序的结果有满意的一致性,即权系数的分配是非常合理的。
表11:二级指标权重(2)
初始缓冲下载数据量 4 1 播放时长 卡顿占比 指标 E2ERTT 初始缓冲下载数据量 播放时长 卡顿占比 5.2.2建立多级模糊综合评价模型
权重 0.3098 0.0984 0.1800 0.4117 由于各因素与用户体验之间的关系具有模糊性,因此我们需建立模糊综合评价体系。
1、综合评价等级体系
模型附件中给出了华为员工视频体验评价试验数据,共测出13个指标各个员工的评价值。在评价过程中,我们将之分成四大类,包括视频等待时间,视频播放速率,用户体验和传输效率与设备作为一级指标,具体分布如下图:
网络侧终端用户体一视频视频用户视频初卡初播二始顿始放缓时缓阶冲长 冲段播V放M阶O视卡视E频顿频2码次全E初始缓冲播卡放顿时占长 比
段S 率 数 程,图14:综合评价等级指标图
模糊综合评价是以模糊数学为基础。应用模糊关系合成的原理,将一些边界不清,不易定量的因素定量化,进行综合评价的一种方法[1]。评价中存在大量的模糊现象和模糊概念。因此,在综合评价时,常用到模糊综合评价的方法进行定量化处理,取得了良好的效果。但权重的确定需要专家的知识和经验,具有一定的缺陷,为此,本文采用层次分析法来确定各指标的权系数。使其更有合理性,更符合客观实际并易于定量表示,从而提高模糊综合评判结果的准确性。此外,模糊综合评价中常取的取大取小算法,信息丢失很多,常常出现结果不易分辨(即模型失效)的情况。所以,本文提出了针对模糊综合评价的改进模型。另外,本
文在对模糊综合评价结果进行分析时,对常用的最大隶属度原则方法进行了改进,提出了加权平均原则方法。 2、模糊综合评价方法和步骤 1)模糊综合评价方法
模糊综合评价是通过构造等级模糊子集把反映被评事物的模糊指标进行量化(即确定隶属度),然后利用模糊变换原理对各指标综合[9]。 2)评价步骤:
(1)确定评价对象的因素论域
P个评价指标,u??u1,u2,LL,up?。 (2)确定评语等级论域
v??v1,v2,LL,vp?,即等级集合。每一个等级可对应一个模糊子集。 (3)建立模糊关系矩阵R
在构造了等级模糊子集后,要逐个对被评事物从每个因素ui?i?1,2,LL,p?上进行量化,即确定从单因素来看被评事物对等级模糊子集的隶属度?R|ui?,进而得到模糊关系矩阵:
矩阵R中第i行第j列元素rij,表示某个被评事物从因素ui来看对vj等级模糊子集的隶属度。一个被评事物在某个因素ui方面的表现,是通过模糊向量
?R|ui???ri1,ri2,LL,rim?来刻画的,而在其他评价方法中多是由一个指标实际值
来刻画的,因此,从这个角度讲模糊综合评价要求更多的信息[10]。 (4)确定评价因素的权向量
在模糊综合评价中,确定评价因素的权向量:A??a1,a2,LL,ap?。权向量A中的元素ai本质上是因素ui对模糊子?对被评事物重要的因素 ?的隶属度。本文使用层次分析法来确定评价指标间的相对重要性次序。从而确定权系数,并且在合成之前归一化。即?ai?1,ai?0,i?1,2,LL,n
i?1p(5)合成模糊综合评价结果向量
利用合适的算子将A与各被评事物的R进行合成,得到各被评事物的模糊综合评价结果向量B。即:
其中b1是由A与R的第j列运算得到的,它表示被评事物从整体上看对vj等级模糊子集的隶属程度。
(6)对模糊综合评价结果向量进行分析
实际中最常用的方法是最大隶属度原则,但在某些情况下使用会有些很勉强,损失信息很多,甚至得出不合理的评价结果。提出使用加权平均求隶属等级的方法,对于多个被评事物并可以依据其等级位置进行排序。
在本文的综合评价中,对于每一个指标设定五个级别评语,即
并且赋值为
由30位经验丰富的人员对指标价值体系进行评估,由每个专家单
独对指标层的每个指标进行等级打分。由于指标的模糊性,可以综合每个人对该指标的打分次数,得出该指标属于某个评语等级的隶属度,取30位赞同该指标的评语等级的比重为隶属度,从而建立单因素模糊综合评判矩阵,计算结果如下: 视频等待时间的评价向量 视频播放速率的评价向量 用户体验的评价向量 传输效率与设备的评价向量 整体评价向量
整体评价向量的整体评分值
表12:各评价等级评分
V1(很好) 分数 5 4 3 V4(较差) 2 V5(很差) 1 评价等级 V2(较好) V3(一般) 整体评分值为3.1844,介于一般与较好之间。 于是,我们同时得到各项一级指标的评价值如下
视频等待时间的评价值3.2444 视频播放速率的评价值3.2444 用户体验的评价值3.0464
传输效率与设备的评价值3.1537 5.3灰色系统预测模型
由于多种原因,本文建立的用户体验变量评价函数具有一定程度的误差,因此基于原有数据,建立灰色系统模型,再次进行预测,比较结果。 灰色理论认为系统的行为现象尽管是朦胧的,数据是复杂的,但它毕竟是有序的,是有整体功能的。灰数的生成,就是从杂乱中寻找出规律。同时,灰色理论建立的是生成数据模型,不是原始数据模型,因此,灰色预测是一种对含有不确定因素的系统进行预测的方法。
5.3.1灰色预测的相关理论 1、灰色预测的原理
灰色预测通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况。其用等时距观测到的反应预测对象特征的一系列数量值构造灰色预测模型,预测未来某一时刻的特征量,或达到某一特征量的时间。 2、灰色预测的分类
1)灰色时间序列预测;即用观察到的反映预测对象特征的时间序列来构造灰色预测模型,预测未来某一时刻的特征量,或达到某一特征量的时间。 2)畸变预测;即通过灰色模型预测异常值出现的时刻,预测异常值什么时候出现在特定时区内。
3)系统预测;通过对系统行为特征指标建立一组相互关联的灰色预测模型,预测系统中众多变量间的相互协调关系的变化。
4)拓扑预测;将原始数据作曲线,在曲线上按定值寻找该定值发生的所有时点,并以该定值为框架构成时点数列,然后建立模型预测该定值所发生的时点。
由于本题中需要预测两个用户体验变量的取值,以验证评价函数的准确性,因此直接依据原始数据,建立灰色系统预测模型。
灰色系统预测模型是基于一阶常微分方程建立的,故又称为一阶一元微分方程,记为
,由于原始数据均为非负,因此可作一次累加,满足建模要
求。
3、建立灰色预测模型
建立灰色预测模型一般遵循如下思路:
数据预处一次累加生生成数列 列微分方差分代替微分响应数据拟图15:灰色系统预测流程图
1)GM(1,1)模型
精度检 灰色系统理论是由华中理工大学邓聚龙教授于1982年创立的,它是一门渗透性强、应用面极广的新兴横断学科。灰色预测模型以微分方程为描述形式,揭
示灰色信息系统发展的连续过程;并充分利用原始数据序列的有序性及有界性,注重揭示数据集合所具备的潜在规律,不要求对系统信息的完全掌握。 2)GM(1,1)模型建立:
(1):设原始序列x(0)?(x(0)(1),x(0)(2),?,x(0)(n)),为了弱化原始序列的随机性和波动性,为灰色模型提供更加有效的信息,在建立灰色预测模型前,对原始数据进行预处理,通常采用对序列X(0)进行一次累加生成的处理方式,即1-AGO(AccumulatingGenerationOperator),记生成序列为:
x(1)?(x1(1),x1(2),?,x1(n))?(x(0)(1),x(1)(1)?x(0)(2),?,x(1)(n?1)?x(0)(n));
(2):GM(1,1)模型是由一个包含单变量的一阶微分方程构成的动态模型:
x(0)(k)?az(1)(k)?b(k=1,2,3,…,n)
为对x(1)作紧邻均值生成序列z(1);即z(1)(k)?0.5[x(1)(k)?x(1)(k?1)]得
z(1)(k)?(z(1)(2),z(1)(2),?,z(1)(n));k?2,3,?n;
(3):上述第2步中的动态模型的白化方程(也称影子方程)为: 其中a称为发展灰数,b称为内生控制灰数,a的有效区间是(?2,2)。应用最小二
??[a,b]T?(BTB)?1BTY求解可得: 乘法对参数列a?=(a,b)T=(BTB)?1?BT?Yn。 a??1/2(x(1)(1)?x(1)(2)),1???(1)(1)?? 1/2(x(2)?x(3)),1?T (0)(0)(0)Yxxx其中B??,=[(2),(3),…,(n)];n???????1/2(x(1)(n?1)?x(1)(n)),1???(4):确定GM(1,1)模型时间响应序列为:
bb?(1)(k?1)?[x(0)(1)?]e?ak?xaa;
(5):求x(1)的模拟值
????x(1)?(x1(1),x1(2),?,x1(n))?(x(0)(1),x(1)(1)?x(0)(2),?,x(1)(n?1)?x(0)(n));
(6):还原模拟值
?(0)(k?1)?x?(1)(k?1)?x?(1)(k); x(7):检验误差。为确保所建灰色模型有较高的预测精度和可信程度,需要进行残差检验、关联度检验及后验差检验。方法有三种如下:
3)残差检验
?(0)(k)的残差序列e(0)(k)、分别求出x(0)(k)与x相对误差序列?k和平均相对误
差?:
(0)(0)?(0)(k) e(k)?x(k)-x4)后验差检验
求出原始数据平均值x以及残差平均值e:
求出原始数据方差s1、残差方差s2及其均方差比值C和小误差概率P:
22C?s2/s1,P?pe(0)(k)?e?0.6745s1
令?k?e(0)(k)?e,s0?0.6745s1,则P?p??k?s0?。
根据灰色系统理论,通常e(0)(k)、?k、C值越小,P值越大,则模型精度越好。当发展灰数a?[?0.3,2),则所建GM(1,1)模型的一步预测精度在98%以上,2步和5步预测精度都在97%以上,可用于中长期预测。
??C?S2/S1为均方差比值,对于给定的C0?0,当C?C0时,称模型为均
(0)方差比合格模型;P?P(|q(k)?Q|?0.6745S1)称小误差概率;对于给定的
P0?0,当P?P0时,则称为小误差概率合格模型。表8给出了检验精度的等级
划分标准。
精度等级 P C 表13模型精度等级评判标准 一 二 三 >0.95 >0.8 >0.7 <0.35 <0.5 <0.65 四 <0.7 >0.65 (1)初始缓冲时延(ms)预测检验 后验差比(均方差比值):C=0.30966
由于C<=0.35,则此模型精度等级为1级(好)。 计算小误差概率:P=1
由于P>=0.95,则此模型精度等级为1级(好)。
发展系数:a=0.015906 灰作用量:u=2555.5951
由于-a<0.3,则此模型适合用于中长期预测。
图16:灰色预测残差图(1)
(2)卡顿占比预测检验
后验差比(均方差比值):C=0.39917
由于0.35 由于P>=0.95,则此模型精度等级为1级(好)。 发展系数:a=0.058428 灰作用量:u=3103.5906 由于-a<0.3,则此模型适合用于中长期预测。 图17:灰色预测残差图(2) 由残差图我们发现,灰色系统的预测值相比于5.1中的预测方程来说,精度要提高很多,含有误差的预测值很少。因此,灰色系统预测更为准确。 我们预测100组数据,产生如下结果: 表14:灰色系统预测结果 初始缓冲时延(ms)预测值 1416.64 卡顿占比预测值 初始缓冲时延(ms)预测值 卡顿占比预测值 初始缓冲时延(ms)预测值 卡顿占比预测值 初始缓冲时延(ms)预测值 卡顿占比预测值 0.034114 1419.222 0.034088 1421.81 0.034061 1424.402 0.034035 1416.838 0.034112 1419.421 0.034085 1422.009 0.034059 1424.602 0.034033 1417.037 0.03411 1419.62 0.034083 1422.208 0.034057 1424.801 0.034031 1417.235 0.034108 1419.819 0.034081 1422.408 0.034055 1425.001 0.034029 1417.434 0.034106 1420.018 0.034079 1422.607 0.034053 1425.201 0.034027 1417.632 0.034104 1420.217 0.034077 1422.806 0.034051 1425.4 1417.831 0.034102 1420.416 0.034075 1423.006 0.034049 1425.6 1418.03 0.0341 1420.615 0.034073 1423.205 0.034047 1425.8 1418.228 0.034098 1420.814 0.034071 1423.405 0.034045 1426 1418.427 0.034096 1421.013 0.034069 1423.604 0.034043 1426.2 0.034025 0.034023 0.034021 0.034019 0.034017 1418.626 0.034094 1421.212 0.034067 1423.803 0.034041 1426.399 0.034015 1418.825 0.034092 1421.411 0.034065 1424.003 0.034039 1426.599 0.034013 1419.024 1427.999 1428.199 1428.399 1428.6 1428.8 0.03409 0.033999 0.033997 0.033995 0.033993 0.03399 1421.611 1432.609 1432.809 1433.01 1433.211 1433.412 0.034063 0.033952 0.03395 0.033948 0.033946 0.033944 1424.203 1430.001 1430.202 1430.402 1430.603 1430.803 0.034037 0.033978 0.033976 0.033974 0.033972 0.03397 1426.799 1434.617 1434.818 1435.019 1435.221 1435.422 0.034011 0.033932 0.03393 0.033928 0.033926 0.033924 1429 0.033988 1433.613 0.033942 1431.004 0.033968 1435.623 0.033922 1429.2 0.033986 1433.814 0.03394 1431.204 0.033966 1435.824 0.03392 1429.4 0.033984 1434.014 0.033938 1431.405 0.033964 1436.025 0.033918 1429.601 0.033982 1434.215 0.033936 1431.605 0.033962 1436.226 0.033916 1429.801 0.03398 1434.416 0.033934 1431.806 0.03396 1436.428 0.033914 1432.207 0.033956 1432.408 0.033954 1433.211 0.033946 1432.007 0.033958 由此可再次发现,基于原始数据建立的灰色系统预测模型预测精度相对更高。 六.模型的评价 6.1、模型的优点 6.1.1本模型通过通过统计手段来刻画各变量间的函数关系,同时能充分利用多变量同时拟合。使得拟合结果具有更强的拟合度。 6.1.2拟合过程中成功避开无法拟合的变量,并引入新变量达到较高的拟合精度。 6.1.3本模型采用分层指标来进行综合评价,定性方法与定量方法有机地结合起来,使复杂的系统分解,使得评价结果更具有代表性。 6.1.4利用灰色预测预测比较准确,预测方便,且预测时间较长。 6.1.5指标集个数较大时,在权矢量和为1的条件约束下,相对隶属度权系数往往偏小,权矢量与模糊矩阵R不匹配,结果会出现超模糊现象,分辨率很差,无法区分谁的隶属度更高,甚至造成评判失败,在本文中利用AHP分层综合评价加以改进。 6.2、模型的缺点 计算较为复杂,对指标权重矢量的确定主观性较强。 七.模型的优化 7.1、统计模型的优化 多元线性回归模型为: Y?XB?E(1) 其中Y是由m个目标变量n个样本构成的n?m矩阵,n?l矩阵X由二次变量的n个对应样本及其若干滞后观测组成;l?m矩阵B为模型参数;E为误差或残差矩阵.假设有k个二次变量,回归因子中包含二次变量30个滞后采样值(注:二次变量的观测周期与样本周期不同),那么,l?30k,FIR模型参数B是30k?m矩阵. 由于一般情况下回归建模的样本来自于正常生产过程,因此模型的辨识问题往往表现出“病态的”特征.目前可用于解决这类病态模型参数估计问题的方法主要有:主元回归(PCR)、部分最小二乘(PLS)、典型分析回归(CCR)和降秩回归(RRR)等. 上述这些统计回归方法的一个共同特点是统计投影,即:将矩阵X和Y分别投影到由隐变量定义的低维子空间中;然后通过建立隐变量间的低维回归关系,获得Y关于X的“节俭(Parsimonious)”模型.一般说来,降维投影能够“成立”的一个主要原因是:X和Y的组成变量通常是高度互相关的.在此,我们选择PCR主元分析对模型进行优化 PCR是主元分析(PCA)的扩展[8].它包括如下两个步骤.首先是对样本矩阵进行PCA投影或分解,得到分值矩阵T: X?TPT?E(2) 一般地,d??l.然后建立Y关于T的线性回归模型 Y?TQT?F(3) 其中Q为m?d回归矩阵,F为回归误差.将(2)式代入(3)式可得: Y?XPQ?F?XB?F(4) T?其中B?PQT就是主元回归的系数矩阵. 部分最小二乘(PLS)与PCR非常相似.所不同的是,PLS对Y阵也进行降维分解,得到Y?UQT?F.其中U为n?d分值矩阵,Q是m?d负荷矩阵.分值矩阵U和 ?T之间的关系由如下线性回归模型描述 ui?biti?ri(5) 其中ui和ti分别是U和T的第i列向量,bi为标量回归系数,ri为误差向量, i?1?d.Y关于X的回归系数可以由如下公式近似计算 B?WPTW????1QT(6) W的定义可参见PLS算法. PLS实际上是一种非线性循环算法.由于它在每一步都对样本矩阵进行修正;因此很难利用某种简单形式来综合描述这种回归方法.Hoskulds-son的研究表 明,在每个循环当中,PLS实际上是通过极大化Xiwi与Yi的协方差来获得负荷向量的. 实践证明,PLS是一种高效回归建模技术.它能够很好地处理“回归变量强相关”、“样本数据少且受噪声污染严重”等问题.而普通多线性回归(如最小二乘)在处理这些问题时,往往表现出“病态”的特点,如参数估计方差极大、数值算法不收敛等. 维数的确定,是PCR或PLS建模的关键所在.通常我们采用“交叉效用(CrossValidation)”检验来确定合适的降维子空间的维数。 7.2、评价模型优化 在模糊多属性决策过程中,由于评价对象指标复杂性、测度信息模糊抽象性,,人的经验认识局限性,可以采用主观模糊数,它比客观精确数测度更加合适。在此,我们采用一种新的方式——直觉模糊数TOPSIS法,来给出更优的理论方法。直觉模糊数作为模糊集的扩展形式,以隶属程度、非隶属程度和犹豫程度来测定指标优劣,在信息集结基础上将对象择优或者排序,用以指导网络侧用户体验评价工作。下面给出经典思路设计实施流程: 设对象集{A1,A2,???,Am}、指标集{C1,C2,???,Cn}。矩阵???ij,?ij,?ij??m?n为{A1,A2,???,Am}测度。其中对象A1关于指标Cj的主观测度即为直觉模糊度 ??ij,?ij,?ij?,他是一个数组形式,?ij表示Ai?Cj隶属度、?ij表示Ai?Cj的隶属 度、?ij?1??ij??ij表示Ai?Cj的犹豫度。 ???11,?11,?11?????21,?21,?21???????,?,???m1m1m1将对象Ai记为向量形式: ??12,?12,?12???22,?22,?22???????m2,?m2,?m2?; ?????mn,?mn,?mn????m?n? ??1n,?1n,?1n?????2n,?2n,?2n??Ai????i1,?i1,?i1?,??i2,?i2,?i2?,?,??ij,?ij,?ij?,?,??im,?im,?im??。 由矩阵???ij,?ij,?ij???m?n?虚拟构造正、负理想对象: A???1?,?1?,?1?,?2?,?2?,?2?,?,?n?,?n?,?n?, ??___??j?1??j??j,?j?1??j??j。 ????????定义(?ij,?ij),(?kj,?kj)之间的距离: d((?ij,?ij),(?ij,?ij))?(((?ij??kj)2?(?ij??kj)2)?(?ij??kj)/3)1/2。 兼顾权重{?1,?2,...,?n},定义Ai与Ak之间距离: d(Ai,Ak)=(?j?1?j[((?ij??kj)2?(?ij??kj)2)]/3) n由此给出了Ai与A?、A?之间距离,Ai与A?之间贴近度: 2d(Ai,A?)=(?j?1?j[((?ij??j?)2?(?ij???j))]/3) nd(Ai,A-)=(?j?1?j[((?ij??j-)2?(?ij??-j)2)]/3) n类似Ai,所有对象{A1,A2,...,An}均可以计算距离贴近度。越大则越优,可由大小将比较、排序或择优。 另外,基于直觉模糊数测度信息,在理想点构造及投影系数基础上,还可以利用投影寻踪法设计模型。 设向量??(a1,a2,...,an),??(b1,b2,...,bn),则定义?在?上的投影: ?=(???)/???j?1ai?bi/Prj?n?n2??bPrj?越大则说明?越接近于?。 j?1?????以指标Cj为例,由(?ij,?ij,?ij)向(??j,?j,?j)、(?j,?j,?j)计算投影系数: 兼顾权重{w1,w2,...,w3},将Ai向A?、A?向Ai投影: Ajjjijijijiw?PrjPrjAw?Prj??(????);PrjA??jj(?,?,?)-A(?,?,?)j?1j?1(?,?,?)jjjn-n(??,??,??)ijijij。 继续计算Ai,所有对象{A1,A2,...Am}均可以计算投影、贴近度。 ?i越大则Ai越优,可由?i大小将{A1,A2,...,Am}比较、排序或择优。 参考文献 [1].姜启源,数学模型(第三版)[M],北京:高等教育出版社2003 [2].胡国定,张润楚,多元数据分析方法——纯代数方法[M],天津:南开大学出版社2002 [3].秦寿康,综合评价原理与应用(第四版)[M],北京:电子工业出版社2009 [4].(美)MarkM.Meerschaert,刘来福等(译),数学建模方法与分析[M],北京:机械工业出版社2010 [5].卓金武,魏永生,秦健,Matlab在数学建模中的应用[M],北京:北京航空航天大学出版社2010 [6].宋洪文,应用统计[M],北京:高等教育出版社,2003 [7].梁均,徐吉辉,程程,基于灰色模糊评判法的医院改扩建项目安全风险评价[J].中国科技信息,2017,3,4合刊125 [8].温东琰,于光,AHP及模糊综合评价在电子资源评价中的应用[J].现代情报,2006,8(8)68 [9].李士勇,工程模糊数学及应用[M].哈尔滨:哈尔滨工业大学出版社2004 [10].杜智涛,谢新洲,利用灰色预测与模式识别方法构建网络舆情预测与预警模型[J].图书情报工作,2013,8(57) [11].李少阳,普通高等院校课堂教学质量模糊综合评价[D].哈尔滨:哈尔滨工程大学硕士论文. [12].董臻圃,数学建模方法与实践[M].北京:国防工业出版社2010 附录 1,数据剔除代码 x=load('xxx'); n=length(x); subplot(2,1,1); title('原始数据') axis([0,n+1,min(x)-1,max(x)+1]); w=1+0.4*log(n);yichang=abs(x-mean(x))>3*std(x); x(yichang)=[]; saveerrornew.datx-ASCII subplot(2,1,2); plot(x,'rs'); title('异常值剔除后数据'); axis([0,n+1,min(x)-1,max(x)+1]); 2,第一次拟合程序 A=xlsread('data1.xlsx');%这里是处理后的数据 X(:,1)=A(:,1); X(:,2)=A(:,2); X(:,3)=A(:,3); Y1=A(:,4); X1(:,1)=bsxfun(@rdivide,X(:,1),std(X(:,1))); X1(:,2)=bsxfun(@rdivide,X(:,2),std(X(:,2))); X1(:,3)=bsxfun(@rdivide,X(:,3),std(X(:,3))); X1(:,1)=X1(:,1)/mean(X1(:,1)); X1(:,2)=X1(:,2)/mean(X1(:,2)); X1(:,3)=X1(:,3)/mean(X1(:,3)); Y1=Y; X(:,4)=ones(size(Y)); X1(:,4)=ones(size(Y)); [b,bint,r,rint,stats]=regress(Y1,X1); %Y3=b(1)*X1(:,1)+b(2)*X1(:,2)+b(3)*X1(:,3) %fori=1:size(Y) %X3(i)=i; %end %plot(X3,Y1,'r*') %holdon %plot(X3,Y2,'b*') X2(:,1)=X1(:,1).^(-1); X2(:,2)=X1(:,2).^1; X2(:,3)=X1(:,3).^(-1); X2(:,4)=X1(:,4); [b,bint,r,rint,stats]=regress(Y1,X2); disp('下面是相关性R平方') stats(1) disp('F') stats(2) disp('p值') stats(3) disp('s平方') stats(4) %X2(:,1)=X(:,1).^(-1); %X2(:,2)=X(:,2).^1; %X2(:,3)=X(:,3).^(-1); %[b,bint,r,rint,stats]=regress(Y1,X2); %stats(1) D=X1(:,1); figure(1) plot(D,Y1,'k*') title('初始缓冲峰值速率(kbps)和初始缓冲时延(ms)')%图形加标题 figure(2) E=X1(:,2); plot(E,Y1,'k*') title('初始缓冲峰值速率(kbps)和初始缓冲时延(ms)') figure(3) F=X1(:,3); plot(F,Y1,'k*') title('E2ERTT(ms)和初始缓冲时延(ms)') figure(4) plot(r,'g-') title('残差图') 2,第二次拟合代码 A=xlsread('data1.xlsx');%读取处理后的数据 %把所有的变量导入矩阵X X(:,1)=A(:,1); X(:,2)=A(:,2); X(:,3)=A(:,3); X(:,4)=A(:,4); X(:,5)=A(:,5); X(:,6)=A(:,6); X(:,7)=A(:,7); X(:,8)=A(:,8); X(:,9)=A(:,9); %正规化 X1(:,1)=bsxfun(@rdivide,X(:,1),std(X(:,1))); X1(:,2)=bsxfun(@rdivide,X(:,2),std(X(:,2))); X1(:,3)=bsxfun(@rdivide,X(:,3),std(X(:,3))); X1(:,4)=bsxfun(@rdivide,X(:,4),std(X(:,4))); X1(:,5)=bsxfun(@rdivide,X(:,5),std(X(:,5))); X1(:,6)=bsxfun(@rdivide,X(:,6),std(X(:,6))); X1(:,7)=bsxfun(@rdivide,X(:,7),std(X(:,7))); X1(:,8)=bsxfun(@rdivide,X(:,8),std(X(:,8))); X1(:,9)=bsxfun(@rdivide,X(:,9),std(X(:,9))); fori=1:9 X1(:,i)=X1(:,i)/mean(X1(:,i)); end %X2提取变量X1中的34569列元素 %播放阶=平均速率(kbps) %初始缓冲时延(ms) %VMOS %视频全程感知速率(kbps) %视频码率(kbps) X2(:,1)=X1(:,3).^(1); X2(:,2)=X1(:,4).^(1); X2(:,3)=X1(:,5).^(1); X2(:,4)=X1(:,6).^(1); X2(:,5)=X1(:,9).^(1); Y2=(A(:,8)-A(:,7))./A(:,7); X2(:,6)=ones(size(Y2)); %拟合 [b,bint,r,rint,stats]=regress(Y2,X2); disp('下面是相关性R平方') stats(1) disp('F') stats(2) disp('p值') stats(3) disp('s平方') stats(4) plot(r,'g-') title('残差图') 4,散点图生成代码 X2(:,1)=X1(:,1).^(-3); X2(:,2)=X1(:,2).^1; X2(:,3)=X1(:,3).^(-2); Y2=(A(:,8)-A(:,7))./A(:,8); [b,bint,r,rint,stats]=regress(Y2,X2); stats(1) D=X1(:,1); plot(D,Y2,'k*') title('初始缓冲峰值速率(kbps)和卡顿占比')%图形加标题 E=X1(:,2); plot(E,Y2,'k*') title('E2ERTT(ms)和卡顿占比') F=X1(:,3); plot(F,Y2,'k*') title('播放阶段平均速率(kbps)和卡顿占比') 5,引进变量与原始变量间的拟合 (1)LinearmodelPoly33: f(x,y)=p00+p10*x+p01*y+p20*x^2+p11*x*y+p02*y^2+p30*x^3+p21*x^2*y +p12*x*y^2+p03*y^3 Coefficients(with95%confidencebounds): p00=8.54e+05(3.144e+05,1.394e+06) p10=-6.877e+05(-1.162e+06,-2.13e+05) p01=-188.1(-323.1,-53.01) p20=2.218e+05(8.308e+04,3.605e+05) p11=7.141(-62.82,77.1) p02=0.07021(0.05286,0.08756) p30=-2.346e+04(-3.685e+04,-1.007e+04) p21=-0.07249(-9.487,9.342) p12=-0.002168(-0.005962,0.001627) p03=-7.883e-06(-8.727e-06,-7.038e-06) Goodnessoffit: SSE:1.759e+13 R-square:0.5244 AdjustedR-square:0.5243 RMSE:1.469e+04 (2)LinearmodelPoly33: f(x,y)=p00+p10*x+p01*y+p20*x^2+p11*x*y+p02*y^2+p30*x^3+p21*x^2*y +p12*x*y^2+p03*y^3 Coefficients(with95%confidencebounds): p00=1.523e+04(1.436e+04,1.61e+04) p10=-1.027e+04(-1.099e+04,-9562) p01=-2.107(-2.322,-1.893) p20=2796(2574,3018) p11=0.7789(0.6838,0.8741) p02=0.000372(0.0003462,0.0003977) p30=-329.1(-354,-304.3) p21=0.05026(0.03453,0.06598) p12=-0.0001154(-0.0001215,-0.0001093) p03=1.815e-09(7.112e-10,2.919e-09) Goodnessoffit: SSE:1.222e+09 R-square:0.95 AdjustedR-square:0.95 RMSE:122.4 (3)LinearmodelPoly13: f(x,y)=p00+p10*x+p01*y+p11*x*y+p02*y^2+p12*x*y^2+p03*y^3 Coefficients(with95%confidencebounds): p00=6875(5037,8714) p10=-1.814(-2.446,-1.182) p01=-4124(-5114,-3134) p11=0.8841(0.543,1.225) p02=831.2(698.1,964.4) p12=-0.1088(-0.1548,-0.06276) p03=-55.95(-58.19,-53.71) Goodnessoffit: SSE:1.547e+07 R-square:0.4667 AdjustedR-square:0.4666 RMSE:13.78