四分位数将数据从小到大排列,Q1=n+14对应的顺序值,有25%的值比它小…3(n+1)Q3=4数据分布分析706050403020100人数2285947箱线图形态分析数据的频数分析n计算符合预设范围的数据频度n应用场合:–客户群分析–客户行为分析–投诉量分析等如何进行频数分析n数据透视图法n直方图法n公式法变异指标n变异指标用于反映数据的分散情况–四分位距=Q3-Q1–方差–标准差–标准差系数方差总体方差population varianceσ2=2X?(μ)∑ii=1nN2(X?X)∑ii=1n样本方差sample varianceS2=N?1标准差总体标准差population standard deviationσ=σ2=2(X?μ)∑ii=1nNn样本标准差sample standard deviationS=S2=2(X?X)∑ii=1N?1标准差系数标准差标准差系数=平均值
中国移动深度数据挖掘内训教材
四分位数将数据从小到大排列,Q1=n+14对应的顺序值,有25%的值比它小…3(n+1)Q3=4数据分布分析706050403020100人数2285947箱线图形态分析数据的频数分析n计算符合预设范围的数据频度n应用场合:–客户群分析–客户行为分析–投诉量分析等如何进行频数分析n数据透视图法n直方图法n公式法变异指标n变异指标用于反映数据的分散情况–四分位距=Q3-Q1–方差–标准差–标准
推荐度:
点击下载文档文档为doc格式