好文档 - 专业文书写作范文服务资料分享网站

Stata教程

天下 分享 时间: 加入收藏 我要投稿 点赞

a5

1 1 1 1 1 1 1 1 1 1

[1] 此 处 仅 是 举 例 而 已, 事 实 上 该 资 料 可 以 用 正 态 检 验 证 明 近 似 服 从 正 态 分 布。

[2] 可 信 限 是 对 总 体 均 数 的 区 间 估 计。 例:95% 可 信 限 表 示 它 所 给 出 的 区 间 能 包 含 总 体 均 数 的 概 率 为 0.95。 通 俗 地 说: 在 同 一 个 总 体 中, 独 立 地 抽 样 100 次, 每 次 抽 取 的 样 本 量 相 同 以 及 计 算 相 应 的 95% 可 信 限, 则 平 均 有 95 次 抽 样 所 得 到 的 95% 可 信 限 所 对 应 区 间 包 含 该 总 体 均 数。

[3] 直 接 出 现 在 统 计 命 令 中 的 数 据 称 为 立 即 数, 相 应 的 命 令 称 为 立 即 命 令

第三章 正态检验与作图命令

本 节STATA 命 令 摘 要

swilk 变 量 名1 变 量 名2 ? 变 量 名m graph 变量名 [, bin(#) ]

graph 变量名1 变量名2[, 连接设置 曲线上符号设置]

? 正 态 检 验: 在 t 检 验、 方 差 分 析、 线 性 回 归、 相 关 系 数 等 检 验 中, 都 假 设 数 据 服 从 正 态 分 布, 因 此 需 要 对 数 据 作 正 态 性 检 验。 一 般 需 要 从 频 数 分 布 直 方 图 上 考 察 数 据 是 否 偏 态 以 及 用 Shapiro-Wilk 方 法 进 行 正 态 检 验。 因 为 仅 使 用 Shapiro-Wilk 方 法 进 行 正 态 性 检 验, 虽 然 能 了 解 数 据 整 体 分 布 情 况, 但 不 能 了 解 少 量 数 据 偏 态 情 况, 而 仅 从 频 数 分 布 图 情 况 进 行 数 据 正 态 性 考 察, 往 往 不 能 客 观 地 定 性 判 断。 以 下 以 ex2.dta 数 据 为 例, 进 行 正 态 检 验。 use ex2.dta,clear swilk x1 x2

Shapiro-Wilk W test for normal data ① Variable | Obs W V z Pr > z ----------+-------------------------------------------------------- x1 | 11 0.96263 0.605 -0.856 0.80397 x2 | 13 0.93079 1.219 0.388 0.34900 ① 是H0: 数 据 服 从 正 态 的 检 验 所 对 应 的 p 值, 若 p 值<0.05, 则 可 以 认 为 该 数 据 偏 态, 即 不 能 认 为 该 数 据 服 从 正 态 分 布。 ? 作 直 方 图: graph 变 量 名[,bin(#1)]

其 中 #1 是 图 中 的 直 方 块 的 个 数, 缺 省 值 为 5。 ? 作 散 点 图 和 曲 线 图: 散 点 图:

graph 变 量 名1 变 量 名2 m 条 曲 线 图 (31):

graph 因变量名1 因变量名2 ? 因变量名m 自变量名 [, c(c1?cm) s(s1?sm)] c(c1?cm) 为连接设置:c1?cm 为对应m条曲线连接设置为: . 点与点之间不 连 接( 缺 省 值,即:散点图) l 点与点之间用直线连接?

L 自变量单调上升的点之间用直线连接

16

s 点与点之间用三次样条函数连接

s(s1?sm)为曲线上点符号设置, s1?sm为对应m条曲线上点的符号设置:

? O 大 园 (缺 省 值) ? S 大 方 块 ? T 大 三 角 形 ? o 小 园 ? d 小 菱 形 ? p 小 加 号 ? . 点 ? i 隐 含

例:graph y1 y2 x, c(l.) s(Od)

则:y1 与 x 的 曲 线 用 直 线 连 接 且 这 些 点 用 大 园 表 示;y2 与 x 的 曲 线 图 为 散 点 图 且 用 小 菱 形 表 示 这 些 散 点。

第四章 t检验和单因素方差分析(上)

本 节STATA 命 令 摘 要 ttest varname = # ttest varname1 = varname2 [, unequal unpaired ] ttest varname , by(分组变量) [unequal ] ttesti 样本数 均数 标准差 # ttesti 样本数1 均数1 标准差1样本数2 均数2 标准差2 [, unequal] sdtest 变 量1= 变 量2 oneway 观察变量 分组变量[, means bonferroni scheffe sidak ] ? 单 样 本 t 检 验

2

假 定 数 据 服 从 正 态 分 布 N(m,s), 无 效 假 设 H0: m=m0, 则 用 STATA 命 令: ttest 变 量 名=# (# 为 m0 的 值)。

例: 应 用 克 矽 平 治 疗 矽 肺 患 者 10 名, 治 疗 前 后 血 红 蛋 白 的 含 量 如 下( 数 据 摘 自 金 丕 焕 主 编 <医 用 统 计 方 法>,pp 37):

血 红 蛋 白 含 量 治疗前 113 150 150 135 128 治疗后 140 138 140 135 135 治疗前 100 110 120 130 123 治疗后 120 147 114 138 120

上 述 数 据 已 存 入ex1.dta 文 件 中( 治 疗 前 的 数 据 为 x1 以 及 治 疗 后 的 数 据 为 x2 ), 问: 患 者 治 疗 前 后 的 血 红 蛋 白 是 否 有 显 著 改 变? 先 计 算 每 个 患 者 治 疗 前 后 的 血 红 蛋 白 差: gen d=x2-x1

检 验 H0:患 者 治 疗 前 后 的 血 红 蛋 白 差 的 总 体 均 数 为 0 再 进 行 单 样 本 t 检 验 ( 若 数 据 服 从 正 态 分 布)

ttest d=0

① ②

Variable | Obs Mean Std. Dev. ----------+------------------------------------------- d | 10 .6799999 1.645735 Ho: mean = 0

17

③ t = 1.31 with 9 d.f. ④ Pr > |t| = 0.2237

上 述 结 果 中,① 为 患 者 治 疗 前 后 血 红 蛋 白 差 的 样 本 均 数; ② 标 准 差;③ 对 应 t 统 计 量 的 样 本 值;④ 为 相 应 的 p 值 [1] , 本 例 统 计 结 果( 即 配 对 t 检 验) 表 明: 现 有 资 料 不 能 表 明 患 者 治 疗 前 后 血 红 蛋 白 发 生 明 显 改 变。 ? 配 对 t 检 验 和 两 组 t 检 验

对 于 配 对 t 检 验, 要 求 配 对 数 据 的 差 服 从 正 态 分 布。 STATA 命 令 为

ttest 变 量 名1= 变 量 名2

以 上 例 的 资 料( ex1.dta )为 例, use ex1.dta,clear ttest x1=x2 Variable | Obs Mean Std. Dev. ----------+--------------------------------------- x1 | 10 12.59 1.632619 x2 | 10 13.27 1.080175 ----------+--------------------------------------- diff. | 10 -.6799999 1.645735 Ho: diff = 0 (paired data) t = -1.31 with 9 d.f. Pr > |t| = 0.2237 上 述 结 果 与 用 单 样 本 t 检 验 两 个 变 量 的 差 的 结 果 完 全 相 同。

对 于 两 组 数 据 的 t 检 验, 要 求 两 组 数 据 均 服 从 正 态 分 布, 两 组 数 据 的 方 差 无 显 著 性 差 异 并 且 要 求 数 据 之 间 相 互 独 立( 对 于 配 对 资 料, 因 为 配 对 可 能 引 起 数 据 之 间 相 关, 所 以 配 对 资 料 一 般 不 能 应 用 两 组 数 据 的 t 检 验)。 STATA 命 令:

ttest 变 量1= 变 量2, unpaired

若 两 个 变 量 的 数 据 方 差 相 差 不 太 大, 则 可 以 用 ttest 变 量1= 变 量2, unequal unpaired

例:某 地 测 定 克 山 病 患 者 与 克 山 病 健 康 人 的 血 磷 测 定 值 如 下 表( 用 变 量 x1 和 x2 分 别 表 示 患 者 和 健 康 人 的 血 磷 测 定 值, 并 已 存 入 ex2.dta 文 件 中)。

患 者 2.6 3.24 3.73 3.73 4.32 4.73 5.18 5.58 5.78 6.40 6.53 健康1.67 1.98 1.98 2.33 2.34 2.50 3.60 3.73 4.14 4.17 4.57 4.82 5.78 人 该 问 题 要 检 验 H0: 患 者 和 健 康 人 的 血 磷 测 定 值 的 总 体 均 数 是 否 相 同。 use ex2.dta, clear

ttest x1=x2,unpaired ( 假 定 方 差 齐 性 和 数 据 呈 正 态 分 布)

① ② Variable | Obs Mean Std. Dev. ------------+----------------------------------------- x1 | 11 4.710909 1.302977 x2 | 13 3.354615 1.304368 ------------+----------------------------------------- ③ |

18

combined | 24 3.97625 1.449956 Ho: mean(x) = mean(y) (assuming equal variances) ④ t = 2.54 with 22 d.f. ⑤ Pr > |t| = 0.0187 ① 为 均 数;② 为 标 准 差;③ 合 并 的 均 数 和 标 准 差;④ t 检 验 统 计 量 的 t 值;⑤Ho 的 t 检 验 所 对 应 的 p 值。 由 患 者 的血 磷 测 定 值 的 样 本 均 数 大 于 健 康 人 的血 磷 测 定 值 的 样 本 均 数 以 及 p=0.0187(<0.05),表 明 克 山 病 患 者 的 血 磷 测 定 值 显 著 地 高 于 健 康 人 [2] 。

本 例 也 可 以 使 用 ex2a.dta 方 式 的 数 据( 在 STATA 如 何 输 入 数 据 这 一 节 中 已 描 述 过 该 文 件 的 数 据 方 式): 用 x 表 示 血 磷 测 定 值 以 及 用 分 组 变 量 group 表 示 健 康 组 (group=1) 或 患 者 组 (group=0), 则: use ex2a.dta,clear ttest x,by(group) Variable | Obs Mean Std. Dev. ----------+--------------------------------- ① 0 | 11 4.710909 1.302977 1 | 13 3.354615 1.304368 ----------+--------------------------------- combined | 24 3.97625 1.449956 Ho: mean(x) = mean(y) (assuming equal variances) 假 定 方 差 齐 性 t = 2.54 with 22 d.f. Pr > |t| = 0.0187 ① 表 示 分 组 变 量 group=0 和 group=1 所 对 应 的 组。 该 结 果 与 ex1.dta 文 件 的 数 据 统 计 检 验 结 果 完 全 相 同。

若 两 组 数 据 的 方 差 不 满 足 齐 性 要 求 但 两 组 方 差 相 差 不 是 太 大, 则 可 以 使 用 ttest 中 的 子 命 令:unequal. 假 设 在ex2a.dta 中 的 两 组 数 据 方 差 不 满 足 齐 性 要 求( 仅 仅 是 假 设 而 已, 实 际 上 两 组 方 差 是 齐 性 的), 则 use ex2a.dta,clear

ttest x, by(group) unequal

Variable | Obs Mean Std. Dev. ------------+--------------------------------- 0 | 11 4.710909 1.302977 1 | 13 3.354615 1.304368 ------------+--------------------------------------- combined | 24 3.97625 Ho: mean(x) = mean(y) (assuming unequal variances) 假 定 方 差 不 齐 性 t = 2.54 with 21.35 d.f. Pr > |t| = 0.0189 由 于 该 统 计 检 验 是 根 据 方 差 不 齐 性 的 程 度 相 应 减 少 自 由 度, 所 以 与 方 差 齐 性 的 t 检 验 结 果 相 比, 尽 管 在 t 值 相 同 (实 际 上 两 个 统 计 检 验 t 值 计 算 公 式 非 常 接 近, 但 略 有 些 差 别), 但 两 者 自 由 度 有 所 不 同, 因 此 对 应 的 p 值 也 不 同。

? 根 据 已 知 样 本 均 数、 标 准 差 和 样 本 数 进 行 t 检 验

对 于 单 样 本: 若 已 知 样 本 均 数、 标 准 差 和 样 本 数, 检 验 均 数 m=m0, 则 STATA 命 令 为:

19

ttesti 样 本 数 样 本 均 数 样 本 标 准 差 # 其 中 # 为 相 应 的 m0。 例: 已 知 样 本 均 数 为 1.28, 样 本 标 准 差 为 0.92 和 样 本 量 为 21, 要 检 验 总 体 均 数 是 否 为 0.2。

ttesti 21 1.28 0.92 0.2 Variable | Obs Mean Std. Dev. ----------+--------------------------------------- x | 21 1.28 .92 Ho: mean = 0.2 t = 5.38 with 20 d.f. Pr > |t| = 0.0000 结 果 表 明: t 值 为 5.38, 自 由 度 为 20,相 应 的 p<0.0001, 表 明 均 数 显 著 地 大 于 0.2。

对 于 两 组 样 本 均 数 比 较: 已 知 两 组 的 样 本 数、 样 本 均 数 和 样 本 标 准 差, 检 验 两 组 均 数 是 否 相 同, 则STATA 命 令 为:

ttesti 样本数1 均数1 标准差1样本数2 均数2 标准差2 [, unequal]

例: 已 知 第 一 组 的 样 本 数 为 11, 样 本 均 数 为 10, 样 本 标 准 差 为 1.9; 第 二 组 的 样 本 数 为 14, 样 本 均 数 为 12.8, 样 本 标 准 差 为 2.3, 问 若 两 组 实 际 均 服 从 正 态 分 布, 两 组 总 体 均 数 是 否 相 同? 若 两 组 假 定 方 差 齐 性, 则: ttesti 11 10 1.9 14 12.8 2.3 Variable | Obs Mean Std. Dev. -------------+---------------------------------------- x | 11 10 1.9 y | 14 12.8 2.3 -------------+---------------------------------------- combined | 25 11.568 2.526232 Ho: mean(x) = mean(y) (assuming equal variances) t = -3.25 with 23 d.f. Pr > |t| = 0.0035 结 果 表 明 第 二 组 的 均 数 显 著 地 大 于 第 一 组 的 均 数。 若 两 组 方 差 不 满 足 齐 性, 则 可 以 使 用 非 齐 性 的 t 检 验: ttesti 11 10 1.9 14 12.8 2.3, unequal

Variable | Obs Mean Std. Dev. -------------+--------------------------------------- x | 11 10 1.9 y | 14 12.8 2.3 -------------+--------------------------------------- combined | 25 11.568 Ho: mean(x) = mean(y) (assuming unequal variances) t = -3.33 with 22.92 d.f. Pr > |t| = 0.0029 结 果 表 明: 第 二 组 均 数 显 著 地 大 于 第 一 组 的 均 数。

? 两 组 方 差 齐 性 检 验。STATA 两 组 方 差 齐 性 检 验 的 命 令 为: sdtest 变 量1= 变 量2 检 验 两 个 变 量 的 方 差 是 否 相 同?

20

Stata教程

a51111111111[1]此处仅是举例而已,事实上该资料可以用正态检验证明近似服从正态分布。[2]可信限是对总体均数的区间估计。例:95%可信限表示它所给出的区间
推荐度:
点击下载文档文档为doc格式
91fqf3tgwc8iiwn479fu
领取福利

微信扫码领取福利

微信扫码分享