第二节 描述性统计命令与输出结果说明
则95% 可 信 限 计 算 为:
cii 样 本 数 样 本 均 数 标 准 差[,level(#)]
例: 已 知 样 本 数 为 90 样 本 均 数 为 40 以 及 样 本 标 准 差 为 12, 则: 计
算 该 样 本 均 数 的 95% 可 信 限 为
cii 90 40 12
Variable | Obs Mean Std. Err. [95% Conf. Interval] ----------+---------------------------------------------------------------------- | 90 40 1.264911 37.48665 42.51335 该 样 本 均 数 的90% 可 信 限 为 [37.48665, 42.51335] cii 90 40 12,level(90)
Variable | Obs Mean Std. Err. [90% Conf. Interval]
---------+--------------------------------------------------------------------------- | 90 40 1.264911 37.89752 42.10248
? 计 数 资 料 中 频 数 和 比 例STATA 命 令:
tab1 变 量 名[,g( 新 变 量 名)
因 为 该 命 令 主 要 适 用 描 述 计 数 资 料( 即: 属 性 资 料), 当 使 用 子 命 令 g( 新 变 量), 则 产 生 属 性 指 示 变 量。 在 回 归 分 析 中 经 常 需 要 这 些 指 示 变 量 作 为 亚 元 变 量 进 行 分 析。
例:50 只 小 鼠 随 机 分 配 到 5 个 不 同 饲 料 组, 每 组 10 只 小 鼠。 在 喂 养 一 定 时 间 后, 测 定 鼠 肝 中 的 铁 的 含 量(mg/g) 如 表 所 示: 试 比 较 各 组 鼠 肝 中 铁 的 含 量 是 否 有 显 著 性 差 别( 摘 自 医 学 统 计 方 法, 金 丕 焕 主 编,p220)。 用 x 表 示 鼠 肝 中 铁 的 含 量 以 及 用 group=1,2,3,
file:///E|/programs/stata/stata1/第二节 描述性统计命令与输出结果说明.htm (7 of 10)2004-12-24 20:23:40
第二节 描述性统计命令与输出结果说明
4,5 分 别 表 示 对 应 的 5 个 组。x:group:x:group:x:group:x:group:x:group:
2.2315.5924.531.3541.45
1.1410.9623.9231.0641.515
2.6316.96210.3330.7442.495
111.2328.2330.9641.745
1.3511.6122.0731.1641.595
2.0112.9424.932.0841.365
1.6411.9626.8430.69435
1.1313.6826.4230.6844.815
1.0111.5423.7230.8445.215
1.7012.592631.3445.125
tab1 group,g(a)
-> tabulation of group ① ② ③
group| Freq. Percent Cum. ------------+----------------------------------- 1 | 10 20.00 20.00 2 | 10 20.00 40.00 3 | 10 20.00 60.00 4 | 10 20.00 80.00 5 | 10 20.00 100.00 ------------+----------------------------------- Total | 50 100.00
① 为 各 属 性 资 料 的 频 数;② 为 该 属 性 占 整 个 资 料 样 本 数 的 百 分 比;③ 为 累 计 百 分 比。
file:///E|/programs/stata/stata1/第二节 描述性统计命令与输出结果说明.htm (8 of 10)2004-12-24 20:23:40
第二节 描述性统计命令与输出结果说明
本 例 中, 总 样 本 数 为 50, 共 有 5 组, 每 组 有 10 个 样 本 点, 各 占 总 样 本 数 的 10%。 因 为 使 用 了 子 命 令 g(a), 从 而 产 生 5 个 指 示 变 量( 又 可 称 亚 元 变 量): a1,a2,a3,a4 和 a5。 变 量 a1 用 于 指 示 第 1 组 的 资 料: 即: 当 资 料 属 于 第 1 组 的(group=1), 则 a1=1; 其 它 组 的 资 料(group11), 则 a1=0。 变 量 a2 用 于 指 示 第 2 组 的 资 料, 变 量 a3,a4 和 a5 相 应 分 别 指 示 第 3,4,5 组 的 资 料( 详 细 见 下 表)。
x:2.231.142.6311.352.011.64group:1111111a11111111a20000000a30000000a40000000a50000000x:5.590.966.961.231.612.941.96group:2222222a10000000a21111111a30000000a40000000a50000000x:4.53.9210.338.232.074.96.84a10000000a20000000a31111111a40000000a50000000group:3333333x:1.351.060.740.961.162.080.69group:4444444a10000000a20000000a30000000a41111111a50000000x:1.41.512.491.741.591.363file:///E|/programs/stata/stata1/第二节 描述性统计命令与输出结果说明.htm (9 of 10)2004-12-24 20:23:40
1.131.011111000000003.681.542200110000006.423.720000110000330.680.844400000011004.815.211.701100002.5920100060010031.344000105.12
第二节 描述性统计命令与输出结果说明
group:a1a2a3a4a5500001500001500001500001500001500001500001500001500001500001
[1] 此 处 仅 是 举 例 而 已, 事 实 上 该 资 料 可 以 用 正 态 检 验 证 明 近 似 服 从 正 态
分 布。
[2] 可 信 限 是 对 总 体 均 数 的 区 间 估 计。 例:95% 可 信 限 表 示 它 所 给 出 的 区 间 能 包 含 总 体 均 数 的 概 率 为 0.95。 通 俗 地 说: 在 同 一 个 总 体 中, 独 立 地 抽 样 100 次, 每 次 抽 取 的 样 本 量 相 同 以 及 计 算 相 应 的 95% 可 信 限, 则 平 均 有 95 次 抽 样 所 得 到 的 95% 可 信 限 所 对 应 区 间 包 含 该 总 体 均 数。
[3] 直 接 出 现 在 统 计 命 令 中 的 数 据 称 为 立 即 数, 相 应 的 命 令 称 为 立 即 命 令
回第一章回教程首页到第三章file:///E|/programs/stata/stata1/第二节 描述性统计命令与输出结果说明.htm (10 of 10)2004-12-24 20:23:40
第 三 节、 正 态 检 验 与 作 图 命 令
第三章 正态检验与作图命令
作者:赵耐青 授权刊登:医学统计之星本 节STATA 命 令 摘 要
swilk 变 量 名1 变 量 名2 … 变 量 名m
graph 变量名 [, bin(#) ]
graph 变量名1 变量名2[, 连接设置 曲线上符号设置]
? 正 态 检 验:
在 t 检 验、 方 差 分 析、 线 性 回 归、 相 关 系 数 等 检 验 中, 都 假 设 数
据 服 从 正 态 分 布, 因 此 需 要 对 数 据 作 正 态 性 检 验。 一 般 需 要 从 频 数 分 布 直 方 图 上 考 察 数 据 是 否 偏 态 以 及 用 Shapiro-Wilk 方 法 进 行 正 态 检 验。 因 为 仅 使 用 Shapiro-Wilk 方 法 进 行 正 态 性 检 验, 虽 然 能 了 解 数 据 整 体 分 布 情 况, 但 不 能 了 解 少 量 数 据 偏 态 情 况, 而 仅 从 频 数 分 布 图 情 况 进 行 数 据 正 态 性 考 察, 往 往 不 能 客 观 地 定 性 判 断。 以 下 以 ex2.dta 数 据 为 例, 进 行 正 态 检 验。use ex2.dta,clearswilk x1 x2
file:///E|/programs/stata/stata1/第 三 节、 正 态 检 验 与 作 图 命 令.htm (1 of 3)2004-12-24 20:24:12