第一节 数据输入,存盘和调用文件命令以及数据管理命令
input x1 x2113 140150 138150 140 135 135128 135100 120110 147120 114130 138123 120
end
2. 调 用 外 部 文 本 数 据 文 件
如 果 数 据 已 经 用 其 它 软 件( 如:Foxbase) 输 入, 并 已 以 文 本 格 式 生 成 一 个 文 本 数 据 文 件, 并 且 满 足 上 述 每 个 记 录 一 行 和 两 个 变 量 之 间 用 空 格 分 割 的 格 式。 则 用 STATA 命 令:
infile 变量1 变量2 … 变 量m using [路径]文本数据文件名
如: 上 例 数 据 已 以 文 本 方 式 存 在 C:\%user 子 目 录 中 的 文 件 ex1.txt, 并 满 足 每 个 记 录 一 行 和 两 个 变 量 之 间 用 空 格 分 割 的 格 式, 则:STATA 命 令:
infile x1 x2 using c:\%user\\ex1.txt
? 以 STATA 格 式 存 盘
file:///E|/programs/stata/stata1/第一章 数据输入,存盘和调用文件命令以及数据管理命令.htm (3 of 6)2004-12-24 20:20:21
第一节 数据输入,存盘和调用文件命令以及数据管理命令
save ex1
以 ex1.dta 为 文 件 名 在 当 前 目 录 中 存 盘。
(因 为STATA 格 式 的 数 据 文 件 的 缺 省 扩 展 名 为 .dta )
如 果 ex1.dta 在 当 前 目 录 中 已 存 在, 并 且 打 算 把 当 前 数 据 所 存 的 文 件 覆 盖 当 前 目 录 中 已 存 在 的 文 件ex1.dta, 则:
save ex1,replace
如 果 打 算 把 ex1.dta 文 件 存 入 c:\%user 子 目 录 中, 则 save c:\%user\\ex1.dta
或 save c:\%user\\ex1.dta, replace
? 以 文 本 方 式 存 数 据 文 件:
STATA 命 令:
outfile 变量1 变量2 … 变 量m using 路径]文本数据文件名[,replace]
其 中 子 命 令[,replace] 表 示 覆 盖 现 有 同 目 录 中 与 该 文 本 数 据 文 件 相 同 的 文 件
设 上 述 资 料 已 在STATA 状 态 下 输 入 到 计 算 机 中, 准 备 生 成 一 个 文 本 数 据 文 件 ex1.txt 并 存 入 c:\%user , 则:
STATA 命 令:
outfile x1 x2 using c:\%user\\ex1.txt
若 在 c:\%user 中 已 经 有 ex1.txt, 并 打 算 用 当 前STATA 环 境 中 的 数 据 覆 盖 它。 则
outfile x1 x2 using c:\%user\\ex1.txt,replace
? 调 用 现 有 数 据 文 件( 以STATA 格 式 存 盘 的 文 件, 又 称 STATA 系 统 数 据 文 件)
use [ 路 径] 文 件 名[,clear]
file:///E|/programs/stata/stata1/第一章 数据输入,存盘和调用文件命令以及数据管理命令.htm (4 of 6)2004-12-24 20:20:21
第一节 数据输入,存盘和调用文件命令以及数据管理命令
若 当 前 STATA 状 态 已 调 入 数 据, 则 要 调 入 新 的 数 据 时, 需 要 用 clear 子 命 令, 表 示 清 除 原 先 已 在 计 算 机 中 的 数 据。
如: 调 用 在 c:\%user 子 目 录 下 的ex1.dta STATA 系 统数 据 文 件, 则:use c:\%user\\ex1
若 当 前 状 态 已 有 数 据 在 计 算 机 内, 则:use c:\%user\\ex1,clear
注意:use 与 save是一对调用STATA系统数据文件和以STATA系统格式 存盘的命
令;infile 和 outfile也是一对调用外部文本数据文件和以 文本文件格式存盘的命令。
? 数据管理命令
产 生 新 的 变 量:STATA 命 令: gen 新变量名=表达式
例如:当 前 计 算 机 中 正 处 于 STATA 状 态 下, 并 有 二 个 配 对 变 量 x1 和 x2 的 数 据, 因 此 需 要 计 算 两 个 变 量 的 差:x1-x2, 则:
gen x=x1-x2
修 改 数 据:STATA 命 令:
replace 变量名 = 表 达 式 [if 逻辑表达式] [in 范围]
如: 变 量 x 中 所 有 值 为999 的 数 据 是 缺 省 资 料,现 改 为 STATA 缺 省 值 的 记 号,所 有 大 于100 的 数 据 将 改 为 2;x 小 于 或 等 于 100 且 大 于 5 的 所 有 数 据 改 为 1;x 小 于 或 等 于 5 的 所 有 数 据 为 0。 则:
replace x=. if x==999replace x =0 if x<=5
file:///E|/programs/stata/stata1/第一章 数据输入,存盘和调用文件命令以及数据管理命令.htm (5 of 6)2004-12-24 20:20:21
第一节 数据输入,存盘和调用文件命令以及数据管理命令
replace x=1 if x>5 & x<=100 [2] replace x=2 if x>100
[1] 、 方 括 号[ ] 中 的 子 命 令 表 示 可 以 省 略, 但 方 括 号 中 的 子 命 令 是 处 理 一 些 特 殊 情 况 的。[2] 在 逻 辑 表 达 式 中:“ 等 于” 用 == 表 示;“不 等 于” 用 ~= 表 示; “或” 用 | 表 示;“ 并 且” 用 & 表 示。
回教程首页到第二章file:///E|/programs/stata/stata1/第一章 数据输入,存盘和调用文件命令以及数据管理命令.htm (6 of 6)2004-12-24 20:20:21
第二节 描述性统计命令与输出结果说明
第二章 描述性统计命令与输出结果说明
作者:赵耐青 授权刊登:医学统计之星本 节STATA 命 令 摘 要
by 分组变量:]summarize 变 量 名1 变 量 名2 … 变 量 名m[,detail]
ci 变 量 名1 变 量 名2 … 变 量 名m [, level(#) binomial
poisson exposure(varname) by(分组变
量) ]
cii 样 本 量 均 数 标 准 差 [, level(#) ]
tab1 变量名 [,generate(变量名)]
? 资 料 特 征 描 述( 均 数, 中 位 数, 离 散 程 度)
例: 某 地 测 定 克 山 病 患 者 与 克 山 病 健 康 人 的 血 磷 测 定 值 如 下 表( 数 据 摘 自 四 川 医 学 院 主 编 的 卫 生 统 计 学,1978 出 版, p21): 患 者2.6
健康人1.67
3.241.98
3.731.98
3.732.33
4.322.34
4.732.50
5.183.60
5.583.73
5.784.14
6.404.17
6.534.57
4.82
5.78
并 假 定 这 些 数 据 已 以STATA 格 式 存 入 ex2.dta 文 件 中, 其 中 变 量 x1 为 患 者 的血 磷 测 定 值 数 据, 变 量 x2 为 健 康 人 的血 磷 测 定 值 数 据。 上 述 数 据 也 可 以 用 变 量 x 表 示 血 磷 测 定 值, 分 组 变 量 group=0 表 示 患 者 组 和 group=1 表 示 健 康 组( 如: 患 者 组 中 第 一 个 数 据 为 2.6, 则 x=2.6,group=0; 又 如: 健 康 组 中 第 三 个 数 据 为 1.98, 则 x 为 1.98 以 及 group 为 1), 并 假 定 这 些 数 据 已 以 STATA 格 式 存 入 ex2a.dta 文 件 中。 计 算 资 料 均 数, 标 准 差 命 令 summarize, 以 述 资 料 为 例:
use ex2,clear
summarize x1 x2
结 果:
file:///E|/programs/stata/stata1/第二节 描述性统计命令与输出结果说明.htm (1 of 10)2004-12-24 20:23:40
STATA 讲义



