국민노후보장패널은 가구자료에서 가구전체 소득을 조사함과 동시에, 개인조사대상자들의 소득 또한 개인자료에서 묻고 있다. 1~2차년도 자료에는 부부단위(귀하 및 귀하의 배우자)로 측정한 항목(금융소득, 부동산소득, 사적이전소득 등)이 있기 때문에, 이러한 변수의 경우 응답자와 응답자 배우자 모두에게 같은 값이 부여되어 있다. 따라서 1~2차년도 자료의 경우 부부단위로 측정한 항목에서는 개인단위의 소득을 파악하기는 어려우며, 부부단위의 소득만이 파악가능하다.
만약 2차년도 가구에 속한 50대 이상 모든 가구원의 금융소득을 구한 다음 가구정보와 머지하여 활용한다고 하자. 이 경우 부부 중 한 사람의 자료만을 추출하여 분석해야 하는데, ‘부부추출기준’ 변수의 값이 1로 부여된 사람의 정보를 추출하여 사용하면 된다. 물론 3차년도 자료부터는 모두 개인단위로 질문했기 때문에 이러한 수고를 덜 수 있다. 이때 절차는 다음과 같다.
① 2차 개인자료에서 2차년도에 응답한 개인조사대상자만을 추출한다.
② 금융소득이 없다고 응답한 부부단위 세트를 삭제한다.
③ 부부추출기준 변수가 0인 개인을 삭제한다.
/* sas if문의 활용*/
data a;set k.kreisp02;
keep w02hid pid w02psvy w02cref p02g011 p02g012; /*필요한 변수만 남기기*/
if w02psvy^=1 then delete; /*2차년도 응답자만 남기기*/
if p02g011^=1 then delete; /*금융소득 있다고 한 개인만 남기기*/
if w02cref^=1 then delete; /*부부추출기준 1인 사람만 추출*/
if p02g012=-9 then delete; /*금융소득 무응답 삭제*/
proc sort;by w02hid; /*2차 가구번호로 정렬*/
run; /*이후 2차 가구자료와 머지*/
/* spss select if문의 활용*/
get file='D:\KReIS\SPSS\kreisp02.sav'
/keep w02hid pid w02psvy w02cref p02g011 p02g012. /*필요한 변수만 남기기*/
select if (w02psvy = 1) & (p02g011 = 1) & (w02cref = 1) & (p02g012 ~=-9).
exe.
sort cases by w02hid.
save out ='D:\KReIS\SPSS\a.sav'
compressed. /*이후 2차 가구자료와 머지*/
/* stata drop if (keep if)문의 활용*/
clear
set mem 300m
use "D:\KReIS\STATA\kreisp02.dta", clear
keep w02hid pid w02psvy w02cref p02g011 p02g012 /*필요한 변수만 남기기*/
drop if w02psvy~=1 /*2차년도 응답자만 남기기*/
drop if p02g011~=1 /*금융소득 있다고 한 개인만 남기기*/
drop if w02cref~=1 /*부부추출기준 1인 사람만 추출*/
drop if p02g012==-9 /*금융소득 무응답 삭제*/
sort w02hid
save "D:\KReIS\STATA\a.dta", replace /*이후 2차 가구자료와 머지*/