我在做一个关于欧洲的大学生留学意愿的研究,研究问题是“学生的移民背景是否会影响留学意愿”。
因为因变量是一个二分变量(是/否有留学意向),所有我打算做logistic regression。自变量包括“是/否有留学背景”,“家庭情况”,等等。
我使用的问卷里有几个问题,只针对没有意愿去留学的学生,比如:因为较弱的经济条件/得不到信息/不符合留学条件,所以没有留学意愿。而有留学意向的学生,在做问卷的时候,这几个问题会被直接过滤掉,根本就不会看到。。
所以,我的问题是,我能把这几个只针对没有留学意愿学生的问题,作为自变量放到模型中吗?如果放进去的话,那么有留学意向的对象在这几个变量里必然会成为缺失值。。应该怎么处理呢?
我的初步想法是,把有留学意向和没有留学意向的人分组进行分析。。但是这样的话,我的整个设计就没有多少意义了吧。。
如果能得到答复真的是万分感激!!!