SAS数据处理性能还是不能和数据库性能媲美的,所以,一般来说,我会先通过DBMS对数据进行处理,然后用SAS分析DBMS数据处理的结果。
这种情况下,SAS有两种方法获取这个“DBMS数据处理的结果”,一个是直接连接数据库进行数据分析(不生成sas数据集),另一个是连接到数据库获取数据并生成sas数据集后再对自有SAS数据集分析。
但对于做分析的人员来说,数据处理过程的反复是常有的事,如,一次DBMS处理完成并通过SAS分析,发现数据不符合要求,需要DBMS重新处理。。。。如此反复的数据处理,如果用上述的第二种方式让SAS连接数据库并生成自有SAS数据集,DBMS重新处理后再重新生成SAS数据集。。。[s:12]那是相当繁琐的事情;但如果选择上述的第一种方式让SAS直接连接DBMS进行数据分析(不生成SAS自有的数据集),性能好像比较差[s:15](DBMS数据结果集比较大,一般情况是百万,个别情况是千万级)
不知道大家都是怎么处理的?[s:16]