longmethod
大家好,有个问题请教大家,
有两个数据集,dataset_1和dataset_2, 每个数据集由一些长约1000bp DNA序列组成,其中dataset_1有120条序列,dataset_2有2000条序列,希望通过比较两个数据集中相同的短序列的频率分布差异。
问题:
1. 由于两个数据集相差较大(120,2000),可否对dataset_1采用bootstrap方法来获得特定短序列的频率,从而与dataset_2中的相同的短序列的分布频率来比较?
2. 是否还有更好的办法可用来处理这个问题呢?
统计知识欠缺,请大家指教。