大家好,我不是数学出身,对统计不太擅长,请教大家。
我有几个样本,测得基因组DNA甲基化,数据是这样的:
每个样本的数据是这样的,
染色体 起始坐标 终止坐标 甲基化值
chr1 1121 1621 100
chr1 2000 2500 68
... ... ... ...
chr2 ... ... ...
...
...
各个样本间的 坐标区域个数不一定一样,并且有许多不同的区域,我想问一下,做聚类前,数据要先处理成什么标准。谢谢!!!!!