jht0220 <br /> x<-"adfasdf"<br /> a<-NULL<br /> for ( i in 1:nchar(x)){a<-c(a,substr(x,i,i))}<br /> result<-names(table(a))<br /> result<br /> ##结果[1] "a" "d" "f" "s"<br /> 不知道是不是要的结果 </p>
ZHANGXIAO_QI 回复 第3楼 的 Ihavenothing:我想要读取的是大量基因组碱基,举个例子,以下只是其中一小部分 ACAATGAGGTCACTATGTTCGAGCTCTTCAAACCGGCTGCGCATACGCAGCGGCTGCCATCCGATAAGGTGGACAGCGTCTATTCACGCCTTCGTTGGCAACTTTTCATCGGTATTTTTGTTGGCTATGCAGGCTACTATTTGGTTCGTAAGAACTTTAGCTTGGCAATGCCTTACCTGATTGAACAAGGCTTTAGTCGTGGCGATCTGGGTGTGGCTCTCGGTGCGGTTTCAATCGCGTATGGTCTGTCTAAATTTTTGATGGGGAACGTCTCTGACCGTTCTAACCCGCGCTACTTTCTGAGTGCAGGTCTACTCCTTTCGGCACTAGTGATGTTCTGCTTCGGCTTTATGCCATGGGCAACGGGCAGCATTACTGCGATGTTTATTCTGCTGTTCTTAAACGGCTGGTTCCAAGGCATGGGTTGGCCTGCTTGTGGCCGTACTATGGTGCACTGGTGGTCACGCAAAGAGCGTGGTGAGATTGTTTCGGTCTGGAACGTCGCTCACAACGTCGGTGGTGGTTTGATTGGCCCCATTTTCCTGCTCGGCCTATGGATGTTTAACGATGATTGGCGCACGGCCTTCTATGTCCCCGCTTTCTTTGCGGTGCTGGTTGCCGTATTTACTTGGCTAGTCATGCGCGATACTCCTCAATCTTGTGGTTTACCACCGATTGAAGAGTACAAAAACGACTATCC 我把数据存在txt格式中。 我想要计算“ACAA”的出现频率,所以就需要把每个字母作为一个元素读取。 我应该怎样导入数据呢?
nan.xiao 理论上直接 readLines() 或 scan() 后 strsplit() 再 table() 就可以了,如果只是用一次的话。 长远来说,这个需求应该放在一个大的框架下解决,比如 Biostrings http://www.bioconductor.org/packages/release/bioc/html/Biostrings.html