我现在手头有一万多个地址的数据,字符向量,每个都是类似“中国广东省深圳市宝安区XXX”这样的字符。
我想把这一万多个地址按省份分成不同的类别,比如生成一个数据框,第一列是地址,第二列是省份。
字符识别好办,关键是有三十几个省份,该用什么语句分类?
用switch,好像不好用,因为我不是判断一个变量可能取不同的值,而是逐个识别字符串。
如果用if else,三十几个套在一起也太恐怖了,不套在一起,又怕有重复识别或者遗漏的情况。
不知道该怎么解决,求高手指点!
我想把这一万多个地址按省份分成不同的类别,比如生成一个数据框,第一列是地址,第二列是省份。
字符识别好办,关键是有三十几个省份,该用什么语句分类?
用switch,好像不好用,因为我不是判断一个变量可能取不同的值,而是逐个识别字符串。
如果用if else,三十几个套在一起也太恐怖了,不套在一起,又怕有重复识别或者遗漏的情况。
不知道该怎么解决,求高手指点!