如题。windows下中文乱码经常被诅咒,以至于我以为linux下不存在中文乱码,装ubuntu时直接选了英文语言,没想到在excel,R中中文都成乱码了。参考网上的教程,在系统中添加了中文字体,测试后也发现添加成功了,excel中选择chinese(simplified....)字体可以正常显示了。可是R中由于自编译的包中grep函数有匹配中文,在R中打印出函数时,if(grepl("汉江",x))变成if(grepl("\xc7",x))这一类乱码了,用options(encoding="GBK")或options(encoding="UTF-8")设置均没有效果。
需要的帮助:
1、作为windows用户,在切换Linux环境(特殊情况下切换),有中文字符处理的需求下,应该如何配置linux的语言、字体环境,以及编译自己的包时在编码上需要注意什么?
2、windows和linux下的路径、包括文件夹大小写敏感性都不同,在保证自己的函数跨平台使用时需要注意什么,有什么技巧?(跑题了)
PS:我在windows下RStudio的编码是CP936,函数文件用notepad打开显示是ANSI编码。
PS:网上搜了下,不知道在R启动时将locale设置为GBK是否可行?比如在加载中文包之前执行Sys.setlocale(locale="Chinese-simplified"),但是在RStudio Server中试图设置时总是提示没有权限更改。
希望有经验的出来交流一下,网上找到的经验不多。谢谢!