/ / Rstudio - आर, एन्कोडिंग, rstudio में विशेष पात्रों का उपयोग

Rstudio - आर, एन्कोडिंग, rstudio में विशेष पात्रों का उपयोग करना

मैं Rstudio में कुछ विशेष पात्रों के साथ काम कर रहा हूँ। यह उन्हें सादे अक्षरों में शामिल करता है।

print("Safarzyńska2013")
[1] "Safarzynska2013"

x <- "Māori"
x
[1] "Maori"

सटीक मूल पात्रों में पढ़ने का कोई तरीका है। निम्नलिखित जानकारी सहायक हो सकती है: Rstudio डिफ़ॉल्ट एन्कोडिंग utf-8 है

sessionInfo()
R version 3.1.1 (2014-07-10)
Platform: x86_64-w64-mingw32/x64 (64-bit)

locale:
[1] LC_COLLATE=English_United States.1252  LC_CTYPE=English_United States.1252
[3] LC_MONETARY=English_United States.1252 LC_NUMERIC=C
[5] LC_TIME=English_United States.1252

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base

loaded via a namespace (and not attached):
[1] tools_3.1.1

उत्तर:

उत्तर № 1 के लिए 1

यह एक विशेष रूप से RStudio समस्या नहीं है।

टाइपिंग print("Safarzyńska2013") आरजीईई के कंसोल पर भी उन्हें सादे अक्षरों में परिवर्तित कर दिया जाता है। आरजीईई रिटर्न में एक यूटीएफ -8 एन्कोडेड स्क्रिप्ट से इस कोड को चला रहा है [1] "Safarzy?ska2013"

मुझे नहीं लगता कि कंसोल पर ऐसे विशेष वर्ण टाइप करना एक अच्छा विचार है। x <- "SomeString"; Encoding(x) रिटर्न "unknown" और शायद यह समस्या है: आर को पता नहीं है कि आप कंसोल पर किस एन्कोडिंग का उपयोग कर रहे हैं और शायद आपके मूल एन्कोडिंग को प्राप्त करने का कोई मौका नहीं है।

मैंने utf-8 के साथ एन्कोड की गई एक टेक्स्ट फ़ाइल में "Safarzyńska2013nMorin" डाला। फिर निम्नलिखित ठीक काम करता है:

tbl <- read.table("c:/test1.txt", encoding = "utf-8", stringsAsFactors = FALSE)
tbl[1,1]
tbl[2,1]
Encoding(tbl[1,1])  # returns "utf-8"

यदि आप वास्तव में कंसोल का उपयोग करना चाहते हैं, तो आपको शायद विशेष वर्णों को मुखौटा करना होगा। में ?Encoding हमें विशेष वर्णों के साथ एक शब्द बनाने के लिए निम्नलिखित उदाहरण मिलते हैं:

x <- "faxE7ile"
Encoding(x)

असल में मुझे इस समय पता नहीं है कि इन विशेष कोडों के लिए इन कोड कैसे प्राप्त करें और ?Encoding कोई संकेत नहीं है ...