المشكلة
كيف يمكنني معرفة أن تستخدمها الدالة ركستيكستداتا '|' كمحدد أو أي حرف آخر؟
الحل
إذا لم يتم الفصل بين بيانات النص الخاص بك بفواصل أو بعلامات التبويب، يجب تحديد المحدد باستخدام وسيطة "كولومنديليميتيرس". (غير الفعل وسيطة ركسيمبورت، ولكن لكائن المصدر البيانات الأساسي ركستيكستداتا.) في الاستخدام العادي، هذه الوسيطة حرف واحد، مثل كولومنديليميتيرس = "\t" لبيانات مفصولة بعلامة تبويب أو كولومنديليميتيرس = "،" لبيانات محددة بفاصلة. ومع ذلك، قد محددة كل عمود بأحرف مختلفة؛ يجب وصلها كافة المحددات معا في سلسلة حرف مفرد. على سبيل المثال، إذا كان لديك عمود واحد محدد بفاصلة، وثانية بالجمع، وثالث بسطر جديد، يمكنك استخدام كولومنديليميتيرس وسيطة = "، + \n".
معرف | فال
1 |
2 | ب
حتى للبيانات أعلاه كيف يمكن إصلاح أدناه التعليمات البرمجية في الاعتبار '|' ديليميتير
hdfsFS <- RxHdfsFileSystem(hostName=”dummy ", port="dummy") txtSource <- RxTextData("directory value/ file_name in hdfs", fileSystem=hdfsFS)
airData <- rxImport(inData=txtSource, outFile = "/tmp/test.xdf",stringsAsFactors = TRUE, missingValueString = "M", rowsPerRead = 200000, overwrite=TRUE)
rxSummary(~ id+val, data = airData)
2)-لتتمكن من قراءة 'توجيه'-محدد البيانات، سوف تحتاج إلى تعيين الخيار 'محدد ="|"' في الاتصال RxTextData():
txtSource <- RxTextData(("directory value/ file_name in hdfs", fileSystem=hdfsFS, delimiter = "|")