วิธีการ: วิธีสามารถฉันคำนวณสถิติกลุ่มตามประเภทสำหรับชุดข้อมูลขนาดใหญ่

RxSummary() ฟังก์ชัน RevoScaleR จะมีประโยชน์มากสำหรับสิ่งชนิดนี้ โดยค่าเริ่มต้น ดังกล่าวจะรายงานหมายถึงกลุ่ม และส่วนเบี่ยงเบนมาตรฐานตลอดจนตรวจนับเซลล์ และจำนวนของค่าสังเกตที่ถูกต้อง ถ้าคุณระบุสูตรที่มีเงื่อนไขการโต้ตอบ ในต่ำกว่าตัวอย่างที่เราใช้จัดส่งชุดข้อมูล 'CensusWorkers.xdf'ตัวอย่าง:-------- testDataDir <-file.path(rxGetOption("sampleDataDir"))rxSummary (incwage ~ เพศ: รัฐ ข้อมูล = file.path (testDataDir, "CensusWorkers.xdf"))จำนวนของค่าสังเกตที่ถูกต้อง: 351121จำนวนของค่าสังเกตที่หายไป: 0ชื่อเฉลี่ยส่วนเบี่ยงเบนมาตรฐานของค่าต่ำสุดสูงสุด ValidObsincwage:sex:state 35333.84 40444.54 0 354000 351121สถิติโดยเรียงตามประเภท (ประเภท 6):สถานะเพศประเภทส่วนเบี่ยงเบนมาตรฐานของวิธีการincwage สำหรับเพศ =บุรุษ รัฐ Connecticut บุรุษ Connecticut 55002.00 = 67742.93incwage สำหรับเพศ =สตรี รัฐ Connecticut สตรี Connecticut 32605.03 = 34426.27incwage สำหรับเพศ =บุรุษ รัฐ = Indiana บุรุษ Indiana 38325.33 36160.07incwage สำหรับเพศ =สตรี รัฐ = Indiana สตรี Indiana 23117.71 20371.68incwage สำหรับเพศ =บุรุษ รัฐวอชิงตันวอชิงตันบุรุษ 41001.14 = 43962.65incwage สำหรับเพศ =สตรี รัฐวอชิงตันวอชิงตันสตรี 25765.03 = 25191.75MissingObs ValidObs ค่าสูงสุดค่าต่ำสุด0 354000 41751 00 354000 37666 00 314000 74221 00 314000 63702 00 336000 73372 00 336000 60409 0คุณสามารถใช้อาร์กิวเมนต์ 'rowSelection' เพื่อเซตย่อยเพิ่มเติมข้อมูลของคุณขึ้นอยู่กับค่าเฉพาะของตัวแปรบาง ฟังก์ชันอื่นที่เป็นประโยชน์คือ 'F()' ฟังก์ชัน ซึ่งบอก RevoScaleR จะถือว่าตัวแปรระบุเป็นตัวคูณ:ตัวอย่าง:-------- เอา ### เรียกรายละเอียดชนิดตัวแปรที่อยู่ในไฟล์ XDFrxGetInfo(file.path(testDataDir,"CensusWorkers.xdf"), getVarInfo = TRUE)rxSummary (incwage ~ F (อายุ): เพศ ข้อมูล = file.path(testDataDir,"CensusWorkers.xdf"), rowSelection = (สถานะ== "Indiana"))

วิธีการ: วิธีสามารถฉันคำนวณสถิติกลุ่มตามประเภทสำหรับชุดข้อมูลขนาดใหญ่

ต้องการความช่วยเหลือเพิ่มเติมหรือไม่

ต้องการตัวเลือกเพิ่มเติมหรือไม่

ข้อมูลนี้เป็นประโยชน์หรือไม่

ขอบคุณสำหรับคำติชมของคุณ!