RxSummary() ฟังก์ชัน RevoScaleR จะมีประโยชน์มากสำหรับสิ่งชนิดนี้ โดยค่าเริ่มต้น ดังกล่าวจะรายงานหมายถึงกลุ่ม และส่วนเบี่ยงเบนมาตรฐานตลอดจนตรวจนับเซลล์ และจำนวนของค่าสังเกตที่ถูกต้อง ถ้าคุณระบุสูตรที่มีเงื่อนไขการโต้ตอบ ในต่ำกว่าตัวอย่างที่เราใช้จัดส่งชุดข้อมูล 'CensusWorkers.xdf'
ตัวอย่าง: -------- testDataDir <-file.path(rxGetOption("sampleDataDir")) rxSummary (incwage ~ เพศ: รัฐ ข้อมูล = file.path (testDataDir, "CensusWorkers.xdf")) จำนวนของค่าสังเกตที่ถูกต้อง: 351121 จำนวนของค่าสังเกตที่หายไป: 0 ชื่อเฉลี่ยส่วนเบี่ยงเบนมาตรฐานของค่าต่ำสุดสูงสุด ValidObs incwage:sex:state 35333.84 40444.54 0 354000 351121 สถิติโดยเรียงตามประเภท (ประเภท 6): สถานะเพศประเภทส่วนเบี่ยงเบนมาตรฐานของวิธีการ incwage สำหรับเพศ =บุรุษ รัฐ Connecticut บุรุษ Connecticut 55002.00 = 67742.93 incwage สำหรับเพศ =สตรี รัฐ Connecticut สตรี Connecticut 32605.03 = 34426.27 incwage สำหรับเพศ =บุรุษ รัฐ = Indiana บุรุษ Indiana 38325.33 36160.07 incwage สำหรับเพศ =สตรี รัฐ = Indiana สตรี Indiana 23117.71 20371.68 incwage สำหรับเพศ =บุรุษ รัฐวอชิงตันวอชิงตันบุรุษ 41001.14 = 43962.65 incwage สำหรับเพศ =สตรี รัฐวอชิงตันวอชิงตันสตรี 25765.03 = 25191.75 MissingObs ValidObs ค่าสูงสุดค่าต่ำสุด 0 354000 41751 0 0 354000 37666 0 0 314000 74221 0 0 314000 63702 0 0 336000 73372 0 0 336000 60409 0 คุณสามารถใช้อาร์กิวเมนต์ 'rowSelection' เพื่อเซตย่อยเพิ่มเติมข้อมูลของคุณขึ้นอยู่กับค่าเฉพาะของตัวแปรบาง ฟังก์ชันอื่นที่เป็นประโยชน์คือ 'F()' ฟังก์ชัน ซึ่งบอก RevoScaleR จะถือว่าตัวแปรระบุเป็นตัวคูณ: ตัวอย่าง: -------- เอา ### เรียกรายละเอียดชนิดตัวแปรที่อยู่ในไฟล์ XDF rxGetInfo(file.path(testDataDir,"CensusWorkers.xdf"), getVarInfo = TRUE) rxSummary (incwage ~ F (อายุ): เพศ ข้อมูล = file.path(testDataDir,"CensusWorkers.xdf"), rowSelection = (สถานะ== "Indiana"))วิธีการ: วิธีสามารถฉันคำนวณสถิติกลุ่มตามประเภทสำหรับชุดข้อมูลขนาดใหญ่
นำไปใช้กับ
Revolution Analytics