RxSummary() ฟังก์ชัน RevoScaleR จะมีประโยชน์มากสำหรับสิ่งชนิดนี้ โดยค่าเริ่มต้น ดังกล่าวจะรายงานหมายถึงกลุ่ม และส่วนเบี่ยงเบนมาตรฐานตลอดจนตรวจนับเซลล์ และจำนวนของค่าสังเกตที่ถูกต้อง ถ้าคุณระบุสูตรที่มีเงื่อนไขการโต้ตอบ ในต่ำกว่าตัวอย่างที่เราใช้จัดส่งชุดข้อมูล 'CensusWorkers.xdf'
ตัวอย่าง:
--------
testDataDir <-file.path(rxGetOption("sampleDataDir"))
rxSummary (incwage ~ เพศ: รัฐ ข้อมูล = file.path (testDataDir, "CensusWorkers.xdf"))
จำนวนของค่าสังเกตที่ถูกต้อง: 351121
จำนวนของค่าสังเกตที่หายไป: 0
ชื่อเฉลี่ยส่วนเบี่ยงเบนมาตรฐานของค่าต่ำสุดสูงสุด ValidObs
incwage:sex:state 35333.84 40444.54 0 354000 351121
สถิติโดยเรียงตามประเภท (ประเภท 6):
สถานะเพศประเภทส่วนเบี่ยงเบนมาตรฐานของวิธีการ
incwage สำหรับเพศ =บุรุษ รัฐ Connecticut บุรุษ Connecticut 55002.00 = 67742.93
incwage สำหรับเพศ =สตรี รัฐ Connecticut สตรี Connecticut 32605.03 = 34426.27
incwage สำหรับเพศ =บุรุษ รัฐ = Indiana บุรุษ Indiana 38325.33 36160.07
incwage สำหรับเพศ =สตรี รัฐ = Indiana สตรี Indiana 23117.71 20371.68
incwage สำหรับเพศ =บุรุษ รัฐวอชิงตันวอชิงตันบุรุษ 41001.14 = 43962.65
incwage สำหรับเพศ =สตรี รัฐวอชิงตันวอชิงตันสตรี 25765.03 = 25191.75
MissingObs ValidObs ค่าสูงสุดค่าต่ำสุด
0 354000 41751 0
0 354000 37666 0
0 314000 74221 0
0 314000 63702 0
0 336000 73372 0
0 336000 60409 0
คุณสามารถใช้อาร์กิวเมนต์ 'rowSelection' เพื่อเซตย่อยเพิ่มเติมข้อมูลของคุณขึ้นอยู่กับค่าเฉพาะของตัวแปรบาง ฟังก์ชันอื่นที่เป็นประโยชน์คือ 'F()' ฟังก์ชัน ซึ่งบอก RevoScaleR จะถือว่าตัวแปรระบุเป็นตัวคูณ:
ตัวอย่าง:
--------
เอา ### เรียกรายละเอียดชนิดตัวแปรที่อยู่ในไฟล์ XDF
rxGetInfo(file.path(testDataDir,"CensusWorkers.xdf"), getVarInfo = TRUE)
rxSummary (incwage ~ F (อายุ): เพศ ข้อมูล = file.path(testDataDir,"CensusWorkers.xdf"), rowSelection = (สถานะ== "Indiana"))