RxSummary() פונקציה של RevoScaleR שימושית מאוד עבור סוג זה של דבר. כברירת מחדל הוא הדוח לקבוצה פירושה סטיות תקן וכן ספירות התא ואת מספר תצפיות חוקי, אם תציין נוסחה הכוללת תנאי אינטראקציה. ב- להלן דוגמאות נשתמש dataset המשלוח 'CensusWorkers.xdf'.
דוגמה:
--------
testDataDir <-file.path(rxGetOption("sampleDataDir"))
rxSummary (incwage ~ מין: מצב, נתונים = file.path (testDataDir, "CensusWorkers.xdf"))
מספר תצפיות חוקי: 351121
מספר תצפיות חסרות: 0
ValidObs מקסימום מינימום של סטיית תקן שם הממוצע
incwage:sex:state 35333.84 40444.54 0 354000 351121
סטטיסטיקה לפי קטגוריה (6 קטגוריות):
מצב מין קטגוריה פירושו סטיית תקן נאמדת
incwage עבור מין זכר, מצב = = Connecticut זכר Connecticut 55002.00 67742.93
incwage עבור מין נקבה, מצב = = Connecticut נקבה Connecticut 32605.03 34426.27
incwage עבור מין זכר, מצב = = אינדיאנה אינדיאנה זכר 38325.33 36160.07
incwage עבור מין נקבה, מצב = = אינדיאנה אינדיאנה נקבה 23117.71 20371.68
incwage עבור מין זכר, מצב = = וושינגטון Washington זכר 41001.14 43962.65
incwage עבור מין נקבה, מצב = = וושינגטון Washington נקבה 25765.03 25191.75
MissingObs ValidObs מקסימום מינימום
0 354000 41751 0
0 354000 37666 0
0 314000 74221 0
0 314000 63702 0
0 336000 73372 0
0 336000 60409 0
באפשרותך להשתמש בארגומנט 'rowSelection' קבוצת משנה נוספת הנתונים שלך בהתבסס על ערכים מסוימים של חלק המשתנים. פונקציה שימושית אחרת היא הפונקציה 'F()', המורה RevoScaleR כדי להתייחס למשתנה מסוים כגורם:
דוגמה:
--------
# # # לקבל מידע על סוגי המשתנים בקובץ XDF
rxGetInfo(file.path(testDataDir,"CensusWorkers.xdf"), getVarInfo = TRUE)
rxSummary (incwage ~ F (גיל): מין, נתונים = file.path(testDataDir,"CensusWorkers.xdf"), rowSelection = (מצב = = "אינדיאנה"))