Осигуряване на качеството: Как RevoScaleR chunking алгоритми работа?

Можете да използвате едни и същи RevoScaleR функции за обработка на големи набори от данни, съхранявани на диск, както и можете да анализирате данните в паметта рамки. Това е защото RevoScaleR функции използват "трясък" алгоритми. По принцип трясък алгоритми следват този процес:

  1. Инициализация: междинни резултати, необходими за изчисляване на крайната статистика се инициализира

  2. Четене на данни: Прочетете блок (набор от наблюдения на променливи) на данни

  3. Преобразуване на данни: извършване на трансформации и избор на ред за количество данни при необходимост; запис на данни само ако извършите импортиране или данни стъпка

  4. Обработка на данни: изчисляване на междинни резултати за блок на данни

  5. Актуализиране на резултати: комбинира резултатите от блок на данни с тези на предишния блокове

  6. Повторете стъпки 2 - (5) (може би паралелно) до всички данни е била обработена

  7. Обработка на резултатите: при приключване на резултатите от всички блокове, направете Последни изчисления и връща резултати

Нуждаете се от още помощ?

Разширете уменията си
Преглед на обучението
Получавайте първи новите функции
Присъединете се към Microsoft приобщени

Беше ли полезна тази информация?

Благодарим ви за обратната връзка!

Благодарим ви за вашата обратна връзка. Изглежда, че ще бъде полезно да ви свържем с един от нашите агенти по поддръжката на Office.

×