Захист від втрати даних (DLP) у SharePoint Server 2016 поширюється на 10 типів конфіденційної інформації, які передбачено відповідними політиками. У цій статті перелічено всі ці типи, а також описано, як саме політика захисту від втрати даних виявляє кожен із них. Кожен тип конфіденційної інформації визначається за шаблоном, який задається за допомогою регулярного виразу або функції. Для виявлення конфіденційної інформації також можуть застосовуватися додаткові засоби, наприклад пошук ключових слів і перевірка контрольної суми. При цьому враховується показник імовірності та віддаленість слів один від одного в тексті.
Маршрутний код банку ABA
Формат
Дев’ять цифр за форматованим або неформатованим шаблоном
Шаблон
Форматований:
чотири цифри, які починаються з 0, 1, 2, 3, 6, 7 або 8;
дефіс;
чотири цифри;
дефіс;
цифра.
Неформатований:
Дев’ять цифр без роздільників, які починаються з 0, 1, 2, 3, 6, 7 або 8.
Контрольна сума
Ні
Визначення
Політика захисту від втрати даних з імовірністю 75% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:
функція Func_aba_routing знаходить вміст, який відповідає шаблону;
виявляється ключове слово зі списку Keyword_ABA_Routing .
<!-- ABA Routing Number -->
<Entity id="cb353f78-2b72-4c3c-8827-92ebe4f69fdf" patternsProximity="300" recommendedConfidence="75">
<Pattern confidenceLevel="75">
<IdMatch idRef="Func_aba_routing" />
<Match idRef="Keyword_ABA_Routing" />
</Pattern>
</Entity>
Ключові слова
Keyword_ABA_Routing
aba
aba #
aba routing #
aba routing number
aba#
abarouting#
aba number
abaroutingnumber
american bank association routing #
american bank association routing number
americanbankassociationrouting#
americanbankassociationroutingnumber
bank routing number
bankrouting#
bankroutingnumber
routing transit number
RTN
Номер кредитної картки
Формат
16 цифр, які можуть бути форматованими або неформатованими (цццццццццццццццц), а також мають пройти перевірку за алгоритмом Луна.
Шаблон
Дуже складний і надійний шаблон, за допомогою якого розпізнаються всі поширені кредитні картки, зокрема Visa, Mastercard, Discover Card, JCB, American Express, подарункові картки та картки Diners Club.
Контрольна сума
Так (розраховується за алгоритмом Луна)
Визначення
Політика захисту від втрати даних з імовірністю 85% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:
функція Func_credit_card знаходить вміст, який відповідає шаблону;
виконується одна з таких умов:
виявляється ключове слово зі списку Keyword_cc_verification ;
виявляється ключове слово зі списку Keyword_cc_name ;
функція Func_expiration_date знаходить дату в правильному форматі.
контрольна сума успішно проходить перевірку.
Політика захисту від втрати даних з імовірністю 65% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:
функція Func_credit_card знаходить вміст, який відповідає шаблону;
контрольна сума успішно проходить перевірку.
<!-- Credit Card Number -->
<Entity id="50842eb7-edc8-4019-85dd-5a5c1f2bb085" patternsProximity="300" recommendedConfidence="85">
<Pattern confidenceLevel="85">
<IdMatch idRef="Func_credit_card" />
<Any minMatches="1">
<Match idRef="Keyword_cc_verification" />
<Match idRef="Keyword_cc_name" />
<Match idRef="Func_expiration_date" />
</Any>
</Pattern>
<Pattern confidenceLevel="65">
<IdMatch idRef="Func_credit_card" />
</Pattern>
</Entity>
Ключові слова
Keyword_cc_verification
Keyword_cc_name
card verification
card identification number
cvn
cid
cvc2
cvv2
pin block
security code
security number
security no
issue number
issue no
cryptogramme
numéro de sécurité
numero de securite
kreditkartenprüfnummer
kreditkartenprufnummer
prüfziffer
prufziffer
sicherheits Kode
sicherheitscode
sicherheitsnummer
verfalldatum
codice di verifica
cod. sicurezza
cod sicurezza
n autorizzazione
código
codigo
cod. seg
cod seg
código de segurança
codigo de seguranca
codigo de segurança
código de seguranca
cód. segurança
cod. seguranca
cod. segurança
cód. seguranca
cód segurança
cod seguranca
cod segurança
cód seguranca
número de verificação
numero de verificacao
ablauf
gültig bis
gültigkeitsdatum
gultig bis
gultigkeitsdatum
scadenza
data scad
fecha de expiracion
fecha de venc
vencimiento
válido hasta
valido hasta
vto
data de expiração
data de expiracao
data em que expira
validade
valor
vencimento
Venc
amex
american express
americanexpress
Visa
mastercard
master card
mc
mastercards
master cards
diner’s Club
diners club
dinersclub
discover card
discovercard
discover cards
JCB
japanese card bureau
carte blanche
carteblanche
credit card
cc#
cc#:
expiration date
exp date
expiry date
date d’expiration
date d’exp
date expiration
bank card
bankcard
card number
card num
cardnumber
cardnumbers
card numbers
creditcard
credit cards
creditcards
ccn
card holder
cardholder
card holders
cardholders
check card
checkcard
check cards
checkcards
debit card
debitcard
debit cards
debitcards
atm card
atmcard
atm cards
atmcards
enroute
en route
card type
carte bancaire
carte de crédit
carte de credit
numéro de carte
numero de carte
nº de la carte
nº de carte
kreditkarte
karte
karteninhaber
karteninhabers
kreditkarteninhaber
kreditkarteninstitut
kreditkartentyp
eigentümername
kartennr
kartennummer
kreditkartennummer
kreditkarten-nummer
carta di credito
carta credito
n. carta
n carta
nr. carta
nr carta
numero carta
numero della carta
numero di carta
tarjeta credito
tarjeta de credito
tarjeta crédito
tarjeta de crédito
tarjeta de atm
tarjeta atm
tarjeta debito
tarjeta de debito
tarjeta débito
tarjeta de débito
nº de tarjeta
no. de tarjeta
no de tarjeta
numero de tarjeta
número de tarjeta
tarjeta no
tarjetahabiente
cartão de crédito
cartão de credito
cartao de crédito
cartao de credito
cartão de débito
cartao de débito
cartão de debito
cartao de debito
débito automático
debito automatico
número do cartão
numero do cartão
número do cartao
numero do cartao
número de cartão
numero de cartão
número de cartao
numero de cartao
nº do cartão
nº do cartao
nº. do cartão
no do cartão
no do cartao
no. do cartão
no. do cartao
Номер дебетової картки, ЄС
Формат
16 цифр
Шаблон
Дуже складний і надійний шаблон
Контрольна сума
Так
Визначення
Політика захисту від втрати даних з імовірністю 85% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:
функція Func_eu_debit_card знаходить вміст, який відповідає шаблону;
виконується щонайменше одна з таких умов:
виявляється ключове слово зі списку Keyword_eu_debit_card ;
виявляється ключове слово зі списку Keyword_card_terms_dict ;
виявляється ключове слово зі списку Keyword_card_security_terms_dict ;
виявляється ключове слово зі списку Keyword_card_expiration_terms_dict ;
функція Func_eu_date1 знаходить дату в правильному форматі;
функція Func_eu_date2 знаходить дату в правильному форматі.
контрольна сума успішно проходить перевірку.
<!-- EU Debit Card Number -->
<Entity id="0e9b3178-9678-47dd-a509-37222ca96b42" patternsProximity="300" recommendedConfidence="85">
<Pattern confidenceLevel="85">
<IdMatch idRef="Func_eu_debit_card" />
<Any minMatches="1">
<Match idRef="Keyword_eu_debit_card" />
<Match idRef="Keyword_card_terms_dict" />
<Match idRef="Keyword_card_security_terms_dict" />
<Match idRef="Keyword_card_expiration_terms_dict" />
<Match idRef="Func_expiration_date" />
<Match idRef="Func_eu_date" />
<Match idRef="Func_eu_date1" />
<Match idRef="Func_eu_date2" />
</Any>
</Pattern>
</Entity>
Ключові слова
Keyword_eu_debit_card
Keyword_card_terms_dict
Keyword_card_security_terms_dict
Keyword_card_expiration_terms_dict
account number
card number
card no.
security number
cc#
acct nbr
acct num
acct no
american express
americanexpress
americano espresso
amex
atm card
atm cards
atm kaart
atmcard
atmcards
atmkaart
atmkaarten
bancontact
bank card
bankkaart
card holder
card holders
card num
card number
card numbers
card type
cardano numerico
cardholder
cardholders
cardnumber
cardnumbers
carta bianca
carta credito
carta di credito
cartao de credito
cartao de crédito
cartao de debito
cartao de débito
carte bancaire
carte blanche
carte bleue
carte de credit
carte de crédit
carte di credito
carteblanche
cartão de credito
cartão de crédito
cartão de debito
cartão de débito
cb
ccn
check card
check cards
checkcard
checkcards
chequekaart
cirrus
cirrus-edc-maestro
controlekaart
controlekaarten
credit card
credit cards
creditcard
creditcards
debetkaart
debetkaarten
debit card
debit cards
debitcard
debitcards
debito automatico
diners club
dinersclub
discover
discover card
discover cards
discovercard
discovercards
débito automático
edc
eigentümername
european debit card
hoofdkaart
hoofdkaarten
in viaggio
japanese card bureau
japanse kaartdienst
jcb
kaart
kaart num
kaartaantal
kaartaantallen
kaarthouder
kaarthouders
karte
karteninhaber
karteninhabers
kartennr
kartennummer
kreditkarte
kreditkarten-nummer
kreditkarteninhaber
kreditkarteninstitut
kreditkartennummer
kreditkartentyp
maestro
master card
master cards
mastercard
mastercards
mc
mister cash
n carta
n. carta
no de tarjeta
no do cartao
no do cartão
no. de tarjeta
no. do cartao
no. do cartão
nr carta
nr. carta
numeri di scheda
numero carta
numero de cartao
numero de carte
numero de cartão
numero de tarjeta
numero della carta
numero di carta
numero di scheda
numero do cartao
numero do cartão
numéro de carte
nº carta
nº de carte
nº de la carte
nº de tarjeta
nº do cartao
nº do cartão
nº. do cartão
número de cartao
número de cartão
número de tarjeta
número do cartao
scheda dell’assegno
scheda dell’atmosfera
scheda dell’atmosfera
scheda della banca
scheda di controllo
scheda di debito
scheda matrice
schede dell’atmosfera
schede di controllo
schede di debito
schede matrici
scoprono la scheda
scoprono le schede
solo
supporti di scheda
supporto di scheda
switch
tarjeta atm
tarjeta credito
tarjeta de atm
tarjeta de credito
tarjeta de debito
tarjeta debito
tarjeta no
tarjetahabiente
tipo della scheda
ufficio giapponese della
scheda
v pay
v-pay
visa
visa plus
visa electron
visto
visum
vpay
card identification number
card verification
cardi la verifica
cid
cod seg
cod seguranca
cod segurança
cod sicurezza
cod. seg
cod. seguranca
cod. segurança
cod. sicurezza
codice di sicurezza
codice di verifica
codigo
codigo de seguranca
codigo de segurança
crittogramma
cryptogram
cryptogramme
cv2
cvc
cvc2
cvn
cvv
cvv2
cód seguranca
cód segurança
cód. seguranca
cód. segurança
código
código de seguranca
código de segurança
de kaart controle
geeft nr uit
issue no
issue number
kaartidentificatienummer
kreditkartenprufnummer
kreditkartenprüfnummer
kwestieaantal
no. dell’edizione
no. di sicurezza
numero de securite
numero de verificacao
numero dell’edizione
numero di identificazione della
scheda
numero di sicurezza
numero van veiligheid
numéro de sécurité
nº autorizzazione
número de verificação
perno il blocco
pin block
prufziffer
prüfziffer
security code
security no
security number
sicherheits kode
sicherheitscode
sicherheitsnummer
speldblok
veiligheid nr
veiligheidsaantal
veiligheidscode
veiligheidsnummer
verfalldatum
ablauf
data de expiracao
data de expiração
data del exp
data di exp
data di scadenza
data em que expira
data scad
data scadenza
date de validité
datum afloop
datum van exp
de afloop
espira
espira
exp date
exp datum
expiration
expire
expires
expiry
fecha de expiracion
fecha de venc
gultig bis
gultigkeitsdatum
gültig bis
gültigkeitsdatum
la scadenza
scadenza
valable
validade
valido hasta
valor
venc
vencimento
vencimiento
verloopt
vervaldag
vervaldatum
vto
válido hasta
Код SWIFT
Формат
Чотири букви, за якими слідує від 5 до 31 букви або цифри
Шаблон
Чотири букви, за якими слідує від 5 до 31 букви або цифри:
чотири букви (без урахування регістру) – код банку;
пробіл (необов’язково);
4–28 букв або цифр – основний номер банківського рахунку (BBAN);
пробіл (необов’язково);
1–3 букви або цифри – решта номера BBAN.
Контрольна сума
Ні
Визначення
Політика захисту від втрати даних з імовірністю 75% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:
регулярний вираз Regex_swift знаходить вміст, який відповідає шаблону;
виявляється ключове слово зі списку Keyword_swift .
<Entity id="cb2ab58c-9cb8-4c81-baf8-a4e106791df4" patternsProximity="300" recommendedConfidence="75">
<Pattern confidenceLevel="75">
<IdMatch idRef="Regex_swift" />
<Match idRef="Keyword_swift" />
</Pattern>
</Entity>
Ключові слова
Keyword_swift
international organization for standardization 9362
iso 9362
iso9362
swift#
swiftcode
swiftnumber
swiftroutingnumber
swift code
swift number #
swift routing number
bic number
bic code
bic #
bic#
bank identifier code
標準化9362
迅速#
SWIFTコード
SWIFT番号
迅速なルーティング番号
BIC番号
BICコード
銀行識別コードのための国際組織
Organisation internationale de normalisation 9362
rapide #
code SWIFT
le numéro de swift
swift numéro d’acheminement
le numéro BIC
# BIC
code identificateur de banque
Номер національного страхування (NINO), Сполучене Королівство
Формат
7 або 9 символів, розділених пробілами чи тире
Шаблон
Можливі два шаблони:
дві букви (у допустимому NINO в цьому префіксі використовуються лише певні символи, які перевіряє цей шаблон; регістр не враховується);
шість цифр;
букви A, B, C або D (як і в префіксі, у суфіксі також допускаються лише певні символи; регістр не враховується).
АБО
дві букви;
пробіл або тире;
дві цифри;
пробіл або тире;
дві цифри;
пробіл або тире;
дві цифри;
пробіл або тире;
букви A, B, C або D.
Контрольна сума
Ні
Визначення
Політика захисту від втрати даних з імовірністю 85% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:
функція Func_uk_nino знаходить вміст, який відповідає шаблону;
виявляється ключове слово зі списку Keyword_uk_nino .
Політика захисту від втрати даних з імовірністю 75% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:
функція Func_uk_nino знаходить вміст, який відповідає шаблону;
не виявляється жодне ключове слово зі списку Keyword_uk_nino .
<!-- U.K. NINO -->
<Entity id="16c07343-c26f-49d2-a987-3daf717e94cc" patternsProximity="300" recommendedConfidence="75">
<Pattern confidenceLevel="85">
<IdMatch idRef="Func_uk_nino" />
<Any minMatches="1">
<Match idRef="Keyword_uk_nino" />
</Any>
</Pattern>
<Pattern confidenceLevel="75">
<IdMatch idRef="Func_uk_nino" />
<Any minMatches="0" maxMatches="0">
<Match idRef="Keyword_uk_nino" />
</Any>
</Pattern>
</Entity>
Ключові слова
Keyword_uk_nino
national insurance number
national insurance contributions
protection act
insurance
social security number
insurance application
medical application
social insurance
medical attention
social security
great britain
insurance
Номер паспорта, США та Сполучене Королівство
Формат
Дев’ять цифр
Шаблон
Дев’ять цифр без роздільників
Контрольна сума
Ні
Визначення
Політика захисту від втрати даних з імовірністю 75% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:
функція Func_usa_uk_passport знаходить вміст, який відповідає шаблону;
виявляється ключове слово зі списку Keyword_passport .
<Entity id="178ec42a-18b4-47cc-85c7-d62c92fd67f8" patternsProximity="300" recommendedConfidence="75">
<Pattern confidenceLevel="75">
<IdMatch idRef="Func_usa_uk_passport" />
<Match idRef="Keyword_passport" />
</Pattern>
</Entity>
Ключові слова
Keyword_passport
Passport Number
Passport No
Passport #
Passport#
PassportID
Passportno
passportnumber
パスポート
パスポート番号
パスポートのNum
パスポート#
Numéro de passeport
Passeport n °
Passeport Non
Passeport #
Passeport#
PasseportNon
Passeportn °
Номер банківського рахунку, США
Формат
4–17 цифр
Шаблон
4–17 цифр без роздільників
Контрольна сума
Ні
Визначення
Політика захисту від втрати даних з імовірністю 75% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:
регулярний вираз Regex_usa_bank_account_number знаходить вміст, який відповідає шаблону;
виявляється ключове слово зі списку Keyword_usa_Bank_Account .
<!-- U.S. Bank Account Number -->
<Entity id="a2ce32a8-f935-4bb6-8e96-2a5157672e2c" patternsProximity="300" recommendedConfidence="75">
<Pattern confidenceLevel="75">
<IdMatch idRef="Regex_usa_bank_account_number" />
<Match idRef="Keyword_usa_Bank_Account" />
</Pattern>
</Entity>
Ключові слова
Keyword_usa_Bank_Account
Checking Account Number
Checking Account
Checking Account #
Checking Acct Number
Checking Acct #
Checking Acct No.
Checking Account No.
Bank Account Number
Bank Account #
Bank Acct Number
Bank Acct #
Bank Acct No.
Bank Account No.
Savings Account Number
Savings Account.
Savings Account #
Savings Acct Number
Savings Acct #
Savings Acct No.
Savings Account No.
Debit Account Number
Debit Account
Debit Account #
Debit Acct Number
Debit Acct #
Debit Acct No.
Debit Account No.
Номер посвідчення водія, США
Формат
Залежить від штату
Шаблон
Залежить від штату. Наприклад, у Нью-Йорку:
Контрольна сума
Ні
Визначення
Політика захисту від втрати даних з імовірністю 75% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:
функція Func_new_york_drivers_license_number знаходить вміст, який відповідає шаблону;
виявляється ключове слово зі списку Keyword_[state_name]_drivers_license_name ;
виявляється ключове слово зі списку Keyword_us_drivers_license .
Політика захисту від втрати даних з імовірністю 65% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:
функція Func_new_york_drivers_license_number знаходить вміст, який відповідає шаблону;
виявляється ключове слово зі списку Keyword_[state_name]_drivers_license_name ;
виявляється ключове слово зі списку Keyword_us_drivers_license_abbreviations ;
не виявляється жодне ключове слово зі списку Keyword_us_drivers_license .
<Pattern confidenceLevel="75">
<IdMatch idRef="Func_new_york_drivers_license_number" />
<Match idRef="Keyword_new_york_drivers_license_name" />
<Match idRef="Keyword_us_drivers_license" />
</Pattern>
<Pattern confidenceLevel="65">
<IdMatch idRef="Func_new_york_drivers_license_number" />
<Match idRef="Keyword_new_york_drivers_license_name" />
<Match idRef="Keyword_us_drivers_license_abbreviations" />
<Any minMatches="0" maxMatches="0">
<Match idRef="Keyword_us_drivers_license" />
</Any>
</Pattern>
Ключові слова
Keyword_us_drivers_license_abbreviations
Keyword_us_drivers_license
Keyword_[state_name]_drivers_license_name
DL
DLS
CDL
CDLS
ID
IDs
DL#
DLS#
CDL#
CDLS#
ID#
IDs#
ID number
ID numbers
LIC
LIC#
DriverLic
DriverLics
DriverLicense
DriverLicenses
Driver Lic
Driver Lics
Driver License
Driver Licenses
DriversLic
DriversLics
DriversLicense
DriversLicenses
Drivers Lic
Drivers Lics
Drivers License
Drivers Licenses
Driver’Lic
Driver’Lics
Driver’License
Driver’Licenses
Driver’ Lic
Driver’ Lics
Driver’ License
Driver’ Licenses
Driver’sLic
Driver’sLics
Driver’sLicense
Driver’sLicenses
Driver’s Lic
Driver’s Lics
Driver’s License
Driver’s Licenses
identification number
identification numbers
identification #
id card
id cards
identification card
identification cards
DriverLic#
DriverLics#
DriverLicense#
DriverLicenses#
Driver Lic#
Driver Lics#
Driver License#
Driver Licenses#
DriversLic#
DriversLics#
DriversLicense#
DriversLicenses#
Drivers Lic#
Drivers Lics#
Drivers License#
Drivers Licenses#
Driver’Lic#
Driver’Lics#
Driver’License#
Driver’Licenses#
Driver’ Lic#
Driver’ Lics#
Driver’ License#
Driver’ Licenses#
Driver’sLic#
Driver’sLics#
Driver’sLicense#
Driver’sLicenses#
Driver’s Lic#
Driver’s Lics#
Driver’s License#
Driver’s Licenses#
id card#
id cards#
identification card#
identification cards#
Абревіатура штату (наприклад, NY)
Назва штату (наприклад, New York)
Індивідуальний податковий номер (ITIN), США
Формат
Дев’ять цифр, які можуть розділятися пробілами або тире (перша цифра – 9, четверта – 7 або 8)
Шаблон
Форматований:
цифра 9;
дві цифри;
пробіл або тире;
цифра 7 або 8;
цифра;
пробіл або тире;
чотири цифри.
Неформатований:
цифра 9;
дві цифри;
цифра 7 або 8;
п’ять цифр.
Контрольна сума
Ні
Визначення
Політика захисту від втрати даних з імовірністю 85% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:
функція Func_formatted_itin знаходить вміст, який відповідає шаблону;
виконується щонайменше одна з таких умов:
виявляється ключове слово зі списку Keyword_itin ;
функція Func_us_address знаходить адресу в правильному форматі;
функція Func_us_date знаходить дату в правильному форматі;
виявляється ключове слово зі списку Keyword_itin_collaborative .
Політика захисту від втрати даних з імовірністю 75% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:
функція Func_unformatted_itin знаходить вміст, який відповідає шаблону;
виконується щонайменше одна з таких умов:
виявляється ключове слово зі списку Keyword_itin_collaborative ;
функція Func_us_address знаходить адресу в правильному форматі;
функція Func_us_date знаходить дату в правильному форматі.
<!-- U.S. Individual Taxpayer Identification Number (ITIN) -->
<Entity id="e55e2a32-f92d-4985-a35d-a0b269eb687b" patternsProximity="300" recommendedConfidence="75">
<Pattern confidenceLevel="85">
<IdMatch idRef="Func_formatted_itin" />
<Any minMatches="1">
<Match idRef="Keyword_itin" />
<Match idRef="Func_us_address" />
<Match idRef="Func_us_date" />
<Match idRef="Keyword_itin_collaborative" />
</Any>
</Pattern>
<Pattern confidenceLevel="75">
<IdMatch idRef="Func_unformatted_itin" />
<Match idRef="Keyword_itin" />
<Any minMatches="1">
<Match idRef="Keyword_itin_collaborative" />
<Match idRef="Func_us_address" />
<Match idRef="Func_us_date" />
</Any>
</Pattern>
</Entity>
Ключові слова
Keyword_itin
Keyword_itin_collaborative
taxpayer
tax id
tax identification
itin
ssn
tin
social security
tax payer
itins
taxid
individual taxpayer
License
DL
DOB
Birthdate
Birthday
Date of Birth
Номер соціального страхування (SSN), США
Формат
Дев’ять цифр за форматованим або неформатованим шаблоном
Примітка.: Номери соціального страхування, видані до середини 2011 року, мають строгий формат, згідно з яким певні частини номера мають входити у визначені діапазони (при цьому немає контрольної суми).
Шаблон
Пошук SSN виконують чотири функції з використанням чотирьох різних шаблонів:
Func_ssn знаходить SSN у строгому форматі з тире або пробілами (ццц-цц-цццц АБО ццц цц цццц), які видано до 2011 року;
Func_unformatted_ssn знаходить неформатовані SSN у вигляді дев’яти цифр без роздільників (ццццццццц), які видано до 2011 року;
Func_randomized_formatted_ssn знаходить SSN, розділені тире або пробілами (ццц-цц-цццц АБО ццц цц цццц), які видано після 2011 року;
Func_randomized_unformatted_ssn знаходить неформатовані SSN у вигляді дев’яти цифр без роздільників (ццццццццц), які видано після 2011 року.
Контрольна сума
Ні
Визначення
Політика захисту від втрати даних з імовірністю 85% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:
Політика захисту від втрати даних з імовірністю 75% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:
функція Func_unformatted_ssn знаходить вміст, який відповідає шаблону;
виявляється ключове слово зі списку Keyword_ssn ;
виконується щонайменше одна з таких умов:
Політика захисту від втрати даних з імовірністю 65% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:
функція Func_randomized_formatted_ssn знаходить вміст, який відповідає шаблону;
функція Func_ssn не знаходить вміст, який відповідає шаблону;
виконується щонайменше одна з таких умов:
виявляється ключове слово зі списку Keyword_ssn ;
функція Func_us_date знаходить дату в правильному форматі;
функція Func_us_address знаходить адресу в правильному форматі.
Політика захисту від втрати даних з імовірністю 55% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:
функція Func_randomized_unformatted_ssn знаходить вміст, який відповідає шаблону;
виявляється ключове слово зі списку Keyword_ssn ;
функція Func_unformatted_ssn не знаходить вміст, який відповідає шаблону;
виконується щонайменше одна з таких умов:
<!-- U.S. Social Security Number (SSN) -->
<Entity id="a44669fe-0d48-453d-a9b1-2cc83f2cba77" patternsProximity="300" recommendedConfidence="75">
<Pattern confidenceLevel="85">
<IdMatch idRef="Func_ssn" />
<Any minMatches="1">
<Match idRef="Keyword_ssn" />
<Match idRef="Func_us_date" />
<Match idRef="Func_us_address" />
</Any>
</Pattern>
<Pattern confidenceLevel="75">
<IdMatch idRef="Func_unformatted_ssn" />
<Match idRef="Keyword_ssn" />
<Any minMatches="1">
<Match idRef="Func_us_date" />
<Match idRef="Func_us_address" />
</Any>
</Pattern>
<Pattern confidenceLevel="65">
<IdMatch idRef="Func_randomized_formatted_ssn" />
<Any minMatches="0" maxMatches="0">
<Match idRef="Func_ssn" />
</Any>
<Any minMatches="1">
<Match idRef="Keyword_ssn" />
<Match idRef="Func_us_date" />
<Match idRef="Func_us_address" />
</Any>
</Pattern>
<Pattern confidenceLevel="55">
<IdMatch idRef="Func_randomized_unformatted_ssn" />
<Match idRef="Keyword_ssn" />
<Any minMatches="0" maxMatches="0">
<Match idRef="Func_unformatted_ssn" />
</Any>
<Any minMatches="1">
<Match idRef="Func_us_date" />
<Match idRef="Func_us_address" />
</Any>
</Pattern>
</Entity>
Ключові слова
Keyword_ssn
Social Security
Social Security#
Soc Sec
SSN
SSNS
SSN#
SS#
SSID