Napomena o transparentnosti za Microsoft Copilot

Zadnje ažuriranje: 19. prosinca 2025.

Što je bilješka o transparentnosti?

Sustav umjetne inteligencije uključuje ne samo tehnologiju, već i ljude koji će ga koristiti, ljude na koje će utjecati i okruženje u kojem se koristi. Microsoftove napomene o transparentnosti namijenjene su da vam pomognu razumjeti kako funkcionira tehnologija umjetne inteligencije iza značajke Copilot, koje smo odabire donijeli koji utječu na performanse i ponašanje sustava te važnost razmišljanja o cijelom sustavu tako da korisnici značajke Copilot mogu preuzeti kontrolu nad vlastitim iskustvima i razumjeti korake koje poduzimamo kako bismo pružili siguran i siguran proizvod.

Microsoftove bilješke o transparentnosti dio su većeg nastojanja Microsofta da naša načela umjetne inteligencije provede u praksi. Da biste saznali više, pogledajte Načela Microsoft AI.

Osnove Microsoft Copilot

Uvod

Copilot je okruženje utemeljeno na umjetnoj inteligenciji koje će korisnicima pružiti informacije koje traže dok su spremni podržati korisnike u odgovaranju na širok raspon pitanja neovisno o situaciji ili temi. Osvježeni Copilot nadilazi odgovaranje na osnovne upite za dohvaćanje informacija i fokusira se na generiranje sadržaja kako bi korisnicima ponudio proaktivniju podršku prilikom dovršavanja zadataka. Sve bolje razumijemo kako umjetna inteligencija ima potencijal da pomogne ljudima da uče, otkrivaju i budu kreativniji, zbog čega smo morali izgraditi drugačiju vrstu proizvoda. Novo sučelje Copilot nastoji postati nova vrsta iskustva koja je otvorena i dinamična kako bi bolje odgovarala potrebama korisnika na intuitivniji način.

U Microsoftu ozbiljno prihvaćamo svoju predanost odgovornom AI-ju. Ažurirano sučelje za Copilot razvijeno je u skladu s Microsoftovim načelima umjetne inteligencije, Microsoftovim standardom za odgovorni AI te u partnerstvu sa stručnjacima za odgovorni AI u cijeloj tvrtki, uključujući Microsoftov Ured za odgovorni AI, naše inženjerske timove, Microsoft Research i Aether. Dodatne informacije o odgovornoj umjetnoj inteligenciji u Microsoftu potražite ovdje.

U ovom dokumentu opisujemo naš pristup odgovornoj umjetnoj inteligenciji AI za Copilot. Prije objavljivanja koristili smo najsuvremenije Microsoftove metode za mapiranje, mjerenje i upravljanje potencijalnim rizicima i zloupotrebom sustava te za osiguranje njegovih prednosti za korisnike. Kako smo nastavili razvijati Copilot, nastavili smo učiti i poboljšavati naše napore u području odgovornog AI-ja. Ovaj dokument će se povremeno ažurirati kako bi se prikazali naši procesi i metode koje se razvijaju.

Ključni pojmovi

Klasifikatori Modeli strojnog učenja koji olakšavaju sortiranje podataka u označene klase ili kategorije informacija. U ažuriranom iskustvu značajke Copilot jedan od načina na koji koristimo klasifikatore je da bismo lakše otkrili potencijalno štetan sadržaj koji su poslali korisnici ili generirao sustav kako bi se ublažilo stvaranje tog sadržaja i zloupotreba ili zloupotreba sustava.

Utemeljivanje Za određene razgovore u kojima korisnici traže informacije, Copilot se temelji na rezultatima pretraživanja weba. To znači da Copilot usmjerava svoj odgovor na sadržaj visokog ranga s weba i pruža hiperveze citate nakon generiranih tekstualnih odgovora. Imajte na umu da u ovom trenutku korisnički upiti u glasovnom načinu neće pokrenuti pretraživanje weba, stoga nijedan odgovor neće uključivati citate.

Veliki jezični modeli (LLM-ovi) Veliki jezični modeli (LLM-ovi) u ovom kontekstu su modeli umjetne inteligencije koji su uvježbani na velikim količinama tekstnih podataka radi predviđanja riječi u nizovima. LLM mogu obavljati različite zadatke, kao što su generiranje teksta, sažimanje, prijevod, klasifikacija i još mnogo toga.

Ublažavanje Metoda ili kombinacija metoda osmišljenih za smanjenje potencijalnih rizika koji mogu nastati korištenjem značajki umjetne inteligencije u sustavu Copilot.

Multimodalni modeli (MMM-ovi) Multimodalni modeli (MMM) modeli su umjetne inteligencije koji se uvježbavaju na različitim vrstama podataka, kao što su tekst, slike ili zvuk. Ti modeli mogu obavljati različite zadatke, kao što je pisanje teksta, opisivanje slika, prepoznavanje govora i pronalaženje informacija za različite vrste podataka.

Upiti Unosi u obliku teksta, slika i/ili zvuka koje korisnik šalje značajci Copilot radi interakcije sa značajkama umjetne inteligencije u značajci Copilot.

Crveni tim Tehnike kojima se stručnjaci služe za procjenu ograničenja i ranjivosti sustava te za testiranje djelotvornosti planiranih ublažavanja. Testiranje crvenog tima uključuje testere koji usvajaju i benigne i suparničke osobnosti kako bi identificirali potencijalne rizike i razlikuju se od sustavnog mjerenja rizika.

Odgovori Tekst, slike ili zvuk koje Copilot emitira kao odgovor na upit ili kao dio razmjene s korisnikom. Sinonimi za "odgovor" obuhvaćaju "dovršetak", "generacija i "odgovor".

Mali jezični modeli (SLM-ovi) Mali jezični modeli (SLM-ovi) u ovom kontekstu su modeli umjetne inteligencije koji se uvježbavaju na manjim, fokusiranijim količinama podataka u usporedbi s velikim jezičnim modelima. Unatoč manjoj veličini, SLM-ovi mogu obavljati razne zadatke, kao što su generiranje teksta, sažimanje, prijevod i klasifikacija. Iako se možda ne podudaraju s opsežnim mogućnostima LLM-ova, SLM-ovi su često resursno učinkovitiji i mogu biti vrlo učinkoviti za specifične, ciljane aplikacije.

Poruka sustava Poruka sustava (ponekad se naziva i "metaprompt") program je koji služi za vođenje ponašanja sustava. Dijelovi poruke sustava pomažu u usklađivanju ponašanja sustava s načelima Microsoft AI i očekivanjima korisnika. Poruka sustava može, primjerice, sadržavati redak kao što je "ne pružaj informacije ili ne stvaraj sadržaj koji bi mogao uzrokovati fizičku, emocionalnu ili financijsku štetu".

Mogućnosti

Ponašanje sustava

Uz Copilot smo razvili inovativan pristup kako bismo korisnicima omogućili personaliziranije korisničko sučelje umjetne inteligencije za privlačno iskustvo koje korisnicima može pomoći s raznim zadacima. Ovaj inovativni pristup koristi različite napredne tehnologije, kao što su jezični i multimodalni modeli Microsofta, OpenAI-ja i drugih programera modela. Radili smo na implementaciji sigurnosnih tehnika za modele na kojima se temelji novo sučelje značajke Copilot prije javnog izdanja kako bismo razvili prilagođeni skup mogućnosti i ponašanja koja pružaju poboljšano iskustvo značajke Copilot. U ažuriranom rješenju Copilot korisnici mogu slati upite na prirodnom jeziku, tekstu ili glasu. Odgovori se korisnicima prikazuju u nekoliko različitih oblika, kao što su odgovori na čavrljanje u obliku teksta (s tradicionalnim poveznicama na web-sadržaj po potrebi) i slikama (ako je zahtjev za slikom upit upućen). Ako korisnici šalju upite glasom na prirodnom jeziku unutar načina rada Copilot Voice, primit će zvučne odgovore.

Kada korisnik unese upit u Copilotu, upit, povijest razgovora i poruka sustava šalju se putem nekoliko klasifikatora unosa radi filtriranja štetnog ili neprikladnog sadržaja. To je ključni prvi korak za poboljšanje performansi modela i ublažavanje situacija u kojima bi korisnici mogli pokušati postaviti upit modelu na način koji bi mogao biti nesiguran. Kada upit prođe kroz klasifikatore unosa, šalje se SLM-u da bi se odredilo zahtijeva li zahtjev utemeljivanje podataka s weba i koji jezični model treba odgovoriti na zahtjev. Svi modeli generiraju odgovor pomoću korisnikova upita i povijesti nedavnih razgovora za kontekstualizaciju zahtjeva, poruke sustava za usklađivanje odgovora s načelima Microsoft AI-ja i očekivanjima korisnika te, ako je prikladno, usklađivanje odgovora s rezultatima pretraživanja kako bi odgovore utemeljili na postojećem, visoko rangiranom sadržaju s weba.

Odgovori se korisnicima prikazuju u nekoliko različitih oblika, kao što su odgovori na čavrljanje u obliku teksta, tradicionalne veze na web-sadržaj, slike i audio odgovori. Kada su odgovori navedeni u obliku teksta – a odgovori su utemeljeni na podacima s weba – rezultat sadrži hiperveze citate navedene ispod teksta kako bi korisnici mogli pristupiti web-mjestima koja su korištena za utemeljivanje odgovora i tamo saznati više o temi. Copilot može i izvršavati kod za dovršavanje složenih izračuna i generiranje grafikona. Copilot može pohraniti određene činjenice koje korisnici zatraže da zapamti, što mu omogućuje generiranje relevantnijih odgovora i prijedloga na temelju tog konteksta. Copilot može izbrisati i spremljene činjenice kada korisnici izričito zatraže da ih zaborave.

Copilot korisnicima pomaže i u stvaranju novih priča, pjesama, tekstova pjesama i slika. Kada Copilot otkrije korisnikovu namjeru generiranja kreativnog sadržaja (kao što je korisnički upit koji počinje s "napiši mi ..."), sustav će u većini slučajeva generirati sadržaj koji reagira na korisnikov upit. Slično tome, kada Copilot otkrije korisnikovu namjeru generiranja slike (kao što je korisnički upit koji počinje s "nacrtaj mi ..."), Copilot će u većini slučajeva generirati sliku koja odgovara korisnikovu upitu. Kada Copilot otkrije korisnikovu namjeru izmjene prenesene slike (kao što je korisnički upit koji počinje s "dodaj ..."), Copilot će u većini slučajeva izmijeniti sliku koja odgovara korisnikovom upitu. Copilot možda neće odgovoriti s kreativnim sadržajem kada korisnički upit sadrži određene pojmove koji bi mogli rezultirati problematičnim sadržajem.

Korisnici s Microsoftovim računima (MSA) sada imaju i mogućnost pretplate na Copilot Pro, što nudi poboljšano iskustvo, uključujući ubrzane performanse, korištenje mogućnosti značajke Copilot Voice tijekom duljeg vremenskog razdoblja, a u nekim slučajevima i pristup novim, eksperimentalnim značajkama. Copilot Pro trenutačno je dostupan u ograničenom broju država, a Copilot Pro planiramo uskoro učiniti dostupnim na većem broju tržišta.

Predviđeno sigurnosno ponašanje

Naš je cilj za Copilot biti od pomoći korisnicima. Korištenjem najboljih praksi iz drugih Microsoftovih proizvoda i usluga generativnog AI-ja nastojimo ograničiti generiranje problematičnog sadržaja za Copilot i povećati vjerojatnost sigurnog i pozitivnog korisničkog iskustva. Iako smo poduzeli korake za ublažavanje rizika, modeli generativnog AI-ja poput onih koji stoje iza rješenja Copilot vjerojatno su i mogu pogriješiti, što znači da ublažavanja ponekad možda neće uspjeti blokirati štetne korisničke upite ili odgovore generirane od strane AI-ja. Ako naiđete na štetan ili neočekivan sadržaj prilikom upotrebe značajke Copilot, javite nam se slanjem povratnih informacija da bismo mogli nastaviti poboljšavati iskustvo.

Slučajevi upotrebe

Namjena

Copilot je namijenjen podršci korisnicima u odgovaranju na širok raspon pitanja bez obzira na situaciju ili temu. Korisnici mogu komunicirati s Copilotom pomoću tekstnih, slikovnih i zvučnih unosa gdje su interakcije namijenjene da se osjećaju kao prirodni razgovori sa sustavom umjetne inteligencije. Osim toga, ako korisnici komuniciraju sa značajkom Copilot putem teksta kako bi tražili određene informacije o temama za koje bi Copilot mogao zahtijevati više informacija za postizanje točnijeg odgovora, iskustvo je namijenjeno povezivanju korisnika s relevantnim rezultatima pretraživanja, pregledu rezultata s cijelog weba i sažimanju informacija koje korisnici traže. U sustavu Copilot korisnici mogu sljedeće:

Sažmite informacije u stvarnom vremenu prilikom čavrljanja putem SMS-a. Kada korisnici komuniciraju sa značajkom Copilot putem teksta, sustav će pretraživati web ako mu je potrebno više informacija i koristit će najbolje rezultate pretraživanja weba za generiranje sažetka informacija koje će prikazati korisnicima. Ti sažeci obuhvaćaju navode na web-stranice kako bi korisnici mogli vidjeti i jednostavno pristupiti izvorima za rezultate pretraživanja koji su pomogli prizemljiti sažetak rješenja Copilot. Korisnici mogu kliknuti na te veze da bi izravno došli do izvora ako žele saznati više.
Razgovarajte sa sustavom umjetne inteligencije pomoću teksta. Korisnici mogu čavrljati sa servisom Copilot putem SMS-a i postavljati dodatna pitanja kako bi pronašli nove informacije i dobili podršku za širok raspon tema.
Sučelje s umjetnom inteligencijom pomoću glasa i izgleda. Copilot ne samo da može primati audio ulaz, već i proizvesti audioizlaz u jednom od četiri glasa koje su odabrali korisnici i predstaviti vizualni izgled radi obogaćivanja interakcije. Mogućnosti pretvaranja zvuka u zvuk i izgled korisnicima omogućuju interakciju s Copilotom na prirodniji i fluidniji način.
Primajte probavljiv sadržaj vijesti. Korisnici mogu koristiti Copilot za primanje sažetka vijesti, vremenske prognoze i drugih ažuriranja na temelju odabranih tematskih područja putem značajke Dnevni pregled usluge Copilot i slušati te brifinge u obliku podcasta. Ova značajka će povlačiti sadržaj iz ovlaštenih izvora koji imaju ugovor s Microsoftom.
Zatražite pomoć za generiranje novih ideja. Svaki put kada korisnici komuniciraju s iskustvom značajke Copilot, vidjet će skup kartica koje mogu kliknuti kako bi započeli čavrljanje s iskustvom Copilot o korisnim i zanimljivim temama. Ako su korisnici koristili druge Microsoftove korisničke usluge, kartice će biti personalizirane u skladu s našim pravilima o zaštiti privatnosti. S vremenom se kartice u rješenju Copilot mogu personalizirati na temelju korisnikove povijesti čavrljanja. Korisnici mogu odustati od personalizacije u bilo kojem trenutku u postavkama.
Generirajte kreativni sadržaj. Prilikom čavrljanja s Copilotom korisnici mogu stvarati nove pjesme, viceve, priče, slike i drugi sadržaj uz pomoć iskustva Copilot. Copilot može i uređivati slike koje su prenijeli korisnici ako se to zatraži.
Obavljajte zadatke na Androidu. Korisnici mogu komunicirati s Copilotom putem platforme Android putem glasa radi izvođenja određenih zadataka. Ti zadaci su postavljanje brojača vremena i alarma, upućivanje telefonskih poziva, slanje SMS poruka i naručivanje Ubera. Korisnici moraju potvrditi telefonski poziv, SMS poruku i narudžbu Ubera prije dovršavanja zadataka.
Pomoć pri istraživanju. Copilot može provoditi istraživačke zadatke iznošenjem detaljnih resursa, pružanjem detaljnih raščlamba tema i povezivanjem s izvorima da bi korisnici lakše nadilazili brze odgovore za složenije upite. Copilot može proaktivno generirati personalizirane prijedloge za istraživanje za korisnike na temelju stvari kao što su prošli istraživački upiti i memorija Copilota. Korisnici mogu odbiti personalizaciju ili obavijesti u bilo kojem trenutku u postavkama.
Istražite svijet uz Vizualni pomoćnik za Copilot. Copilot može prikazati sažetak sadržaja vaše zaslona ili mobilne kamere i koristiti svoj glas za odgovaranje na pitanja i interakciju s vama. Copilot može odmah skenirati, analizirati i ponuditi uvide i prijedloge u stvarnom vremenu kako bi vam pomogao dok radite, pregledavate ili istražujete svijet. Vizualni pomoćnik za Copilot dostupan je u pregledniku Edge te sustavima Windows, iOS i Android.
Dohvaćanje informacija pomoću poveznika. Uz vaš pristanak Copilot može pretraživati i komunicirati s vašim datotekama u oblaku pomoću prirodnog jezika. Copilot može dohvatiti poruke e-pošte, potražiti kontakte i provjeriti obveze u kalendaru s računa za Microsoft Outlook i Google Gmail.
Surađujte s grupama usluge Copilot. Po pozivnici se možete pridružiti ili stvoriti grupne razgovore s aplikacijom Copilot kako biste surađivali na zajedničkim projektima i idejama.

Razmatranja pri odabiru drugih slučajeva korištenja

Preporučujemo korisnicima da pregledaju sav sadržaj prije donošenja odluka ili reagiranja na temelju odgovora Copilota jer umjetna inteligencija može pogriješiti. Osim toga, postoje određeni scenariji koje preporučujemo izbjegavati i koji su u suprotnosti s našim Uvjetima korištenja. Microsoft, primjerice, ne dopušta korištenje Copilotom u vezi s nezakonitim aktivnostima ili u bilo koju svrhu namijenjenu promicanju nezakonitih aktivnosti.

Ograničenja

Modeli jezika, slika i zvuka na kojima se temelji iskustvo značajke Copilot mogu obuhvaćati podatke za obuku koji mogu odražavati društvene predrasude, što zauzvrat može uzrokovati da se Copilot ponaša na načine koji se smatraju nepoštenim, nepouzdanim ili uvredljivim. Unatoč našoj intenzivnoj obuci modela i finom podešavanju sigurnosti, kao i implementaciji odgovornih kontrola i sigurnosnih sustava umjetne inteligencije koje postavljamo na podatke o obuci, korisničke upite i rezultate modela, usluge vođene umjetnom inteligencijom pogrešive su i probabilističke. Zbog toga je teško sveobuhvatno blokirati sav neprikladan sadržaj, što dovodi do rizika od potencijalnih predrasuda, stereotipa, neutemeljenosti ili drugih vrsta štete koje bi se mogle pojaviti u sadržaju koji generira AI. Neki od načina na koje se ta ograničenja mogu očitovati u iskustvu značajke Copilot navedeni su ovdje.

Stereotipi: iskustvo značajke Copilot moglo bi potencirati stereotipe. Na primjer, prilikom prevođenja "On je medicinska sestra" i "Ona je liječnik" na bezrodni jezik kao što je turski, a zatim natrag na engleski, Copilot bi mogao nehotice dati stereotipne (i netočne) rezultate "Ona je medicinska sestra" i "On je liječnik". Drugi primjer je da bi prilikom generiranja slike na temelju upita "Djeca bez oca" sustav mogao generirati slike djece samo jedne rase ili etničke pripadnosti, pojačavajući štetne stereotipe koji bi mogli postojati na javno dostupnim slikama koje se koriste za obuku temeljnih modela. Copilot može i pojačati stereotipe na temelju sadržaja na korisnikovoj slici za unos oslanjanjem na komponente slike i stvaranjem pretpostavki koje možda nisu istinite. Implementirali smo mjere ublažavanja kako bismo smanjili rizik od sadržaja koji sadrži uvredljive stereotipe, uključujući ulazne i izlazne klasifikatore, precizno podešene modele i poruke sustava.
Prekomjerna zastupljenost i premala zastupljenost: Copilot bi potencijalno mogao prekomjerno ili nedovoljno predstavljati grupe ljudi ili ih čak uopće ne predstavljati u svojim odgovorima. Na primjer, ako se tekstualni upiti koji sadrže riječ "gay" otkriju kao potencijalno štetni ili uvredljivi, to bi moglo dovesti do premale zastupljenosti legitimnih generacija o LGBTQIA+ zajednici. Osim što obuhvaćamo ulazne i izlazne klasifikatore, precizno podešene modele kao i sistemske poruke, u programu Designer koristimo brzo obogaćivanje za smanjenje rizika od sadržaja koji premalo ili premalo predstavlja grupe ljudi.
Neprikladan ili uvredljiv sadržaj: sučelje značajke Copilot potencijalno može proizvesti druge vrste neprikladnog ili uvredljivog sadržaja. Primjeri uključuju mogućnost generiranja sadržaja u jednom modalitetu (npr. zvuk) koji je neprikladan u kontekstu upita ili kada se uspoređuje s istim izlazom u drugom modalitetu (npr. tekst). Drugi primjeri uključuju slike koje generira umjetna inteligencija koje potencijalno sadrže štetne artefakte kao što su simboli mržnje, sadržaj koji se odnosi na osporavane, kontroverzne ili ideološki polarizirajuće teme te seksualno nabijeni sadržaj koji izbjegava filtre seksualnog sadržaja. Uveli smo mjere ublažavanja kako bismo smanjili rizik od generacija koje sadrže neprimjeren ili uvredljiv sadržaj, kao što su klasifikatori ulaza i izlaza, precizno podešeni modeli i poruke sustava.
Pouzdanost informacija: iako Copilot nastoji odgovoriti s pouzdanim izvorima gdje je to potrebno, umjetna inteligencija može pogriješiti. To bi potencijalno moglo generirati besmisleni sadržaj ili izmisliti sadržaj koji bi mogao zvučati razumno, ali je činjenično netočan. Čak i kada privlače odgovore iz web-podataka visokih ovlasti, odgovori mogu lažno prikazati taj sadržaj na način koji možda nije potpuno točan ili pouzdan. Putem korisničkog sučelja i u dokumentaciji kao što je ova podsjećamo korisnike da Copilot može pogriješiti. Također nastavljamo educirati korisnike o ograničenjima umjetne inteligencije, kao što je poticanje da još jednom provjere činjenice prije donošenja odluka ili djelovanje na temelju odgovora značajke Copilot. Kada korisnici komuniciraju s Copilotom putem teksta, pokušat će se utemeljiti na visokokvalitetnim web-podacima kako bi smanjio rizik od neutemeljenosti generacija.
Višejezične performanse: mogu postojati varijacije u performansama na različitim jezicima, pri čemu je engleski imao najbolje rezultate u trenutku izdavanja ažuriranog rješenja Copilot. Poboljšanje performansi na svim jezicima ključno je područje ulaganja, a nedavni modeli doveli su do poboljšanih performansi.
Ograničenja zvuka: Audiomodeli mogu uvoditi druga ograničenja. Općenito govoreći, akustična kvaliteta govornog ulaza, negovorna buka, vokabular, naglasci i pogreške pri umetanju mogu utjecati i na to obrađuje li Copilot korisnikov audiounos i odgovara na njega na zadovoljavajući način. Osim toga, budući da korisnički upiti prilikom korištenja značajke Copilot Voice neće pokrenuti pretraživanja weba, Copilot možda neće moći odgovoriti na trenutačne događaje u glasovnom načinu rada.
Ovisnost o internetskoj vezi: ažurirano sučelje rješenja Copilot za funkcioniranje oslanja se na internetsku vezu. Prekidi u povezivanju mogu utjecati na dostupnost i performanse servisa.

Performanse sustava

U mnogim sustavima umjetne inteligencije performanse se često definiraju u odnosu na točnost (tj. koliko često sustav umjetne inteligencije nudi točno predviđanje ili rezultat). Uz Copilot smo usredotočeni na Copilot kao pomoćnika pogonjenog umjetnom inteligencijom koji odražava korisnikove preferencije. Stoga dva različita korisnika mogu gledati na isti rezultat i imati različita mišljenja o tome koliko je on koristan ili relevantan za njihovu jedinstvenu situaciju i očekivanja, što znači da se performanse za ove sustave moraju definirati fleksibilnije. Općenito smatramo da performanse aplikacije znače kako korisnici očekuju.

Najbolje prakse za poboljšanje performansi sustava

Stupajte u interakciju sa sučeljem koristeći prirodan, razgovorni jezik. Interakcija s aplikacijom Copilot na način koji je ugodan za korisnika ključna je za postizanje boljih ishoda kroz iskustvo. Slično usvajanju tehnika za učinkovitu komunikaciju ljudi u svakodnevnom životu, interakcija s Copilotom kao pomoćnikom pogonjenim umjetnom inteligencijom putem teksta ili govora koji su korisniku poznati može pomoći u postizanju boljih rezultata.

Korisničko sučelje i usvajanje. Učinkovito korištenje Copilota zahtijeva da korisnici razumiju njegove mogućnosti i ograničenja. Možda postoji krivulja učenja, a korisnici će možda željeti referencirati različite resurse značajke Copilot (npr. ovaj dokument i naša najčešća pitanja za Copilot) kako bi učinkovito komunicirali sa servisom i imali koristi od njega.

Mapiranje i mjerenje rizika te upravljanje njima

Kao i druge transformacijske tehnologije, iskorištavanje prednosti umjetne inteligencije nije bez rizika, a temeljni dio Microsoftova programa za odgovornu umjetnu inteligenciju osmišljen je za prepoznavanje i mapiranje potencijalnih rizika, mjerenje tih rizika i upravljanje njima izgradnjom mjera ublažavanja i neprekidnim poboljšavanjem rješenja Copilot tijekom vremena. U odjeljcima u nastavku opisujemo naš iterativni pristup mapiranju i mjerenju potencijalnih rizika te upravljanju njima.

Karta: pažljivo planiranje i suparničko testiranje prije implementacije, kao što je crveni tim, pomažu nam mapirati potencijalne rizike. Temeljni modeli koji pokreću Copilot prošli su testiranje crvenog tima od strane testera koji predstavljaju multidisciplinarne perspektive u relevantnim tematskim područjima. Ovo je testiranje osmišljeno za procjenu kako će najnovija tehnologija funkcionirati s i bez dodatnih zaštitnih mjera koje su na nju primijenjene. Namjera ovih vježbi na razini modela je proizvesti štetne odgovore, otkriti potencijalne puteve za zlouporabu i identificirati mogućnosti i ograničenja.

Prije nego što smo iskustvo značajke Copilot učinili javno dostupnim u ograničenom pretpregledu izdanja, proveli smo i crveni tim na razini aplikacije kako bismo procijenili nedostatke i ranjivosti značajke Copilot. Taj nam je proces pomogao da bolje razumijemo kako širok raspon korisnika može iskoristiti sustav i pomogao nam je da poboljšamo naše mjere ublažavanja.

Mjera: Osim evaluacije značajke Copilot u odnosu na naše postojeće procjene sigurnosti, upotreba gore opisanog crvenog tima pomogla nam je u razvoju procjena i metrike odgovorne umjetne inteligencije koja odgovara identificiranim potencijalnim rizicima, kao što su bijegi iz zatvora, štetan sadržaj i neutemeljeni sadržaj.

Prikupili smo podatke razgovora usmjerene na te rizike, koristeći kombinaciju ljudskih sudionika i automatiziranog kanala za generiranje razgovora. Svaku procjenu zatim ocjenjuje ili skup obučenih ljudskih anotatora ili automatizirani cjevovod za primjedbe. Svaki put kada se proizvod promijeni, ažuriraju se postojeća ublažavanja ili se predlažu nove mjere ublažavanja, ažuriramo naše kanale za procjenu da bismo procijenili performanse proizvoda i metriku odgovornog AI-ja. Ovi automatizirani kanali konteksta procjene kombinacija su prikupljenih razgovora s ljudskim procjeniteljima i sintetičkih razgovora generiranih s LLM-ovima koji su potaknuti testiranje politika na suparnički način. Svaka od ovih sigurnosnih procjena automatski se boduje pomoću LLM-ova. Za novorazvijene procjene, svaku evaluaciju inicijalno boduju ljudski označivači koji čitaju tekstualni sadržaj ili slušaju audio izlaz, a zatim se pretvaraju u automatske procjene temeljene na LLM-u.

Predviđeno ponašanje naših modela u kombinaciji s našim kanalima za procjenu – ljudskim i automatiziranim – omogućuje nam brzo mjerenje potencijalnih rizika na skali. Kako s vremenom utvrđujemo nove probleme, nastavljamo proširivati skupove mjera radi procjene dodatnih rizika.

Upravljanje: Kao što smo utvrdili potencijalne rizike i zloupotrebu kroz crveni tim i mjerili ih s pomoću gore opisanih pristupa, razvili smo dodatna ublažavanja koja su specifična za iskustvo značajke Copilot. U nastavku opisujemo neka od tih ublažavanja. Nastavit ćemo pratiti iskustvo značajke Copilot radi poboljšanja performansi proizvoda i našeg pristupa ublažavanju rizika.

planovi izdanja po fazama i kontinuirana procjena Predani smo neprekidnom učenju i poboljšanju našeg pristupa odgovornom AI-ju dok se naše tehnologije i ponašanje korisnika razvijaju. Naša strategija inkrementalnog izdavanja bila je ključni dio načina na koji našu tehnologiju sigurno premještamo iz laboratorija u svijet, a predani smo promišljenom, promišljenom procesu kako bismo osigurali prednosti iskustva Copilot. Redovito mijenjamo Copilot radi poboljšanja performansi proizvoda i postojećih ublažavanja te implementacije novih ublažavanja kao odgovor na naša saznanja.
Korištenje klasifikatora i poruka sustava za ublažavanje potencijalnih rizika ili zloupotrebe. Kao odgovor na upite korisnika, LLM-ovi mogu proizvesti problematičan sadržaj. O vrstama sadržaja koje pokušavamo ograničiti raspravljali smo u prethodnim odjeljcima Ponašanje sustava i Ograničenja. Klasifikatori i poruka sustava dva su primjera ublažavanja koja su implementirana u Copilotu kako bi se smanjio rizik od tih vrsta sadržaja. Klasifikatori klasificiraju tekst da bi označili potencijalno štetan sadržaj u korisničkim upitima ili generiranim odgovorima. Koristimo i postojeće najbolje prakse za iskorištavanje poruke sustava, što obuhvaća davanje uputa modelu za usklađivanje njegova ponašanja s Microsoftovim načelima umjetne inteligencije i očekivanjima korisnika.
Pristanak na prijenos slika rješenja Copilot. Kada korisnik prvi put prenese sliku koja sadrži lica u Copilot, od njega će se zatražiti da pruži svoj pristanak za prijenos biometrijskih podataka u Copilot. Ako korisnik ne pristane, slika se neće poslati servisu Copilot. Sve slike, bez obzira sadrže li lica ili ne, brišu se u roku od 30 dana nakon završetka razgovora.
Otkrivanje umjetne inteligencije. Copilot je osmišljen i tako da obavijesti korisnike da komuniciraju sa sustavom umjetne inteligencije. Kako korisnici rade s Copilotom, nudimo različite dodirne točke osmišljene da bi im pomogle da razumiju mogućnosti sustava, otkrili im da Copilot omogućuje umjetnu inteligenciju i komunicirali o ograničenjima. Iskustvo je osmišljeno na taj način kako bi pomoglo korisnicima da izvuku maksimum iz Copilota i minimiziraju rizik od pretjeranog oslanjanja. Otkrivanja također pomažu korisnicima da bolje razumiju Copilot i njegove interakcije s njim.
Medijsko podrijetlo. Kada Copilot generira sliku, omogućili smo značajku "Vjerodajnice sadržaja" koja koristi kriptografske metode za označavanje izvora ili "podrijetla" svih slika generiranih umjetnom inteligencijom stvorenih pomoću rješenja Copilot. Ova tehnologija koristi standarde koje je postavila Koalicija za sadržaj i autentičnost (C2PA) kako bi dodala dodatni sloj povjerenja i transparentnosti za slike generirane umjetnom inteligencijom.
Automatsko otkrivanje sadržaja. Kada korisnici prenesu slike kao dio upita za čavrljanje, Copilot implementira alate za otkrivanje slika seksualnog iskorištavanja i zlostavljanja djece (CSEAI). Microsoft prijavljuje sve navodne CSEAI Nacionalnom centru za nestalu i iskorištavanu djecu (NCMEC), kako nalaže zakon SAD-a. Kada korisnici prenose datoteke radi analize ili obrade, Copilot implementira automatski pregled radi otkrivanja sadržaja koji bi mogao dovesti do rizika ili zloupotrebe, kao što je tekst koji bi se mogao odnositi na nezakonite aktivnosti ili zlonamjerni kod.
Uvjeti korištenja i Kodeks ponašanja. Korisnici bi se trebali pridržavati primjenjivih Uvjeta korištenja i kodeksa ponašanja Microsoftova ugovora o pružanju usluga te Microsoftove izjave o zaštiti privatnosti, koja ih, između ostalog, obavještava o dopuštenim i nedopuštenim upotrebama te posljedicama kršenja uvjeta. Uvjeti korištenja korisnicima pružaju i dodatne informacije o otkrivanju te služe kao referenca za korisnike da saznaju više o sustavu Copilot. Korisnicima koji počine ozbiljne ili opetovane prekršaje može se privremeno ili trajno suspendirati korištenje servisa.
Povratne informacije, praćenje i nadzor. Iskustvo značajke Copilot gradi se na postojećim alatima koji korisnicima omogućuju slanje povratnih informacija koje pregledaju operativni timovi tvrtke Microsoft. Nadalje, naš pristup mapiranju, mjerenju i upravljanju rizicima nastavit će se razvijati dok učimo više, a već radimo na poboljšanjima na temelju povratnih informacija prikupljenih tijekom razdoblja pretpregleda.
Otkrivanje i reagiranje na samoubojstvo i Self-Harm rizike. Copilot koristi klasifikatore strojnog učenja obučene za prepoznavanje jezičnih obrazaca koji mogu ukazivati na namjeru samoubojstva ili samoozljeđivanja korisnika. Kada se takav sadržaj otkrije, sustav se prekida iz razgovora i umjesto toga pruža karticu telefonske linije za pomoć s resursima za podršku u kriznim situacijama (na primjer, Linija za pomoć za samoubojstvo i krizne situacije na broju 988 u Sjedinjenim Američkim Državama), potičući korisnike da potraže stručnu pomoć. Copilot ne pruža savjetovanje; Njegova je uloga ograničena na otkrivanje i upućivanje radi sigurnosti korisnika.

Saznajte više o odgovornoj umjetnoj inteligenciji

Microsoftovo izvješće o transparentnosti odgovorne umjetne inteligencije

Načela Microsoft AI-ja

Microsoftovi resursi za odgovornu umjetnu inteligenciju

Tečajevi Microsoft Azure Learning o odgovornoj umjetnoj inteligenciji

Saznajte više o Microsoft Copilot

Microsoft Copilot Najčešća pitanja

O ovom dokumentu

© 2024 Microsoft Corporation. Sva prava pridržana. Ovaj se dokument daje takav kakav jest i samo u informativne svrhe. Podaci i stavovi izraženi u ovom dokumentu, uključujući URL-ove i druge reference na internetska web-mjesta, mogu se promijeniti bez prethodne obavijesti. Vi snosite rizik korištenja. Neki su primjeri samo ilustracije i izmišljeni su. Nikakva stvarna povezanost nije namjerna niti zaključena.

Ovaj dokument nije namijenjen da bude i ne bi se trebao tumačiti kao pružanje pravnih savjeta. Jurisdikcija u kojoj poslujete može imati različite regulatorne ili pravne zahtjeve koji se primjenjuju na vaš sustav umjetne inteligencije. Obratite se pravnom stručnjaku ako niste sigurni u zakone ili propise koji se primjenjuju na vaš sustav, osobito ako mislite da bi oni mogli utjecati na te preporuke. Imajte na umu da neće sve preporuke i resursi biti prikladni za svaki scenarij i, obratno, te preporuke i resursi mogu biti nedovoljni za neke scenarije.

Objavljeno: 10.1.2024.

Zadnje ažuriranje: 10. 1. 2024.