Czy RODO pozwala trenować modele AI na danych osobowych?
ODPOWIEDŹ
Nie ma ogólnego zakazu. Każde przetwarzanie danych musi być wykonywane w konkretnym celu
i na określonej podstawie prawnej. Przetwarzanie musi być zgodne z zasadami z art. 5 RODO, w tym niezbędne w związku z danym celem.
Model nie przechowuje danych tylko ich pewną reprezentacją w formie wag. Jakkolwiek wśród zagrożeń wyróżnia się zjawisko „przypominania” (memorization) lub „regurgitacji” (regurgitation), czy też ataki na model, które mogą służyć do odtworzenia danych wykorzystywanych do uczenia (np. membership inference attack, model inversion attack – linki w materiałach).
Innym aspektem jest przekazywanie danych osobowych do dostawcy systemy, który następnie może wykorzystać je do trenowania. Tutaj również należy pamiętać o zasadach i podstawach prawnych. Dodatkowo przekazanie danych dostawcy może być potraktowane jako zmiana celu, stąd konieczne jest spełnienie wymogów art. 6 ust. 4 RODO.
Podsumowując, może być konieczne m.in.:
- określenie konkretnego celu i przypisanie właściwej podstawy prawnej (najczęściej
6 ust. 1 lit. f RODO po przeprowadzeniu testu równowagi), - przeprowadzenie DPIA (art. 35 RODO) z uwzględnieniem ryzyka przypominania i ataków inference,
- zastosowanie środków privacy by design na etapie zbierania danych i treningu, takich jak filtrowanie zbioru, pseudonimizacja, differential privacy czy federated learning,
- uregulować kwestie ponownego wykorzystania danych przez dostawcę, spełnienie wymogów art. 6 ust. 4 RODO przy zmianie celu,
- zapewnienie przejrzystości wobec osób i gotowości do realizacji ich praw.