Dlaczego to ważne?
Modele AI przetwarzają dane w oparciu o infrastrukturę dostawców, często (a właściwie prawie zawsze) poza Twoją firmą. Nawet jeśli nie wprowadzisz pełnych danych osobowych, sam opis kontekstu może zawierać informacje pozwalające na identyfikację osoby lub ujawnienie informacji poufnych. Twoja firma traci wtedy kontrolę nad miejscem przetwarzania danych, zakresem logowania oraz dalszym wykorzystaniem tych informacji przez usługodawcę.
Najczęstsze ryzyka
-
Dane osobowe w treści promptu
Imiona, nazwiska, adresy e-mail, numery klienta, numer umowy, często kopiowane mechanicznie. Przekazanie ich do narzędzia AI = przekazanie ich poza organizację.
-
Nadmiarowy kontekst
Informacja pozornie „neutralna”, np. opis relacji z klientem, nazwy projektów, wewnętrzne zależności, również mogą stanowić informację poufną.
-
Przetwarzanie danych poza kontrolą organizacji
Wiele modeli działa na infrastrukturze spoza UE. Bez właściwych umów i zabezpieczeń może to prowadzić do niezgodnego z prawem transferu danych.
-
Brak możliwości usunięcia danych z logów
Wyłączenie historii czatu nie wpływa na logi techniczne i telemetrię, które mogą być przechowywane przez usługodawcę przez długi czas.
Przykład praktyczny
W 2023 roku w Samsung Electronics doszło do głośnego incydentu związanego z korzystaniem z publicznej wersji ChatGPT. Pracownicy, próbując szybciej analizować błędy w kodzie i rozwiązywać problemy techniczne, zaczęli wklejać do narzędzia fragmenty zastrzeżonego kodu źródłowego, wewnętrzne opisy konfiguracji oraz protokoły ze spotkań projektowych. Wszystkie te informacje trafiły na infrastrukturę dostawcy modelu pozostającą poza kontrolą firmy, a część z nich mogła zostać użyta do trenowania systemu. Po wykryciu sytuacji Samsung natychmiast zakazał korzystania z publicznych generatorów AI, przeprowadził analizę ryzyka i audyt procesów, a następnie rozpoczął prace nad własnym, odizolowanym rozwiązaniem AI dostępnym wyłącznie w środowisku wewnętrznym.
Jak korzystać z generatorów AI w sposób zgodny z prawem i bezpieczny?
-
Unikaj przekazywania modelom danych osobowych.
Dane osobowe, także te, które wydają się nieistotne, po wprowadzeniu do narzędzia AI stają się elementem infrastruktury zewnętrznego dostawcy, a więc poza zakresem kontroli Twojej organizacji.
-
Utrzymuj kontekst zapytań na wysokim poziomie ogólności, który nie odsłania szczegółów operacyjnych firmy.
Opis funkcji, procesów, projektów czy relacji biznesowych bywa równie wrażliwy jak dane osobowe, ponieważ pozwala odtworzyć strukturę, intencje lub kierunek działań organizacji.
-
Korzystaj z narzędzi udostępnionych lub zatwierdzonych przez firmę, zwłaszcza jeżeli mają gwarancje dotyczące przetwarzania danych.
Środowiska korporacyjne, choć nie eliminują ryzyka, przynajmniej zapewniają jasność co do zakresu logowania, miejsca przetwarzania oraz zasad wykorzystywania danych przez dostawcę.
-
Zakładaj, że każda informacja przekazana do narzędzia AI może zostać utrwalona w logach i pozostawać w obiegu po stronie dostawcy.
W praktyce oznacza to, że do modelu nie należy wprowadzać żadnej treści, której nie można ujawnić podmiotowi trzeciemu, niezależnie od tego, jak banalna lub fragmentaryczna może się wydawać.
Podsumowanie
Generatory AI są narzędziami o dużym potencjale, ale nie eliminują odpowiedzialności za ochronę danych i informacji poufnych. Ryzyko nie wynika wyłącznie z przesyłania plików, lecz przede wszystkim z nieuważnego formułowania promptów, które mogą ujawniać dane osobowe lub istotne informacje o działalności Twojej firmy. Świadome i kontrolowane korzystanie z narzędzi AI jest obecnie koniecznym elementem higieny informacyjnej w miejscu pracy.