Pierwsze wnioski od My AI i nowe ulepszenia zabezpieczeń

4 kwietnia 2023 r.

Sześć tygodni temu przedstawiliśmy światu po raz pierwszy My AI, czyli chatbota stworzonego przy użyciu technologii GPT od OpenAI. Na początku udostępniliśmy go jedynie subskrybentom Snapchat+ i te niemal półtora miesiąca przyniosło dla nas wiele wniosków. Przykładowo, dowiedzieliśmy się, że nasza społeczność najczęściej zadawała My AI pytania z takich dziedzin, jak kino, sport, gry, zwierzęta domowe i matematyka.
Dostrzegliśmy również potencjał do nadużyć — wiele osób próbowało bowiem sprowokować chatbota do udzielania odpowiedzi niezgodnych z naszymi wytycznymi. W ramach naszej wspólnej pracy nad usprawnieniem My AI chcemy udostępnić aktualizację na temat niektórych z niedawno wprowadzonych ulepszeń zabezpieczeń, będących odpowiedzią na wyciągnięte przez nas wnioski. Opisujemy w niej także nowe narzędzia, których wdrożenie planujemy.
Jak My AI podchodzi do danych?
Prywatność zawsze była kluczowa dla misji Snapa. Dzięki niej wyrażamy siebie podczas komunikacji ze znajomymi i rodziną bardziej komfortowo. Staramy się zapewnić społeczności Snapchata klarowność i nakreślić kontekst w kwestii wykorzystywania danych przez nasze produkty, a także w zakresie budowania przez nas funkcji przy użyciu procedur prywatności. Przykładowo, sposób przetwarzania danych z konwersacji między znajomymi na Snapchacie różni się od sposobu przetwarzania danych związanych z zawartościami transmitowanymi na naszej platformie — ten drugi musi spełniać wyższe standardy i wymaga moderacji, ponieważ treści te docierają do szerszego grona odbiorców.
Jednak My AI to chatbot, a nie prawdziwy znajomy. Postanowiliśmy więc traktować powiązane z nim dane inaczej, gdyż mamy możliwość korzystania z historii rozmowy, dzięki czemu jesteśmy w stanie nadal czynić My AI narzędziem bardziej przyjemnym, przydatnym i bezpiecznym. Zanim użytkownicy otrzymają możliwość używania My AI, pokazujemy im wiadomość, z której wynika, że wszystkie wiadomości do chatbota zostaną zachowane, o ile użytkownik sam ich nie usunie.
Możliwość przyjrzenia się pierwszym interakcjom z My AI pomogła nam w określeniu, które zabezpieczenia działają poprawnie, a które należy wzmocnić. Aby to ocenić, prowadziliśmy przeglądy zapytań do My AI oraz odpowiedzi zawierających „niezgodny z wymogami” język. Definiujemy go jako wszelkie teksty nawiązujące do przemocy, określeń o charakterze jawnie seksualnym, zażywania narkotyków, molestowania dzieci, nękania, mowy nienawiści, uwłaczających lub stronniczych stwierdzeń, rasizmu, mizoginii, a także marginalizowania grup niedoreprezentowanych. Wszystkie treści z tych kategorii są stanowczo zabronione na Snapchacie.
Z naszej najnowszej analizy wynika, że zaledwie 0.01% odpowiedzi My AI zawierała treści niezgodne. Przykładami najczęstszych takich odpowiedzi zawierały powtarzanie przez chatbota niestosownych słów, zawartych w pytaniach użytkowników.
Będziemy nadal wykorzystywać te wnioski do ulepszania My AI. Te informacje pomogą nam również we wdrożeniu nowego systemu, którego zadaniem będzie ograniczanie stosowania nadużyć wobec My AI. Do naszego obecnego zestawu narzędzi dodajemy technologię moderowania od Open AI, która pozwoli ocenić powagę potencjalnie szkodliwych treści i tymczasowo ograniczyć dostęp do My AI użytkownikom korzystającym z usługi niezgodnie z regulaminem.
Doświadczenia dostosowane do wieku
Jesteśmy odpowiedzialni za tworzenie produktów i doznań, które na pierwszym miejscu stawiają bezpieczeństwo oraz dostosowanie treści do wieku — traktujemy to bardzo poważnie. Od wprowadzenia My AI pracowaliśmy w pocie czoła nad ulepszeniem jej odpowiedzi na niestosowne pytania użytkowników, niezależnie od wieku tych osób. Używamy również prewencyjnych narzędzi wykrywających, które skanują rozmowy z My AI pod kątem potencjalnie niezgodnych zdań i pytań, i podejmują odpowiednie działania.
Wdrożyliśmy również nowy sygnał wiekowy dla My AI. Korzysta on z daty urodzenia użytkownika, więc nawet jeśli użytkownik nigdy nie zdradzi swojego wieku w rozmowie z chatbotem, ten i tak będzie go brał pod uwagę w trakcie prowadzenia konwersacji.
My AI w Centrum Rodziny
Dzięki znajdującemu się w aplikacji Centrum Rodziny Snapchat oferuje rodzicom i opiekunom wgląd w listę znajomych ich dzieci, a także z kim się komunikują i jak często. W najbliższych tygodniach przekażemy rodzicom więcej wniosków na temat interakcji ich pociech z My AI. Oznacza to, że za pośrednictwem Centrum Rodziny będzie można sprawdzić, czy i jak często dziecko komunikuje się z My AI. Aby korzystać z Centrum Rodziny, zgodę muszą wyrazić zarówno rodzice, jak i dziecko. Zainteresowane rodziny mogą dowiedzieć się więcej na temat rejestracji w tym miejscu.
Cały czas namawiamy użytkowników do korzystania z naszych aplikacyjnych narzędzi do zgłaszania incydentów, jeśli tylko otrzymają niepokojące odpowiedzi od My AI. Prosimy również o wysyłanie nam ogólnych opinii na temat użytkowania tego produktu.
Stale pracujemy nad ulepszeniem My AI i ciągle będziemy wprowadzać dodatkowe środki, zapewniające naszej społeczności bezpieczeństwo. Dziękujemy za wszystkie dotychczasowe opinie na temat My AI. Nadal zobowiązujemy się do zapewnianiu naszej społeczności dobrej zabawy i bezpieczeństwa.
Powrót do Aktualności