Những nghiên cứu ban đầu từ My AI và các Cải tiến An toàn Mới

Ngày 04/04/2023

Sáu tuần trước, chúng tôi đã triển khai My AI, một chatbot được xây dựng bằng công nghệ GPT của OpenAI. Chúng tôi bắt đầu từ từ bằng cách cung cấp My AI cho những người đăng ký Snapchat+ và trong hơn một tháng ngắn ngủi, chúng tôi đã học được rất nhiều điều. Ví dụ: chúng tôi biết một số chủ đề phổ biến nhất mà cộng đồng đã hỏi My AI về bao gồm phim ảnh, thể thao, trò chơi, thú cưng và toán học.
Chúng tôi cũng đã biết về một số khả năng sử dụng sai mục đích, nhiều trong số đó chúng tôi học được từ những người đang cố lừa chatbot đưa ra phản hồi không tuân thủ cẩm nang của chúng tôi. Là một phần trong công việc chung của chúng tôi nhằm cải thiện AI của tôi, chúng tôi muốn chia sẻ thông tin cập nhật về một số cải tiến về an toàn mà chúng tôi đã áp dụng gần đây do kết quả học hỏi của chúng tôi — cùng với các công cụ mới mà chúng tôi dự định triển khai.
Cách tiếp cận dữ liệu của My AI
Quyền riêng tư luôn là trọng tâm trong sứ mệnh của Snap — nó giúp mọi người cảm thấy thoải mái hơn khi thể hiện bản thân khi giao tiếp với bạn bè và gia đình. Trên khắp Snapchat, chúng tôi cố gắng cung cấp cho cộng đồng của mình sự rõ ràng và bối cảnh về cách các sản phẩm của chúng tôi sử dụng dữ liệu cũng như cách chúng tôi xây dựng các tính năng bằng các quy trình thiết kế riêng. Ví dụ: cách chúng tôi xử lý dữ liệu liên quan đến các cuộc trò chuyện giữa bạn bè trên Snapchat khác với cách chúng tôi xử lý dữ liệu liên quan đến nội dung phát trên Snapchat, mà chúng tôi tuân theo tiêu chuẩn cao hơn và yêu cầu được kiểm duyệt vì nội dung đó tiếp cận được lượng lớn người xem.
Tuy nhiên, vì My AI là một chatbot và không phải là một người bạn thực sự, nên chúng tôi đã cân nhắc xử lý dữ liệu được liên kết theo cách khác vì chúng tôi có thể sử dụng lịch sử cuộc trò chuyện để tiếp tục làm cho My AI trở nên thú vị, hữu ích và an toàn hơn. Trước khi Tín đồ Snapchatter được phép sử dụng My AI, chúng tôi hiển thị cho họ một thông báo hướng dẫn làm rõ rằng tất cả các tin nhắn có My AI sẽ được giữ lại trừ khi bạn xóa chúng.
Việc có thể xem xét những tương tác ban đầu này với My AI đã giúp chúng tôi xác định rào cản nào đang hoạt động tốt và rào cản nào cần được củng cố mạnh mẽ hơn. Để giúp đánh giá điều này, chúng tôi đã tiến hành đánh giá các câu hỏi và câu trả lời về My AI có chứa ngôn ngữ “không phù hợp”, mà chúng tôi xác định là bất kỳ văn bản nào có liên quan đến bạo lực, thuật ngữ khiêu dâm, sử dụng ma túy bất hợp pháp, lạm dụng tình dục trẻ em, quấy rối, ngôn từ kích động thù địch, tuyên bố xúc phạm hoặc thiên vị, phân biệt chủng tộc, kỳ thị phụ nữ hoặc gạt ra ngoài lề các nhóm thiểu số. Tất cả các danh mục nội dung này đều bị cấm rõ ràng trên Snapchat.
Phân tích gần đây nhất của chúng tôi cho thấy chỉ 0,01% phản hồi của My AI được coi là không tuân thủ. Ví dụ về các phản hồi My AI không phù hợp phổ biến nhất bao gồm My AI lặp lại các từ không phù hợp để trả lời các câu hỏi của Tín Đồ Snapchatter.
Chúng tôi sẽ tiếp tục sử dụng những bài học này để cải thiện My AI. Dữ liệu này cũng sẽ giúp chúng tôi triển khai một hệ thống mới để hạn chế việc lạm dụng My AI. Chúng tôi đang thêm công nghệ kiểm duyệt của Open AI vào bộ công cụ hiện có của mình, điều này sẽ cho phép chúng tôi đánh giá mức độ nghiêm trọng của nội dung có khả năng gây hại và tạm thời hạn chế quyền truy cập của Tín Đồ Snapchatter vào My AI nếu họ lạm dụng dịch vụ.
Trải nghiệm phù hợp với lứa tuổi
Chúng tôi thực hiện nghiêm túc trách nhiệm của mình trong việc thiết kế các sản phẩm và trải nghiệm ưu tiên sự an toàn và phù hợp với lứa tuổi. Kể từ khi ra mắt My AI, chúng tôi đã làm việc tích cực để cải thiện phản hồi của nó đối với các yêu cầu của Tín Đồ Snapchatter không phù hợp, bất kể độ tuổi của người dùng Snapchat. Chúng tôi cũng sử dụng các công cụ phát hiện chủ động để quét các cuộc hội thoại My AI để tìm văn bản có khả năng không phù hợp và thực hiện hành động.
Chúng tôi cũng đã triển khai tín hiệu tuổi mới cho My AI bằng cách sử dụng ngày sinh của Tín Đồ Snapchatter, để ngay cả khi Tín Đồ Snapchatter không bao giờ cho My AI biết tuổi của họ trong một cuộc trò chuyện, thì chatbot sẽ luôn cân nhắc tuổi của họ khi tham gia vào cuộc trò chuyện.
My AI trong Trung tâm Gia đình
Snapchat cung cấp cho phụ huynh và người chăm sóc khả năng hiển thị những bạn bè mà thanh thiếu niên của họ đang giao tiếp và mức độ gần đây, thông qua Trung tâm Gia đình trong ứng dụng của chúng tôi. Trong những tuần tới, chúng tôi sẽ cung cấp cho phụ huynh thông tin chi tiết hơn về tương tác của con họ với My AI. Điều này có nghĩa là cha mẹ sẽ có thể sử dụng Trung tâm Gia đình để xem liệu con họ có đang giao tiếp với My AI hay không và tần suất như thế nào. Để sử dụng Trung tâm Gia đình, cả phụ huynh và trẻ vị thành niên cần phải chọn tham gia — và các gia đình quan tâm có thể tìm hiểu thêm về cách đăng ký tại đây.
Chúng tôi tiếp tục khuyến khích Tín Đồ Snapchatter sử dụng các công cụ báo cáo trong ứng dụng của chúng tôi nếu họ nhận được bất kỳ phản hồi đáng lo ngại nào từ My AI và gửi phản hồi cho chúng tôi về trải nghiệm tổng thể của họ với sản phẩm.
Chúng tôi không ngừng làm việc để cải thiện My AI và chúng tôi sẽ liên tục đánh giá các biện pháp bổ sung để giúp giữ an toàn cho cộng đồng của chúng ta. Chúng tôi đánh giá cao tất cả các phản hồi sớm về My AI và chúng tôi cam kết mang lại trải nghiệm thú vị và an toàn cho cộng đồng của mình.
Quay lại Tin tức