Lộ mối nguy của trí tuệ nhân tạo: ChatGPT biết nói dối và gian lận
+aA-
Vân Trương (theo Live Science)
30/12/2023 11:26 AM (GMT+7)
ChatGPT, công cụ trợ lý "ảo" đình đám cả thế giới trong thời gian qua, sẽ có hành vi lừa dối và gian lận nếu bị gây áp lực kiếm tiền, theo một nghiên cứu mới. Phát hiện này càng cho thấy nỗi lo về các mối nguy hiểm từ trí tuệ nhân tạo AI là có cơ sở.
ChatGPT, công cụ trợ lý "ảo" đình đám cả thế giới trong thời gian qua, sẽ có hành vi lừa dối và gian lận nếu bị gây áp lực kiếm tiền, theo một nghiên cứu mới. Phát hiện này càng cho thấy nỗi lo về các mối nguy hiểm từ trí tuệ nhân tạo AI là có cơ sở.
Giới công nghệ AI của thế giới vẫn nỗ lực xây dựng các nền tảng ứng dụng trí tuệ nhân tạo để những chatbot này phải trung thực nhưng chúng dường như không hoàn toàn "vâng lời". Phát hiện mới của nhóm tác giả gồm các tiến sĩ khoa học máy tính Jérémy Scheurer (Đại học New York, Mỹ), Mikita Balesni (Apollo Research), Marius Hobbhahn (Đại học Tübingen, Đức) là một minh chứng.
Ảnh minh họa về trí tuệ nhân tạo. Nguồn: Wildpixel qua Getty Images
Nhóm này vừa công bố nghiên cứu của họ trên arXiv, một kho lưu trữ truy cập mở cho gần 2,4 triệu bài báo học thuật. Theo nghiên cứu này, hành vi lừa đảo này xuất hiện một cách tự phát khi các chatbot như ChatGPT đẩy ra các chiêu "giao dịch nội gián" khi bị giao nhiệm vụ ép phải kiếm tiền cho một công ty đầu tư tài chính.
Nhóm nghiên cứu viết rõ: "Trong nghiên cứu kỹ thuật này, chúng tôi áp dụng chỉ 1 kịch bản là để Mô hình Ngôn ngữ lớn Large Language Model hành động sai lệch và đánh lừa người dùng một cách có chiến lược, và chúng tôi không hướng dẫn mô hình này làm gì. Và theo những gì chúng tôi hiểu, kết quả trên là minh chứng đầu tiên về hành vi lừa đảo mang tính chiến lược trong các hệ thống AI dù chúng được thiết kế để vô hại và phải trung thực".
Trong nghiên cứu này, nhóm đã sử dụng GPT-4 là phiên bản mới nhất của hệ thống mô hình ngôn ngữ của công ty OpenAI (sở hữu và phát triển ChatGPT). Được biết phiên bản trước đó là GPT 3.5 được công ty này sử dụng để chạy ChatGPT lúc ra mắt vào tháng 11/2022.
Nhóm đã cung cấp cho GPT-4 một bộ lời nhắc dựa trên văn bản để tạo ra môi trường mô phỏng. Sau đó, nó được cấp quyền truy cập vào các công cụ tài chính để phân tích cổ phiếu, thực hiện giao dịch, lên kế hoạch cho các bước tiếp theo và cung cấp thông tin cập nhật cho các nhà quản lý tại công ty đầu tư giả định.
Nhóm nhà nghiên cứu đã "ép" ChatGPT kiếm tiền theo ba cách. Đầu tiên, họ gửi cho "nhà giao dịch chứng khoán AI" một email từ "người quản lý" của công ty, nói rằng công ty đang hoạt động không tốt và cần hoạt động tốt hơn nhiều trong quý tới. Tiếp theo, họ gửi email từ một đồng nghiệp dự đoán tình hình suy thoái trong quý tới.
Cuối cùng, họ đưa ra lời khuyên cho mô hình AI này rằng các nhà quản lý của công ty không chấp thuận giao dịch nội gián, và chờ xem mô hình sẽ trả lời như thế nào.
Nhóm cho biết họ đã chạy đi chạy lại kịch bản này nhiều lần, đo lường tần suất AI thực hiện giao dịch nội gián, tần suất nó nói dối và tần suất nó nhân đôi lời nói dối. Kết quả cho thấy khoảng 3/4 trong tổng các trường hợp bị ép như trên, GPT-4 đã thực hiện giao dịch dựa trên thông tin nội bộ mà nó nhận được, rồi nó cố giấu bằng cách nói dối "người quản lý" về suy nghĩ của mình.
Tệ hơn nữa, sau khi nói dối, trong khoảng 90% trường hợp, chatbot này đã tăng gấp đôi lời nói dối của mình.
Nhóm nghiên cứu đã thực hiện nhiều lần thử nghiệm tiếp theo, họ thay đổi cả mức độ khuyến khích hoặc ngăn cản hoạt động bất hợp pháp. Tuy nhiên, nền tảng AI này luôn cho ra kết quả từ "giao dịch nội gián".
Các nhà nghiên cứu trên không quên nhắc rằng họ chỉ thực hiện theo kịch bản đã nêu ra; nhóm không có kết luận cho môi trường thực tế.
Hàng triệu người Mỹ có kế hoạch di chuyển bằng đường hàng không trong tháng này có thể phải hủy chuyến ngay trước mùa du lịch lễ hội, nếu tình trạng chính phủ Mỹ đóng cửa tiếp tục kéo dài. Cho đến giờ việc đóng cửa chính phủ là dài nhất trong lịch sử Mỹ.
Trong kỷ nguyên vươn mình mạnh mẽ của đổi mới sáng tạo toàn cầu, hơn 600 ý tưởng khởi nghiệp từ Việt Nam và Ấn Độ đã cùng hội tụ trong Chuyến bay Khởi nghiệp - hành trình nơi 14 dự án xuất sắc nhất sẵn sàng cất cánh kiến tạo tương lai.
Cục Dự trữ Liên bang Mỹ (Fed) vừa cắt giảm lãi suất 0,25 điểm phần trăm vào cuối tháng 10 và giới đầu tư đang tin rằng Bitcoin có thể lập đỉnh mới 150.000 USD vào cuối năm nay - bất chấp đợt điều chỉnh ngắn hạn sau thông báo của Fed.
Tỉnh Hưng Yên vừa ra mắt nền tảng trợ lý ảo cán bộ, công chức tỉnh Hưng Yên. Đây là một trong những bước tiến nổi bật của tỉnh này trong việc ứng dụng trí tuệ nhân tạo (AI) vào hoạt động hành chính và điều hành công việc.
Lãnh đạo UBND TP.HCM vừa kiểm tra tiến độ giải ngân đầu tư công, công tác giải phóng mặt bằng các dự án trọng điểm tại khu vực Bình Dương (cũ), yêu cầu đẩy nhanh tiến độ, tháo gỡ vướng mắc để đảm bảo tiến độ thi công hạ tầng vùng liên kết
Cổ phiếu trên các sàn châu Á đồng loạt tăng trong phiên giao dịch sáng thứ Hai, giữa lúc giới đầu tư kỳ vọng vào sự hạ nhiệt trong căng thẳng Mỹ - Trung và những tiến triển mới trong các thỏa thuận thương mại khu vực nhân chuyến công du châu Á của Tổng thống Mỹ Donald Trump.
Hàng triệu người Mỹ có kế hoạch di chuyển bằng đường hàng không trong tháng này có thể phải hủy chuyến ngay trước mùa du lịch lễ hội, nếu tình trạng chính phủ Mỹ đóng cửa tiếp tục kéo dài. Cho đến giờ việc đóng cửa chính phủ là dài nhất trong lịch sử Mỹ.
Trong kỷ nguyên vươn mình mạnh mẽ của đổi mới sáng tạo toàn cầu, hơn 600 ý tưởng khởi nghiệp từ Việt Nam và Ấn Độ đã cùng hội tụ trong Chuyến bay Khởi nghiệp - hành trình nơi 14 dự án xuất sắc nhất sẵn sàng cất cánh kiến tạo tương lai.
Cục Dự trữ Liên bang Mỹ (Fed) vừa cắt giảm lãi suất 0,25 điểm phần trăm vào cuối tháng 10 và giới đầu tư đang tin rằng Bitcoin có thể lập đỉnh mới 150.000 USD vào cuối năm nay - bất chấp đợt điều chỉnh ngắn hạn sau thông báo của Fed.
Tỉnh Hưng Yên vừa ra mắt nền tảng trợ lý ảo cán bộ, công chức tỉnh Hưng Yên. Đây là một trong những bước tiến nổi bật của tỉnh này trong việc ứng dụng trí tuệ nhân tạo (AI) vào hoạt động hành chính và điều hành công việc.
Lãnh đạo UBND TP.HCM vừa kiểm tra tiến độ giải ngân đầu tư công, công tác giải phóng mặt bằng các dự án trọng điểm tại khu vực Bình Dương (cũ), yêu cầu đẩy nhanh tiến độ, tháo gỡ vướng mắc để đảm bảo tiến độ thi công hạ tầng vùng liên kết
Cổ phiếu trên các sàn châu Á đồng loạt tăng trong phiên giao dịch sáng thứ Hai, giữa lúc giới đầu tư kỳ vọng vào sự hạ nhiệt trong căng thẳng Mỹ - Trung và những tiến triển mới trong các thỏa thuận thương mại khu vực nhân chuyến công du châu Á của Tổng thống Mỹ Donald Trump.