Các công cụ phát hiện nội dung AI hiện tại đang gặp nhiều vấn đề, với tình trạng báo cáo sai (false positives) hoặc bỏ sót (false negatives) xảy ra thường xuyên. Điều này gây ra sự hoài nghi về độ tin cậy của chúng, ví dụ như các nền tảng như ZeroGPT. Tuy nhiên, nhu cầu về một công cụ phát hiện AI thực sự đáng tin cậy là rất lớn, thúc đẩy các nỗ lực phát triển không ngừng trong lĩnh vực này. Google cũng đã tham gia cuộc đua với một công cụ riêng của mình, dù bạn chưa thể sử dụng nó ngay bây giờ.
Google vừa công bố SynthID Detector, một cổng xác minh mới được thiết kế để nhận diện nội dung được tạo ra bằng các công cụ trí tuệ nhân tạo của họ, bao gồm Gemini (văn bản và đa phương tiện), mô hình tạo ảnh Imagen, hoặc mô hình tạo video Veo. SynthID Detector hoạt động bằng cách quét các phương tiện được tải lên để tìm kiếm một watermark kỹ thuật số vô hình, còn được gọi là SynthID. Google đã phát triển công nghệ watermark này để nhúng trực tiếp vào nội dung được tạo bởi các mô hình AI của họ, bao gồm Gemini, Imagen, Lyria (âm thanh) và Veo. Theo công ty, đã có hơn 10 tỷ nội dung được đánh dấu bằng hệ thống này. Đây là một công cụ do chính Google tạo ra, chuyên tìm kiếm watermark đó và cho bạn biết liệu nội dung có phải do AI tạo ra hay không.
SynthID Detector Hoạt Động Như Thế Nào?
Khi bạn tải một tệp – có thể là hình ảnh, bản nhạc, video, hoặc tài liệu văn bản – lên cổng SynthID Detector, công cụ này sẽ quét để tìm sự hiện diện của watermark kỹ thuật số đã được nhúng. Nếu phát hiện thấy, cổng sẽ chỉ ra rằng nội dung đó có khả năng cao là do AI tạo ra.
Giao diện cổng SynthID Detector của Google hiển thị kết quả quét watermark kỹ thuật số để nhận diện nội dung tạo bởi AI.
Trong một số trường hợp, công cụ này còn có khả năng làm nổi bật những phần cụ thể nơi watermark được phát hiện rõ ràng nhất. Ví dụ, với các tệp âm thanh, nó có thể chỉ ra các đoạn chứa watermark, và đối với hình ảnh, nó có thể xác định các vùng có chữ ký kỹ thuật số.
Hạn Chế và Thách Thức
Dù là một bước tiến đáng kể, công cụ này vẫn còn một số điểm cần cải thiện. Điểm đáng chú ý là detector vẫn có thể “không chắc chắn” về một số phần, điều này không phải là dấu hiệu tốt cho một phương pháp watermark đáng tin cậy, vốn phải có khả năng chịu được sự thay đổi và chỉnh sửa. Giống như việc công cụ có thể không chắc chắn về một số bit, nó cũng có thể phát hiện watermark ở nơi không có, hoặc ngược lại, bỏ sót những nội dung thực sự do AI tạo ra. Nhiều khả năng, nó sẽ dễ gặp phải các trường hợp báo cáo sai (false positives) hơn là bỏ sót (false negatives), nhưng false positives vẫn là một vấn đề.
Chắc chắn công cụ này sẽ tiếp tục được cải thiện trong tương lai. Một công cụ từ chính nhà phát triển AI như thế này có thể là cách đáng tin cậy nhất hiện nay để xác định liệu nội dung có phải do AI tạo ra hay không, nhưng vẫn chưa có một phương pháp nào thực sự hoàn hảo hay “chống đạn” để phát hiện tất cả.
Lộ Trình Triển Khai
Hiện tại, SynthID Detector đang được triển khai cho một số người dùng trong giai đoạn truy cập sớm. Sau đó, công cụ này sẽ được mở rộng giới hạn cho các nhà báo, chuyên gia truyền thông và nhà nghiên cứu thông qua danh sách chờ.
SynthID Detector thể hiện nỗ lực của Google trong việc minh bạch hóa và quản lý nội dung AI. Mặc dù vẫn còn những thách thức về độ chính xác, đây là một bước đi quan trọng hướng tới việc xây dựng một hệ sinh thái nội dung số đáng tin cậy hơn.
Hãy theo dõi thuthuatso.net để cập nhật những thông tin mới nhất về SynthID Detector và các công cụ phát hiện AI tiên tiến khác!