Công Nghệ 11/06/2019 - 14:26 (GMT+7)

Tin được không, trí tuệ nhân tạo giờ đây đã có thể 'nhét chữ vào mồm' của bất cứ ai

Duy Huỳnh

Đoạn video mà trí tuệ nhận tạo này tạo ra chân thực đến nỗi, bạn sẽ chẳng nhận ra điểm bất thường của video nếu không ai cho bạn biết rằng nó đã được chỉnh sửa.

Vào thời điểm tháng 8/2018, Jim Al-Khalili, giáo sư vật lý từ ĐH Surrey (Anh Quốc) đã từng tuyên bố “trí tuệ nhân tạo - hay AI (artificial intelligence) sẽ nguy hiểm còn hơn cả khủng bố” vì tốc độ phát triển quá nhanh trong khi được sự kiểm soát chặt chẽ.

Thực tế cho thấy, nhận định này của giáo sư Jim Al-Khalili là hoàn toàn đúng khi AI ngày càng phát triển đáng sợ. Minh chứng là gần đây, trí tuệ nhân tạo mà Samsung phát triển đã có thể biến một tấm ảnh bình thường thành một video như thật. Và mới đây nhất, người ta đã chế tạo được công cụ có thể “nhét chữ vào mồm” của bất cứ ai.

Công cụ đặc biệt mà các nhà khoa học vừa tạo ra có thể “chỉnh sửa những gì người khác đã nói trong video”

Cụ thể, một nhóm các nhà khoa học từ Đại học Stanford, Viện Tin học Max Planck, Đại học Princeton và Adobe Research đã tạo ra một công cụ đặc biệt có thể “chỉnh sửa những gì người khác đã nói trong video”.

Video mô tả về công nghệ này được đăng tải trên YouTube cho thấy, ban đầu nhân vật cô gái trong đoạn video sẽ nói một câu có nội dung “Sau phiên giao dịch hôm nay, giá cổ phiếu của Apple nằm ở mức 191.45 USD”. Sau khi sử dụng công cụ kể trên, lời nói của cô gái đã được chuyển thành “Sau phiên giao dịch hôm nay, giá cổ phiếu của Apple nằm ở mức 182.25 USD”. Điều đáng nói, bạn sẽ chẳng nhận ra điểm bất thường của video nếu không ai cho bạn rằng nó đã được chỉnh sửa.

Bạn sẽ chẳng nhận ra điểm bất thường của video nếu không ai cho bạn biết rằng video đã được chỉnh sửa

Nghe có vẻ đơn giản, nhưng công cụ này đòi hỏi nhiều kỹ thuật rắc rối, bao gồm: âm vị, tầm nhìn, khuôn mặt 3D và hình học, độ phản xạ, biểu cảm và độ chiếu sáng cảnh trên mỗi khung hình. Khi lời nói của nhân vật trong video bị thay đổi, thuật toán của các nhà nghiên cứu sẽ kết hợp tất cả các yếu tố lại với nhau một cách liền mạch, trong khi phần dưới khuôn mặt của nhân vật trong video được hiệu chỉnh để khớp với văn bản mới.

Ở phía đầu vào, công cụ cho phép người dùng dễ dàng thêm, xóa hoặc thay đổi các từ trong video hoặc thậm chí tạo ra các câu hoàn toàn mới. Tuy nhiên, vẫn có những hạn chế như công cụ này chỉ có thể được sử dụng trên các video có nhân vật đang trò chuyện. Dẫu vậy, các nhà nghiên cứu lưu ý rằng, công cụ này chỉ là bước đầu và nó có thể được phát triển hoàn thiện hơn.

Xét theo chiều hướng tốt, công cụ này có thể được áp dụng để chỉnh sửa phim ảnh, hoặc những nội dung nghe nhìn. Tuy nhiên, nhược điểm lớn nhất của loại kỹ thuật dạng này và sự phát triển nhanh chóng của chúng sẽ gây ra không ít rủi ro về tin giả, giả mạo bầu cử và gian lận.