STEGANOGRAPHY LÀ GÌ

     
1. Steganography là gì ?

Nếu là một fan trinh thám tuyệt các văn hóa phẩm về điệp viên, chắc rằng bạn không hề lạ gì với câu hỏi truyền tin bởi những đoạn tin quảng bá tưởng như rất bình thường trên báo, với mật mã "hình nhân nhảy đầm múa" trong Sherlock Holmes, hay gần gũi nhất là hồi nhỏ tuổi chúng ta nghiên cứu mực vô hình: sử dụng nước chanh viết lên giấy, ngóng khô rồi hơ nóng, thông điệp viết bằng nước chanh sẽ dần hiện ra.

Bạn đang xem: Steganography là gì

Bạn vẫn xem: Steganography là gì

Những lấy ví dụ trên hồ hết là một hiệ tượng của Steganography. Nói đơn giản là chúng ta sẽ tạo thành một một số loại thông điệp hoặc mật mã mà fan ngoài nhìn vào, không phần lớn không giải được bên cạnh đó không nhận thấy được rằng nó có chứa đựng một thông điệp kín đáo - "The art of disguise is knowing how khổng lồ hide in plain sight"

Theo quan niệm từ Wikipedia:

Steganography (Kỹ thuật đậy tin xuất xắc kỹ thuật che thư, nghệ thuật ẩn mã) là nghệ thuật và kỹ thuật về việc viết và chuyển tải các thông điệp một biện pháp bí mật, sao để cho ngoại trừ fan gửi và bạn nhận, không có bất kì ai biết tới sự tồn trên của thông điệp, là 1 trong dạng của bảo mật bằng phương pháp che giấu. Tự steganography có gốc Hy lạp tức là "giấu tin" phối hợp từ hai từ steganos (στεγανός) tức là "ẩn nấp nhằm bảo vệ" và graphein (γράφειν) tức là "viết".

Trong không gian số, steganography tồn tại dưới dạng file, lời nhắn, hình hình ảnh hoặc đoạn đoạn phim được ẩn giấu trong một file/ lời nhắn/ hình ảnh hoặc đoạn phim khác. Các file truyền thông là lớp vỏ quấn (cover) ưng ý để che tin vì chúng có form size lớn. Ví dụ tín đồ gửi gồm thể đổi khác thành phần màu sắc của một vài pixel bên trên tấm ảnh tương ứng với các ký tự vào bảng chữ cái, sự đổi khác này rất nhỏ đến mức không thể nhận biết bằng mắt thường. Trong nhị hình phía dưới, hình bên trái là stego image - hình ảnh đã được download "thông điệp" túng bấn mật bằng cách xử lý màu sắc component của từng pixel. Hình bên cần là "thông điệp" sau thời điểm được extract ra.

Xem thêm: Cách Xem Tất Cả Bình Luận Trên Facebook Cực Dễ, Cách Xem Tất Cả Bình Luận Trên Facebook


*

*

2. Text Steganography

Như đang nói làm việc trên, có khá nhiều phương tiện hoàn toàn có thể dùng để gia công vật trung gian có tin: file, audio, hình ảnh, video, vv. Nhưng lại trong cuộc sống đời thường hàng ngày thì văn phiên bản (text) đó là phương luôn thể truyền tin thông dụng nhất. Tuy nhiên so với những file truyền thông thì text tất cả mức độ mã hóa thông tin cao hơn nữa dẫn cho ít tin tức dư thừa (redundant information) hơn, khiến cho việc che thông tin trong những số ấy khó hơn cực kỳ nhiều. Trong phạm vi nội dung bài viết này, mình đã tìm hiểu về việc steganography với định dạng text cũng như một số kỹ thuật giấu tin (generation-based) trong văn phiên bản được cải cách và phát triển trong thời gian gần đây.

Xem thêm: Lời Chúc Trung Thu Bằng Tiếng Anh, Độc Đáo 2021

2.1. Đặt vấn đề

Giả sử A ý muốn gửi mang lại B một lời nhắn chứa tin tức nhạy cảm sang một kênh được giám sát và đo lường bởi C. Kênh này hoàn toàn có thể được áp dụng chung nhằm liên lạc vày nhiều mặt khác nhau. Thông tin được truyền đi vào kênh là văn bản chứa ngôn ngữ tự nhiên (natural language). A vừa phải bảo vệ chỉ tất cả mình B phát âm được nội dung tin nhắn, vừa nên tránh gửi hầu hết nội dung "mất từ bỏ nhiên" rất có thể khiến C nghi ngờ.Vậy A với B hoàn toàn có thể thực hiện quá trình như sau:


*

Mô hình tổng quát của bài toán giấu tin được thể hiện như sau:

*

Trong đó:

mmm là tin nhắn bí mật (thường được mã hóa thành một một chuỗi các bit tuân thủ theo đúng phân phối đều (uniform distribution)yyy là đoạn cover text - stegotextq(y)q(y)q(y) là phân phối xác suất của yfff là một hàm khả nghịch dùng để biến đổi m thành yCả A và B đều sử dụng cùng một tế bào hình ngôn ngữ pLMp_LMpLM​ trong quá trình encode, giấu tin và decode

Như vậy ta có thể thấy quy trình này liên quan đến hai quy trình chính: (1) mã hóa đoạn tin phải chuyển đi với (2) che nó vào trong một quãng văn bản bình thường.

Vậy để hệ thống steganography hoạt động hiệu quả thì hai công đoạn này rất cần được đạt gần như mục tiêu nào?Hay nói bí quyết khác, bao gồm metrics như thế nào để đánh giá tính hiệu quả của của một phương thức giấu tin?

2.2. Evaluation metrics

2.2.1. Perplexity

Perplexity là thước đo đánh giá unique của một quy mô ngôn ngữ (language model).Giả sử khi họ xây dựng một quy mô ngôn ngữ từ một tập mẫu câu, ta sẽ lưu lại lại một tập câu để chạy thử (held-out):