Chương 4
MÃ HÓA THÔNG TIN
Mã hoá đóng vai trò quan trọng và có rất nhiều ứng dụng trong đời sống xã hội, đặc biệt là trong lĩnh vực an toàn bảo mật thông tin. Ngày nay, các kỹ thuật mã hoá được sử dụng ngày càng phổ biến hơn trong nhiều lĩnh vực khác nhau như an ninh, quốc phòng,... và đặc biệt khi chúng ta đang triển khai mạnh mẽ TMĐT, thì việc ứng dụng mã hoá ngày càng trở nên cần thiết.
Chương 4 trình bày về mã hoá dữ liệu với các vấn đề liên quan bao gồm: Các vấn đề về tính an toàn của một thuật toán mã hóa, các kỹ thuật phá mã hiện nay và đánh giá độ an toàn của một giải thuật mã hoá. Với mỗi hệ mã hóa đều giới thiệu về đặc điểm, mô hình hoạt động, những ưu, nhược điểm chính và phạm vi ứng dụng trong bảo mật thông tin. Đồng thời, một số hệ mã hoá thường dùng trong bảo mật thông tin hiện nay như hệ thống mã DES, RSA, các hệ mã hóa cổ điển cũng được giới thiệu trong chương này.
4.1. TỔNG QUAN VỀ MÃ HÓA
4.1.1. Khái niệm hệ mã hóa
Mã hóa là phương thức biến đổi thông tin từ định dạng thông thường (văn bản, hình ảnh, âm thanh, biểu tượng,...) thành một định dạng khác không giống như ban đầu nhưng có thể khôi phục lại được, (việc khôi phục này gọi là giải mã). Mục đích chính của mã hóa là để đảm bảo tính bí mật của thông tin khi chúng được truyền trong những môi trường không đảm bảo an toàn.
Việc mã hóa thông tin được thực hiện bằng việc sử dụng một giá trị đặc biệt gọi là khóa mã (key). Cả hai phía gửi và nhận thông tin đều phải biết giải thuật mã hóa và khóa để thực hiện việc mã hóa và giải mã thông tin. Thông tin đã được mã hóa có thể bị nghe (xem) trộm nhưng không thể
Có thể bạn quan tâm!
- An toàn và bảo mật thông tin: Phần 2 - PGS.TS. Đàm Gia Mạnh, TS. Nguyễn Thị Hội Chủ biên - 2
- Hệ Mã Hoá Khóa Tự Động (Mã Hóa Cộng Tính Đa Bảng Cải Tiến)
- Ưu Điểm Và Nhược Điểm Của Hệ Mã Hóa Không Đối Xứng
Xem toàn bộ 194 trang tài liệu này.
bị giải mã để lấy ra thông tin đích thực nếu không biết giải thuật mã hóa và khóa. Như vậy, mã hóa cung cấp tính bí mật cho thông tin trong quá trình truyền thông trên các kênh truyền.
Ngành khoa học chuyên nghiên cứu về mã hóa và giải mã là ngành mật mã. Đây là một ngành khoa học ứng dụng toán học, các thuật toán ứng dụng vào biến đổi thông tin từ định dạng ban đầu một định dạng khác. Nó đóng vai trò quan trọng và có rất nhiều ứng dụng trong đời sống xã hội ngày nay, từ các lĩnh vực như an ninh, quốc phòng,... đến các hoạt động trong sản xuất kinh doanh của các tổ chức, doanh nghiệp.
Mã hóa thông tin nhằm mục đích giấu đi nội dung thực tế của thông tin mà người dùng muốn truyền trong quá trình truyền tin cũng như trong việc lưu trữ thông tin. Phương pháp này dùng để tránh tình trạng thông tin bị đánh cắp và sử dụng vào những mục đích không tốt. Có thể chia quá trình mã hóa thông tin thành hai phần:
- Mã hóa: là giai đoạn chuyển đổi thông tin nguyên gốc ban đầu thành các định dạng thông tin được mã hóa (gọi là bản mã).
- Giải mã: từ bản mã thông tin nhận được, tiến hành biến đổi để thu lại được thông tin nguyên gốc như trước khi mã hóa.
Người gửi S
Mã hóa X
Kênh thông tin
Giải mã
Y
Người nhận R
Thông tin đã mã hóa Y
Kẻ tấn công E
Hình 4.1. Mô hình truyền tin có bảo mật cơ bản
Trong truyền thông, để đảm bảo sự bí mật của thông tin thì trước khi truyền, thông tin được mã hoá ở phía người gửi sau đó được giải mã ở phía người nhận. Quá trình này còn gọi là quá trình truyền thông tin có bảo mật hay truyền tin an toàn. Có thể mô tả mô hình truyền thông tin có bảo mật như Hình 4.1.
Sơ đồ mô hình truyền tin bảo mật trên có thể giải thích ngắn gọn:
Giả sử có 3 đối tượng tham gia quá trình truyền tin là người gửi là S, người nhận là R và kẻ tấn công là E.
- S muốn gửi một thông điệp X đến R qua một kênh truyền thông tin nào đó và E có thể nghe trộm và ăn cắp thông tin này. Để chống lại việc mất thông tin, S sử dụng một phép biến đổi (mã hóa) lên thông điệp X đang ở dạng nguyên gốc ban đầu (dạng đọc được - Plaintext) để tạo thành một đoạn mã hóa Y (Cryptogram) không thể đọc được hoặc nội dung đã bị thay đổi đi nhiều.
- Khi đó Cryptogram Y (hay còn gọi là Ciphertext - thông điệp đã được mã hoá) đã thực hiện che giấu nội dung của đoạn Plaintext X ban đầu. Khóa dùng để mã hõa dữ liệu này là một thông số chỉ có bên gửi S và bên nhận R biết mà thôi, sau khi R nhận được bản Ciphertext sẽ tiến hành giải mã và lấy về nội dung ban đầu.
Giả sử trong quá trình truyền tin, E nghe lén và đánh cắp được thông tin (Y) thì cũng không thể giải mã và biết được nội dung của thông tin ban đầu.
Ngày nay, mã hoá đã trở thành một ngành khoa học ứng dụng quan trọng, các ứng dụng mã hóa và bảo mật thông tin ngày càng phổ biến hơn và thực sự cần thiết cho tất cả các lĩnh vực sử dụng thông tin kể cả chính phủ, các tổ chức, doanh nghiệp và các cá nhân:
- Đối với chính phủ: Mã hóa nhằm đảm bảo thông tin trong quân sự và ngoại giao, bảo vệ thông tin trong các lĩnh vực trọng yếu mang tầm cỡ quốc gia.
- Đối với các tổ chức, doanh nghiệp: Mã hóa nhằm bảo vệ các thông tin nhạy cảm, các thông tin mang tính chiến lược của các tổ chức, doanh nghiệp.
- Đối với các cá nhân: Mã hóa nhằm bảo vệ các thông tin riêng tư trong liên lạc với thế giới bên ngoài thông qua các kênh truyền tin, đặc biệt là trên mạng Internet và các phương tiện truyền thông xã hội.
4.1.2. Vài nét về lịch sử mã hóa
Mật mã học hay mã hóa là một ngành có lịch sử xuất hiện từ hàng nghìn năm nay, lịch sử mật mã học chính là lịch sử của những phương pháp mật mã học cổ điển hay còn gọi là các phương pháp mật mã hóa với bút, giấy và đôi khi có hỗ trợ từ những dụng cụ cơ khí đơn giản dao, đá khắc lên các vật liệu như thẻ tre, da động vật, vách đá. Vào những năm đầu của thế kỷ 20, sự xuất hiện của các cơ cấu cơ khí và điện cơ, chẳng hạn như máy Enigma, đã cung cấp những cơ chế phức tạp và hiệu quả hơn cho việc mật mã hóa. Sự ra đời và phát triển mạnh mẽ của ngành điện tử và máy tính trong những thập kỷ gần đây đã tạo điều kiện để mật mã học phát triển nhảy vọt lên một tầm cao mới, sự phát triển của mật mã học luôn luôn đi kèm với sự phát triển của các kỹ thuật phá mã (hay thám mã).
Những bằng chứng sớm nhất về sử dụng mật mã học là các chữ tượng hình được tìm thấy trên các bức tượng Ai Cập cổ đại (cách đây khoảng 4500 năm). Những ký hiệu tỏ ra không phải để phục vụ mục đích truyền thông tin bí mật mà thường là nhằm mục đích gợi nên những điều thần bí, trí tò mò hoặc thậm chí để tạo sự thích thú cho người xem. Muộn hơn, các học giả về tiếng Hebrew có sử dụng một phương pháp mã hóa thay thế bảng chữ cái đơn giản chẳng hạn như mật mã Atbash (khoảng năm 500 đến năm 600). Người Hy Lạp cổ đại cũng được biết đến là đã sử dụng các kỹ thuật mật mã. Cũng có những bằng chứng rõ ràng chứng tỏ người La Mã nắm được các kỹ thuật mật mã (mật mã Caesar và các biến thể). Thậm chí đã có những đề cập đến một cuốn sách nói về mật mã trong quân đội La Mã, tuy nhiên cuốn sách này đã thất truyền. Tại Ấn Độ, mật mã học cũng khá nổi tiếng, trong cuốn sách Kama Sutra, mật mã học
được xem là cách những người yêu nhau trao đổi thông tin mà không bị phát hiện.
Mật mã học ngày càng trở nên quan trọng dưới tác động của những thay đổi, cạnh tranh trong chính trị và tôn giáo. Chẳng hạn tại châu Âu, trong và sau thời kỳ Phục Hưng, các công dân của các thành bang thuộc Ý, gồm cả các thành bang thuộc giáo phận và Công giáo La Mã, đã sử dụng và phát triển rộng rãi các kỹ thuật mật mã.
Ngoài các nước ở Trung Đông và Châu Âu, mật mã học hầu như không được phát triển. Tại Nhật Bản, mãi cho tới 1510, mật mã học vẫn chưa được sử dụng và các kỹ thuật tiên tiến chỉ được biết đến sau khi nước này mở cửa với phương Tây (thập kỷ 1860).
Tuy mật mã học có một lịch sử lâu dài và phức tạp, mãi cho đến thế kỷ 19 của thế kỷ 20 nó mới được phát triển một cách có hệ thống, không chỉ còn là những tiếp cận nhất thời, vô tổ chức, những ví dụ về phân tích mã bao gồm công trình của Charles Babbage trong kỷ nguyên của Chiến tranh Krim về toán phân tích mật mã đơn ký tự, công trình của ông đã được Friedrich Kasiski, người Phổ, khôi phục và công bố, tại thời điểm này, để hiểu được mật mã học, người ta thường phải dựa vào những kinh nghiệm từng trải qua để kiểm nghiệm.
Trong thời gian trước và tới thời điểm của Thế chiến II, nhiều phương pháp toán học đã hình thành (đáng chú ý là ứng dụng của William
F. Friedman dùng kỹ thuật thống kê để phân tích và kiến tạo mật mã và thành công bước đầu của Marian Rejewski trong việc bẻ gãy mật mã của hệ thống Enigma của Quân đội Đức). Sau Thế chiến II trở đi, cả hai ngành, mật mã học và phân tích mã, ngày càng sử dụng nhiều các cơ sở toán học, tuy thế, chỉ đến khi máy tính và các phương tiện truyền thông cùng mạng Internet trở nên phổ biến, người ta mới có thể mang tính hữu dụng của mật mã học vào trong những thói quen sử dụng hàng ngày của mọi người, thay vì chỉ được dùng bởi các chính quyền quốc gia hay các hoạt động kinh doanh lớn trước đó.
4.1.3. Vai trò của mã hóa và quy trình mã hóa
Yêu cầu của các hệ mật mã cần phải thỏa mãn các yêu cầu sau:
- Hệ mật mã phải che dấu được nội dung của văn bản rõ (PlainText) để đảm bảo sao cho chỉ người chủ hợp pháp của thông tin mới có quyền truy cập thông tin (Secrety), hay nói cách khác là chống truy nhập không đúng quyền hạn.
- Tạo các yếu tố xác thực thông tin, đảm bảo thông tin lưu hành trong hệ thống đến người nhận hợp pháp là xác thực (Authentication).
- Tổ chức các sơ đồ chữ ký điện tử, đảm bảo không có hiện tượng giả mạo, mạo danh để gửi thông tin trên mạng.
Ưu điểm lớn nhất của bất kỳ hệ mật mã bất kỳ đó là có thể đánh giá được độ phức tạp tính toán mà “kẻ địch” phải giải quyết bài toán mới có thể lấy được thông tin đã được mã hoá. Tuy nhiên mỗi hệ mật mã có một số ưu và nhược điểm khác nhau, nhưng nhờ đánh giá được độ phức tạp tính toán nên có thể áp dụng các thuật toán mã hoá khác nhau cho từng ứng dụng cụ thể tuỳ theo yêu cầu về độ an toàn của các ứng dụng.
4.1.4. Các yêu cầu của hệ mã hóa
Để đảm bảo được các yêu cầu về an toàn và bảo mật thông tin, các hệ mã hoá cần phải có các tính chất sau:
(1) Tính hỗn loạn (Confusion): Mã hoá phải làm cho sự phụ thuộc của bản mã (ciphertext) vào các bản rõ (plaintext) là thực sự phức tạp, nhằm gây sự rối loạn đối với những người có ý định tìm quy luật để phá mã nhằm thu được thông tin nguyên bản.
(2) Tính khuếch tán (Diffusion): Làm cân bằng tỉ lệ xuất hiện các ký tự trong bản mã hóa, qua đó tạo ra sự khó khăn cho những người có ý định phá mã bằng phương pháp thống kê dựa trên tỷ lệ các mẫu lặp. Chẳng hạn, để san bằng xác suất xuất hiện của các ký tự cũng như các nhóm ký tự, có thể thêm một đoạn văn bản thừa vào văn bản sau khi mã hóa.
Các thuật toán mã hóa đều có một điểm chung đó là sử dụng một loại khóa mã trong quá trình mã hóa và giải mã. Độ an toàn của giải thuật mã hóa phụ thuộc rất nhiều vào sự đảm bảo bí mật của khóa mã này, nghĩa là phụ thuộc vào việc làm thế nào để chỉ người gửi và người nhận thông tin đích thực mới biết được khoá mã. Các hệ mã hóa nói chung đều thường bị tấn công nhằm xác định ra khóa mã một cách nhanh nhất để có thể tìm được thông tin nguyên bản.
Độ an toàn của một hệ mã hóa: Trên phương diện lý thuyết, về độ an toàn của một hệ mã hóa có thể phân ra làm 2 loại: an toàn vô điều kiện và an toàn tính toán.
Một hệ mã hóa được coi là an toàn vô điều kiện khi bản mã thu được không chứa đủ thông tin để xác định duy nhất một nguyên bản tương ứng. Nói cách khác, không thể giải mã được với bất kể thời gian kéo dài bao lâu cũng như với tốc độ và nguồn lực máy tính lớn đến như thế nào. Trên thực tế, hiện nay, chỉ có hệ mã hóa độn một lần là an toàn vô điều kiện.
Một hệ thống mã hóa được coi là an toàn tính toán nếu nó thỏa mãn một trong hai điều kiện sau:
(1) Chi phí để phá mã vượt quá giá trị mà thông tin có thể mang lại. Chẳng hạn, để có thể trộm cắp được 1 tỷ đồng của ngân hàng mà kẻ tấn công phải chi ra 2 tỷ để phá mã thì cũng không mang lại lợi ích nào cho người phá mã. Trong trường hợp này có thể nói rằng chi phí phá mã vượt quá giá trị mà thông tin mang lại.
(2) Thời gian phá mã vượt quá tuổi thọ thông tin. Chẳng hạn như một thông báo chỉ có giá trị trong một tháng mà thời gian giải mã kéo dài tới hai tháng thì có thể xem là thời gian phá mã vượt quá tuổi thọ của thông tin hay nói cách khác khi giải mã xong kẻ tấn công cũng không đạt được lợi ích gì.
Như vậy, chỉ cần một hệ mã hóa đạt được độ an toàn tính toán là đủ cho các ứng dụng thực tế. Cho dù kẻ tấn công có phá được mã đi chăng nữa thì thông tin nhận được cũng không còn giá trị sử dụng. Tuy nhiên, để
thỏa mãn được một trong hai điều kiện trên là khó để đánh giá, nên hiện nay, một hệ thống mã hoá được đánh giá là an toàn nếu nó thỏa mãn hai điều kiện sau đây: (1) Hệ mã hóa không có nhược điểm, (2) Hệ mã hóa có khóa mã có quá nhiều giá trị không thể thử hết.
Như vậy, nếu một hệ mã hóa thỏa mãn hai điều kiện trên thì được coi là an toàn và có thể sử dụng trong các ứng dụng cho nhiều lĩnh vực khác nhau. Có hai hệ mã hóa cơ bản là hệ mã hóa đối xứng (hệ mã hóa một khóa hay hệ mã hóa khóa bí mật) và hệ mã hóa không đối xứng (mã hóa hai khóa hay hệ mã hóa khóa công khai). Hai phương pháp này khác nhau ở số lượng khóa sử dụng, hệ mã hóa đối xứng sử dụng chỉ một khóa bí mật để người gửi dùng để mã hóa và người nhận dùng để giải mã. Trong khi đó, mã hóa không đối xứng sử dụng hai khóa khác nhau: một khóa công khai và một khóa bí mật, khóa công khai dùng để mã hóa và khóa bí mật dùng để giải mã. Mỗi phương pháp mã hóa có ưu, nhược điểm riêng và do đó, có những lĩnh vực ứng dụng khác nhau.
4.1.5. Các kỹ thuật phá mã phổ biến
Phá mã là nỗ lực giải mã một văn bản đã được mã hóa trong trường hợp không biết trước khóa của hệ mã hóa, phá mã dựa trên giả thiết là người giải mã nhận biết được nguyên bản cần tìm, phá mã còn được gọi là hack bản mã. Phương pháp phá mã dù tốt đến đâu thì cũng là vô nghĩa nếu người giải mã không xác định được một nguyên bản sau khi giải có chính xác hay không. Có thể lấy ví dụ một người nước ngoài muốn giải một bản mã tiếng Việt nhưng lại không biết tiếng, cho dù có tìm được khóa đúng cũng không thể nhận biết được nội dung văn bản, hiện nay có hai phương pháp phá mã phổ biến là phương pháp vét cạn và phương pháp thám mã.
4.1.5.1. Phương pháp vét cạn
Phương pháp vét cạn trong phá mã là phương pháp thử tất cả các khóa có thể cho đến khi xác định được nguyên bản từ bản mã, trên thực tế, phương pháp này là không khả thi đối với các khoá có độ dài lớn.