mạng có bị tắc nghẽn (congestion ) hay không. Do đó ứng dụng có thể áp dụng các cơ chế khác nhau theo yêu cầu của nó.
1.1.2 Đặc điểm vận chuyển lưu lượng kiểu “Cố gắng tối đa ” [2]
Giao thức IP cung cấp dịch vụ cố gắng tối đa, nghĩa là nó cố gắng chuyển mỗi datagram từ nguồn đến đích một cách nhanh nhất có thể. Tuy nhiên nó không đảm bảo độ trễ cũng như jitter của các gói tin. Mặt khác TCP và UDP đều chạy trên IP, chúng cũng không đảm bảo về mặt độ trễ cho các gói tin. TCP truyền tin cậy nhưng việc áp dụng cơ chế này dẫn đến việc phải phát lại các gói tin bị mất cho đến khi thành công, vì vậy có thể gây ra độ trễ rất lớn; ngoài ra việc áp dụng cơ chế cửa sổ trượt có kích thước thay đổi cũng dẫn đến jitter lớn. UDP không sử dụng cơ chế biên nhận do đó không tin cậy.
Đặc điểm vận chuyển kiểu “cố gắng tối đa” của các giao thức nói trên không thích hợp cho sự phát triển các ứng dụng đa phương tiện trên Internet. Tuy nhiên, chúng đã được sử dụng phổ biến trên Internet ngay từ khi Internet mới hình thành, do đó để truyền thông đa phương tiện trên Internet người ta đã và đang áp dụng giải pháp thực tế là sửa đổi và cải tiến chúng chứ không thay thế bằng các giao thức hoàn toàn mới. Cho đến nay, các ứng dụng truyền thông multimedia sử dụng các giải pháp này đã làm tăng chất lượng dịch vụ lên đáng kể, song vẫn còn nhiều hạn chế, đòi hỏi tiếp tục được nghiên cứu, cải tiến. Chẳng hạn đối với các ứng dụng truyền audio/video được lưu trữ trước thì độ trễ trung bình trong khoảng từ 5-10s là chấp nhận được, tuy nhiên ở những thời điểm tắc nghẽn thì độ trễ có thể tăng đến mức không chấp nhận được. Đối với các ứng dụng truyền thông đa phương tiện thời gian thực kiểu có tương tác, yêu cầu về độ trễ và jitter còn cao hơn nữa, do đó các yêu cầu này thường không được đáp ứng.
Người ta đã đề xuất và áp dụng một số biện pháp để cải thiện chất lượng của các ứng dụng truyền thông multimedia, như sau:
- Cơ chế loại bỏ jitter ở phía nhận
- Khôi phục các gói tin bị mất tại phía nhận
- Nén dữ liệu audio/video
- Sử dụng giao thức RTP ở tầng giao vận
Dưới đây là những hạn chế của dịch vụ cố gắng tối đa:
Có thể bạn quan tâm!
- Đánh giá hiệu quả đảm bảo QoS cho truyền thông đa phương tiện của chiến lược quản lý hàng đợi Wred - 1
- Đánh giá hiệu quả đảm bảo QoS cho truyền thông đa phương tiện của chiến lược quản lý hàng đợi Wred - 2
- Các Tham Số Hiệu Năng Chủ Yếu Của Mạng Liên Quan Đến Việc Đảm Bảo Qos
- Các Kiểu Rsvp Dành Trước Tài Nguyên
- Các Phương Pháp Đảm Bảo Qos Cho Truyền Thông Đa Phương Tiện
Xem toàn bộ 88 trang tài liệu này.
a. Tỉ lệ mất mát gói tin có thể rất lớn khi xảy ra tắc nghẽn
Chúng ta xem xét một UDP segment được tạo ra bởi ứng dụng một điện thoại Internet. Nó được đóng gói trong một IP datagram và IP datagram được chuyển tới phía nhận. Datagram được truyền trên mạng qua các bộ đệm trong các router. Nếu một trong các bộ đệm của router đã đầy thì datagram sẽ không được nhận vào. Trong trường hợp này, IP datagram bị loại bỏ và coi như bị mất, không tới được phía nhận.
Sự mất mát gói tin có thể được loại bỏ bằng cách gửi gói tin bằng TCP. TCP có cơ chế biên nhận nên sẽ truyền lại các gói tin bị mất. Tuy nhiên, cơ chế truyền lại nói chung là không thể chấp nhận được đối với ứng dụng thời gian thực như là điện
thoại Internet bởi vì nó làm tăng độ trễ. Hơn nữa, theo cơ chế điều khiển tắc nghẽn trong TCP, sau khi mất gói tin, tốc độ phát tại phía gửi có thể giảm tới mức thấp nhất, điều này ảnh hưởng nghiêm trọng tới chất lượng âm thanh tại phía nhận. Vì thế, hầu hết các ứng dụng điện thoại Internet đều chạy trên UDP và không thực hiện truyền lại các gói tin bị mất. Trên thực tế, tỉ lệ mất gói tin từ 1% tới 20% là có thể chấp nhận được, phụ thuộc vào cách âm thanh được nén sau đó được truyền đi và phụ thuộc vào cách che đậy sự mất gói tin của phía nhận như thế nào. Cơ chế sửa lỗi FEC (Forward Error Correction) có thể được dùng để che đậy sự mất gói tin. Tuy nhiên, nếu đường truyền giữa bên gửi và bên nhận bị tắc nghẽn trầm trọng, tỉ lệ mất gói tin vượt quá 10-20%, khi đó sẽ không có cách nào đạt được chất lượng âm thanh mong muốn. Đây là hạn chế của dịch vụ cố gắng tối đa.
b. Độ trễ end-to-end có thể vượt quá giới hạn chấp nhận được
Độ trễ end-to-end là tổng của thời gian xử lý và chờ trong hàng đợi của các router dọc theo đường truyền từ người gửi đến người nhận, thời gian truyền và thời gian xử lý của phía nhận. Với các ứng dụng tương tác thời gian thực như điện thoại Internet, độ trễ end-to-end nhỏ hơn 150ms được coi là không có vấn đề gì (giác quan con người không cảm nhận được sự khác biệt), độ trễ từ 150-400ms là có thể được chấp nhận được, độ trễ lớn hơn 400ms là quá lớn, không thể chấp nhận được. Phía nhận của ứng dụng điện thoại Internet sẽ không nhận bất kì gói tin nào đến trễ hơn một ngưỡng nhất định, ví dụ 400ms. Do đó, các gói tin đến trễ hơn ngưỡng trên thì coi như là mất.
c. Jitter là không thể tránh khỏi và làm giảm chất lượng âm thanh
Một trong những thành phần tạo nên độ trễ end-to-end là thời gian chờ ngẫu nhiên ở hàng đợi của router. Do thời gian chờ ngẫu nhiên này, độ trễ end-to-end có thể thay đổi đối với từng gói tin, sự biến đổi này được gọi là jitter.
Ví dụ: xét 2 gói tin được sinh ra liên tiếp nhau trong một đoạn của ứng dụng điện thoại Internet. Phía gửi phát gói tin thứ 2 sau gói tin đầu 20ms. Nhưng tại bên nhận, khoảng thời gian giữa 2 lần nhận 2 gói tin đó có thể lớn hơn hoặc nhỏ hơn 20ms. Chúng ta có thể thấy rõ hơn như sau: giả sử gói tin đầu tiên tới khi hàng đợi router hầu như là rỗng, nó sẽ được truyền đi ngay, nhưng trước khi gói tin thứ hai tới thì một lượng lớn gói tin từ các nguồn khác đổ về làm đầy hàng đợi, gói tin thứ hai này được xếp vào cuối hàng đợi và phải chờ một khoảng thời gian nhất định trước khi được chuyển tiếp. Như vậy rõ ràng hai gói tin sẽ đến đích trong khoảng thời gian lớn hơn 20ms (có thể lên tới vài giây hoặc nhiều hơn). Ngược lại, giả sử gói tin đầu tới cuối hàng đợi (hàng đợi lúc đó hầu như rất đầy), gói tin thứ 2 tới hàng đợi đó và ngay sau gói tin thứ nhất. Khi đó độ lệch thời gian hai gói đến đích sẽ nhỏ hơn 20ms.
Nếu phía nhận bỏ qua jitter và chạy ngay đoạn âm thanh ngay khi nhận được, kết quả chất lượng âm thanh sẽ rất kém. Có thể loại bỏ jitter bằng các cách sau: đánh số số tuần tự các gói tin, gán nhãn thời gian cho các gói tin, tạm dừng chạy.
1.2 Truyền thông đa phương tiện và yêu cầu chất lượng dịch vụ (QoS)
1.2.1 Một số thí dụ về truyền thông đa phương tiện
Với các ứng dụng truyền thống, dữ liệu là tĩnh (text, image…) có thể chấp nhận độ trễ và độ thăng giáng lớn nhưng không chấp nhận sự mất mát dữ liệu. Trái lại, với các ứng dụng truyền thông đa phương tiện, chủ yếu truyền dữ liệu audio, video chất lượng ứng dụng thay đổi rất nhạy với độ trễ, biến thiên độ trễ và phụ thuộc vào một số tham số mạng khác như băng thông, tỉ suất lỗi... Để hạn chế sự tổn thất gói tin trong giới hạn nhất định, ngoài các phương pháp đảm bảo QoS, các nhà sản xuất mạng đưa ra các chuẩn CODEC, giải thuật bù tổn thất gói tin như che dấu một phần hoặc hoàn toàn, các phương thức điều khiển lịch trình tái tạo gói tin của bộ đệm tái tạo tại đầu nhận. Các ứng dụng đa phương tiện được sử dụng trên Internet ngày nay rất đa dạng, đòi hỏi phải đảm bảo các thông số QoS ở mức độ khác nhau như:
− Các ứng dụng đa phương tiện dạng streaming đòi hỏi phải đảm bảo về thông lượng.
− Dịch vụ điện thoại IP hoặc VoIP (Voice over IP) đòi hỏi một số giới hạn chặt về trễ và biến thiên độ trễ.
− Dịch vụ hội nghị truyền hình (Video Teleconferencing – VTC) đòi hỏi biến thiên độ trễ thấp.
− Các đường truyền dành riêng (dedicated link) đòi hỏi phải đảm bảo cả hai yếu tố là thông lượng và hạn chế tối đa trễ và biến thiên trễ.
− Một số các ứng dụng bảo vệ thiết yếu (ví dụ như thiết bị cứu hộ điều khiển từ xa) đòi hỏi độ sẵn sàng ở mức độ cao (còn gọi là hard QoS).
1.2.1.1 Ứng dụng Email, FTP
Ứng dụng thư điện tử (Email):
Email là một dịch vụ phổ biến nhất trên Internet trước khi World Wide Web ra đời, người sử dụng trên mạng có thể gửi email để trao đổi các thông báo cho nhau trên phạm vi thế giới một cách nhanh chóng, thuận lợi và rẻ tiền. Đây là một dịch vụ mà hầu hết các mạng diên rộng đều cài đặt và cũng là dịch vụ cơ bản nhất của một mạng khi gia nhập Internet. Trong một thời gian dài, nhiều người sử dụng máy tính tham gia mạng chỉ dùng duy nhất dịch vụ này. Dịch vụ này sử dụng giao thức SMTP (Simple Mail Transfer Protocol) trong họ giao thức TCP/IP.
Đặc điểm của dịch vụ thư điện tử là không tức thời (off-line) - tất cả các yêu cầu gửi đi không đòi hỏi phải được xử lý ngay lập tức. Khi người sử dụng gửi một bức thư, hệ thống sẽ chuyển thư này vào một vùng riêng (gọi là spool) cùng với các thông tin về người gửi, người nhận, địa chỉ máy nhận... Hệ thống sẽ chuyển thư đi bằng một chương trình không đồng bộ (background). Chương trình gửi thư này sẽ xác định địa
chỉ IP máy cần gửi tới, tạo một liên kết với máy đó. Nếu liên kết thành công, chương trình gửi thư sẽ chuyển thư tới vùng spool của máy nhận. Nếu không thể kết nối với máy nhận thì chương trình gửi thư sẽ ghi lại những thư chưa được chuyển và sau đó sẽ thử gửi lại. Khi chương trình gửi thư thấy một thư không gửi được sau một thời gian quá lâu (ví dụ 3 ngày) thì nó sẽ trả lại bức thư này cho người gửi. Với cơ chế hoạt động như trên thì rõ ràng đối với dịch vụ E-mail không đòi hỏi yếu tố thời gian thực do vậy yêu cầu QoS đòi hỏi không quá lớn. Khi mạng xẩy ra tắc nghẽn các mail có thể không cần phải được chuyển đi, mà đợi khi mạng rỗi trở lại thì thực hiện truyền. Tuy nhiên một yêu cầu đối vơi Email đó là độ tin cậy, các gói gửi đi phải đảm bảo đến đích và nội dung cần phải chính xác hoàn toàn. Do vậy đòi hỏi mạng không làm mất gói, hoặc khi có xẩy ra mất gói thì phải có cơ chế truyền lại an toàn do vậy Email sử dụng TCP.
Ứng dụng truyền file:
FTP (File Transfer Protocol) là giao thức truyền một file từ một máy tính (host) này tới tới một máy tính khác trên mạng Internet. Hình dưới diễn tả tổng quan về FTP
Hình 1.1: FTP truyền file giữa các hệ thống
Dịch vụ FTP có những yêu cầu giống với dịch vụ Email về chất lượng truyền dẫn, nó không đòi hỏi nhiều về độ trễ hay jitter, các file có thể đến đích nhanh khi có nhiều băng thông hay chậm khi băng thông bị hạn chế nhưng điều quan trọng là toàn bộ file phải được nhận đầy đủ và không có lỗi. FTP cũng sử dụng giao thức TCP để khi có mất gói hay lỗi gói thì có sự truyền lại.
1.2.1.2 Ứng dụng truyền dòng (Streaming) âm thanh, hình ảnh lưu trước
Trong các ứng dụng này, các client đưa ra yêu cầu các file âm thanh, hình ảnh nén được lưu trữ trong máy chủ. Các file âm thanh được lưu trước có thể gồm thu thanh bài giảng của một giáo sư, một bài hát, một bản giao hưởng, nội dung từ một kênh radio quảng bá, hoặc một đoạn ghi âm lịch sử. Các file video được lưu trước có thể gồm có các video về một bài giảng của giáo sư, đủ một bộ phim, các chương trình tivi đã ghi lại từ trước, phim tài liệu, các hình ảnh về các sự kiện lịch sử, các clip nhạc hình hay hoạt hình. Có ba đặc tính quan trọng để phân biệt các lớp ứng dụng này.
Stored Media: các nội dung media đã được ghi trước và được lưu tại máy chủ. Do vậy, người dùng có thể tạm dừng, tua lại và tua nhanh cũng như chọn điểm xem của
chương trình. Thời gian từ khi một client đưa ra yêu cầu đến khi hình ảnh hiện ra tại client vào khoảng 1 tới 10 giây là có thể chấp nhận được.
Streaming: Máy khách bắt đầu hiển thị các âm thanh hình ảnh sau khi nó nhận được một phần của file từ máy chủ. Có nhiều sản phẩm phần mềm phục vụ cho streaming đa phương tiện, thí dụ: RealPlayer của hãng RealNetwork và Windows Media của Microsoft. Tuy nhiên cũng có các ứng dụng như Napster yêu cầu tòan bộ file phải được dowload trước khi bắt đầu hiển thị (play).
Continuous playout: Việc bắt đầu hiển thị một hình ảnh dựa vào định thời gốc của hình ảnh này (nhãn thời gian của nguồn gửi hình ảnh). Cách này tạo ra một độ trễ nhất định cho việc phân phát dữ liệu. Dữ liệu phải được nhận từ máy chủ kịp thời cho việc hiển thị ở máy khách; ngược lại thì mọi thứ trở nên vô nghĩa.
1.2.1.3 Ứng dụng Streaming cho âm thanh, hình ảnh truyền trực tiếp (live)
Lớp ứng dụng này tương tự như các chương trình radio và tivi truyền quảng bá kiểu cổ điển, ngoại trừ việc truyền dẫn là thông qua Internet. Các ứng dụng này cho phép một người dùng nhận nhận chương trình radio hoặc tivi truyền trực tiếp từ bất cứ nơi nào trên thế giới. Bởi vì streaming của âm thanh hình ảnh trực tiếp không được lưu trước, một máy khách không thể tua nhanh. Hơn nữa với phần dữ liệu đã được lưu trong bộ nhớ của máy khách, thì các hành động tương tác như là dừng và tua lại là có thể thực hiện ở một số ứng dụng. Các ứng dụng truyền trực tiếp, quảng bá online thường có nhiều máy khách nhận cùng một chương trình. Việc phân bố âm thanh/ hình ảnh tới nhiều nơi nhận có thể đạt được bằng kỹ thuật multicast. Thí dụ là điện thoại Internet (Internet phone). Một thí dụ khác là hội thảo truyền hình (video conferencing), cho phép một người có thể giao tiếp bằng âm thanh và hình ảnh với một hay nhiều người khác theo phương thức thời gian thực. Đây là tương tác có cảm nhận, các thành viên tham gia có thể trao đổi với nhau thông qua tiếng nói và hình ảnh trong thời gian thực. Trong ứng dụng hội thảo truyền hình, người dùng có thể nói hoặc di chuyển bất kỳ lúc nào họ muốn.
1.2.1.4 Ứng dụng hình ảnh âm thanh tương tác thời gian thực
Lớp ứng dụng này cho phép người dùng sử dụng âm thanh hình ảnh để truyền thông có tương tác với người khác theo thời gian thực. Âm thanh tương tác thời gian thực thường được đề cập tới là điện thoại Internet, theo quan điểm từ phía người dùng, nó tương đương như dịch vụ điện thoại chuyển mạch kênh cổ điển. Điện thoại Internet có thể cung cấp bằng các tổng đài nội bộ PBX, dịch vụ này tương tự điện thoại đường dài nhưng với giá cả thấp. Nó cũng cung cấp cả dịch vụ tích hợp điện thoại máy tính, kết nối nhóm thời gian thực, các dịch vụ chuyển hướng, định danh người gọi, lọc người gọi và nhiều dịch vụ khác. Hiện nay đã có nhiều sản phẩn điện thoại Internet. Với các video tương tác hay còn gọi là hội nghị truyền hình thì cũng có nhiều sản phẩm khác nhau, thí dụ NetMeeting của Microsoft. Chú ý rằng, đối với các ứng dụng âm thanh hình ảnh tương tác, một user có thể nói hoặc di chuyển bất cứ lúc nào. Với một cuộc hội thoại tương tác giữa nhiều người, trễ từ lúc một người nói và di chuyển cho tới khi hành động đó được chuyển tới đầu nhận nên nhỏ hơn một vài trăm ms. Với
âm thanh, độ trễ nhỏ hơn 150ms là không thể cảm nhận được đối với người nghe. Độ trễ từ 150ms tới 400ms là có thể chấp nhận được, và độ trễ lớn hơn 400ms là có thể dẫn đến cuộc hội thoại mà các bên không hiểu nhau nói gì.
1.2.1.5 Ví dụ về điện thoại VoIP
Tầng IP cung cấp các dịch vụ best-effort, không đảm bảo bất cứ điều gì về độ trễ end-to-end của các gói, biến động trễ hay việc mất gói trong luồng dữ liệu.
Các ứng dụng đa phương tiện tương tác thời gian thực, như là điện thoại Internet và hội nghị truyền hình thời gian thực thường rất nhạy cảm với thời gian trễ gói tin, biến thiên độ trễ (jitter) và mất gói. Chính vì vậy cần phải có các kỹ thuật để đảm bảo các ứng dụng âm thanh, hình ảnh khi truyền qua mạng mà các giá trị về trễ, jitter và mất gói không vượt quá mức quy định. Chúng ta đề cập chi tiết đến ứng dụng điện thoại Internet – VoIP dưới đây.
a. Khái niệm VoIP
VoIP viết tắt bởi Voice over Internet Protocol, hay còn được gọi dưới các tên khác như: Internet telephony, IP Telephony, Broadband telephony, Broadband Phone và Voice over Broadband.
VoIP là một công nghệ cho phép truyền âm thanh thời gian thực qua Internet, sử dụng giao thức IP. Trong đó tín hiệu âm thanh (voice signal) từ nguồn âm sẽ được chuyển đổi thành các gói dữ liệu (data packets) IP, sau khi đến bên nhận lại được chuyển thành tín hiệu âm thanh để phát ra cho người nhận. VoIP sử dụng kỹ thuật số và yêu cầu kết nối băng thông tốc độ đủ cao như của đường truyền DSL hoặc cáp.
b. Các kiểu kết nối sử dụng VoIP
− Computer to Computer: Với 01 kênh truyền Internet có sẵn, là một dịch vụ miễn phí được sử dụng rộng rãi khắp nơi trên thế giới. Chỉ cần người gọi (caller) và người nhận (receiver) sử dụng chung 1 VoIP service (Skype, MSN, Yahoo Messenger,…), 2 headphone và microphone, sound card. Thời gian cho cuộc hội thoại kiểu này là không bị giới hạn.
− Computer to phone: Là dịch vụ có phí. Người sử dụng phải trả tiền để có 1 account và phần mềm (thí dụ của: VDC, Evoiz, Netnam,…). Với dịch vụ này 1 máy PC có thể kết nối tới 1 máy điện thoại thông thường ở bất cứ đâu (tuỳ thuộc phạm vi cho phép trong danh sách các quốc gia mà nhà cung cấp cho phép). Người gọi sẽ bị tính phí dựa trên lưu lượng cuộc gọi và khấu trừ vào tài khoản hiện có.
Ưu điểm : đối với các cuộc hội thoại quốc tế, người sử dụng sẽ tốn ít phí hơn 1 cuộc hội thoại thông qua 2 máy điện thoại thông thường. Ngoài ra còn có ưu điểm là chi phí rẻ, dễ lắp đặt.
Nhược điểm: chất lượng cuộc gọi phụ thuộc vào tình trạng kết nối internet và dịch vụ của nhà cung cấp.
− Phone to Phone: Là dịch vụ có phí. Người sử dụng không cần 01 kết nối Internet mà chỉ cần 1 VoIP adapter kết nối với máy điện thoại. Lúc này máy điện thoại trở thành 1 IP phone.
c. Các thành phần trong mạng VoIP
Các thành phần cốt lõi của một mạng VoIP bao gồm: Gateway, VoIP Server, IP network và thiết bị cho người dùng (End User Equipments).
− Gateway: là thành phần giúp chuyển đổi tín hiệu analog sang tín hiệu số (và ngược lại).
VoIP gateway : là các gateway có chức năng làm cầu nối giữa mạng điện thoại thường (PSTN ) và mạng VoIP.
VoIP GSM Gateway: là các gateway có chức năng làm cầu nối cho các mạng IP, GSM và cả mạng analog. (Cần đưa GSM vào bảng chữ viết tắt)
− VoIP server : là các máy chủ trung tâm có chức năng định tuyến và bảo mật cho các cuộc gọi VoIP.
Trong mạng H.323 chúng được gọi là gatekeeper.
Trong mạng SIP các server được gọi là SIP server.
− IP network: là mạng sử dụng giao thức IP, thường là Internet.
End user equipments: Softphone và máy tính cá nhân bao gồm 01 headphone, 01 phần mềm và 01 kết nối Internet. Các phần mềm miễn phí phổ biến như Skype, Ekiga, GnomeMeeting, Microsoft Netmeeting, SIPSet,... Có thể sử dụng điện thoại thông thường nối với một IP adapter để kết nối với VoIP server. Adapter là 01 thiết bị có ít nhất 01 cổng RJ11 (để gắn với điện thoại) , RJ45 (để gắn với đường truyền Internet hay PSTN) và 01 cổng cắm nguồn.
d. Phương thức hoạt động
VoIP truyền tín hiệu tiếng nói thông qua mạng IP. Do vậy, trước hết giọng nói (voice) sẽ phải được chuyển đổi thành dòng bit và dòng bit này được đóng gói thành các packet để sau đó được truyền tải qua mạng IP và cuối cùng sẽ được chuyển lại thành tín hiệu âm thanh đến người nghe ở bên nhận.
Tiến trình hoạt động của VoIP thông qua 2 bước:
Bước 1: Thiết lập cuộc gọi (Call Setup): trong quá trình này , người gọi sẽ phải xác định vị trí (thông qua địa chỉ của người nhận) và yêu cầu một kết nối để liên lạc với người nhận. Khi địa chỉ người nhận được xác định là tồn tại trên các proxy server thì các proxy server giữa hai người sẽ thiết lập một cuộc kết nối cho quá trình trao đổi dữ liệu voice.
Bước 2 Xử lý dữ liệu tiếng nói (Voice data processing): Tín hiệu giọng nói (analog) sẽ được chuyển đổi sang tín hiệu số (digital) bằng cách lấy mẫu và lượng tử hóa, sau đó được nén lại nhằm tiết kiệm băng thông đường truyền sau đó sẽ được mã hóa (tính năng bổ sung nhằm tránh các bộ phân tích mạng _sniffer ). Các mẫu bit tín hiệu tiếng nói (voice samples) sau đó sẽ được đưa vào các gói dữ liệu để được vận chuyển trên mạng. Giao thức dùng cho VoIP thường là RTP (Real-Time Transport Protocol). Một gói tin RTP có các trường ở phần tiêu đề chứa dữ liệu cần thiết cho việc biên dịch lại các gói tin sang tín hiệu voice ở thiết bị người nghe. Các gói tin
voice được truyền đi bởi giao thức UDP. Ở thiết bị cuối, tiến trình được thực hiện ngược lại
e. Các giao thức của VoIP (VoIP Protocols)
VoIP cần hai loại giao thức: Signaling protocol và Media Protocol.
Giao thức Signaling protocol: điều khiển việc cài đặt cuộc gọi. Các loại signaling protocols bao gồm: H.323, SIP, MGCP, Megaco/H.248 và các loại giao thức dùng riêng như UNISTIM, SCCP, Skype, CorNet-IP,…
Giao thức Media Protocol: điều khiển việc truyền tải voice data qua môi trường mạng IP. Các loại Media Protocols như: RTP ( Real-Time Protocol), RTCP (Real- Time Control Protocol), SRTP (Secure Real-Time Transport Protocol) và SRTCP (Secure RTCP).
Giao thức Signaling Protocol sử dụng TCP vì cần độ tin cậy cao, trong khi giao thức Media Protocol sử dụng UDP. Các nhà cung cấp có thể sử dụng các giao thức riêng hay các giao thức mở rộng dựa trên nền của một trong hai giao thức tiêu chuẩn quốc tế là H.323 và SIP. Ví dụ Nortel sử dụng giao thức UNISTIM (Unified Network Stimulus) Cisco sử dụng giao thức SCCP (Signaling Connection Control Part). Việc sử dụng các giao thức riêng này gây khó khăn trong việc kết nối giữa các sản phẩm của các hãng khác nhau.
1.2.2 Khái niệm QoS
Chất lượng dịch vụ là một vấn đề khó định nghĩa chính xác và theo cách định lượng, bởi vì nhìn từ các góc độ khác nhau người ta có thể có quan điểm về chất lượng dịch vụ khác nhau. Ví dụ, với người sử dụng dịch vụ thoại, chất lượng dịch vụ cung cấp tốt khi thoại được rõ ràng, tức là chúng ta phải đảm bảo tốt về giá trị tham số trễ, biến thiên độ trễ và giá trị tham số mất gói tin với một tỉ lệ tổn thất nào đó có thể chấp nhận được. Nhưng đối với khách hàng là người sử dụng trong truyền số liệu ở ngân hàng thì điều tối quan trọng là độ tin cậy, có thể chấp nhận trễ lớn, biến thiên độ trễ lớn, nhưng thông số mất gói tin, độ bảo mật kém thì không thể chấp nhận được.
Từ góc nhìn của nhà cung cấp dịch vụ mạng, công việc đảm bảo QoS cho các dịch vụ mà họ cung cấp cho người sử dụng là thực hiện các biện pháp để duy trì các mức QoS theo nhu cầu, với cơ sở hạ tầng mạng hiện có, thỏa mãn các tiêu chuẩn như độ tin cậy, tính bảo mật và băng thông với thời gian trễ chấp nhận được...
Với các dịch vụ đa phương tiện chất lượng cao như nghe nhạc, xem phim trực tuyến, VoIP,… được truyền trên mạng thì quá trình phát và nhận theo thời gian thực đòi hỏi phải triển khai một mạng có hỗ trợ việc đảm bảo chất lượng dịch vụ. ATM (Asynchronous Transfer Mode) là một giao thức được thiết kế để có thể triển khai thực hiện đảm bảo chất lượng dịch vụ ở nhiều mức. Việc triển khai chất lượng dịch vụ sử dụng mạng IP đòi hỏi phải có thêm một số dịch vụ như dành trước tài nguyên, sử dụng giao thức RSVP (Resource Reservation Protocol), cho phép băng thông có thể được đăng ký để dành trên những thiết bị mạng trung gian như bộ định tuyến.