LỜI CẢM ƠN
Sau hơn một tháng nghiên cứu em đã hoàn thành đồ án tốt nghiệp của mình. Tập đồ án này là kết quả của ba năm học tập trường Cao đẳng CNTT Hữu Nghị Việt – Hàn. Em xin gửi lời cảm ơn chân thành nhất đến tất cả các thầy giáo, cô giáo trong khoa CNTT Ứng Dụng, những người đã tận tâm, nhiệt tình giảng dạy trong suốt ba năm qua để em có được những kiến thức cơ bản về ngành học cũng như giúp em hoàn thiện được đồ án tốt nghiệp này.
Qua đây em xin gửi lời cảm ơn đến cô Phan Thị Lan Anh người đã tận tình hướng dẫn em trong suốt thời gian thực hiện đồ án.
Trong quá trình làm đồ án, mặc dù đã cố gắng hết mình xong khả năng hiểu biết của bản thân còn hạn chế và không tránh khỏi thiếu sót. Rất mong sự góp ý của quý thầy cô và các bạn để đồ án này được hoàn chỉnh hơn.
Xin chân thành cảm ơn!
Đà Nẵng, tháng 6 năm 2013 Sinh viên thực hiện
Võ Công Điễn
MỤC LỤC
LỜI CẢM ƠN i
MỤC LỤC ii
DANH MỤC CÁC HÌNH VẼ vi
DANH MỤC BẢNG BIỂU vii
DANH MỤC CÁC TỪ VIẾT TẮT VÀ CÁC THUẬT NGỮ TIẾNG ANH viii
MỞ ĐẦU 1
CHƯƠNG 1: TỔNG QUAN VỀ NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI 2
1.1 GIỚI THIỆU CHƯƠNG 2
1.2 NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI LÀ GÌ ? 2
1.3 LÝ THUYẾT VỀ TÍN HIỆU VÀ NHIỄU 3
1.3.1 Tín hiệu 3
1.3.2 Nguồn tín hiệu 4
1.3.3 Hệ thống và xử lý tín hiệu 4
1.3.4 Phân loại tín hiệu 5
1.4 LÝ THUYẾT VỀ NHIỄU 5
1.4.1 Nguồn nhiễu 5
1.4.2 Nhiễu và mức tín hiệu tiếng nói trong các môi trường khác nhau 7
1.5 TÍN HIỆU RỜI RẠC THEO THỜI GIAN 8
1.5.1 Tín hiệu bước nhảy đơn vị 8
1.5.2 Tín hiệu xung đơn vị 8
1.5.3 Tín hiệu hàm mũ 9
1.5.4 Tín hiệu hàm sin rời rạc 9
1.6 PHÉP BIẾN ĐỔI FOURIER CỦA TÍN HIỆU RỜI RẠC DTFT 9
1.6.1 Sự hội tụ của phép biến đổi Fourier 9
1.6.2 Quan hệ giữa biến đổi Z và biến đổi Fourier 10
1.6.3 Phép biến đổi Fourier ngược 10
1.6.4 Các tính chất của phép biến đổi Fourier 11
1.6.5 Phân tích tần số (phổ) cho tín hiệu rời rạc 11
1.6.6 Phổ tín hiệu và phổ pha 12
1.7 CÁC THUẬT TOÁN SỬ DỤNG NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI
.......................................................................................................................12
1.7.1 Trừ phổ 12
1.7.2 Mô hình thống kê 13
1.8 TÍN HIỆU TIẾNG NÓI 13
1.9 CƠ CHẾ TẠO TIẾNG NÓI 14
1.9.1 Bộ máy phát âm của con người 14
1.9.2 Mô hình kỹ thuật của việc tạo tiếng nói 14
1.9.3 Phân loại âm 15
1.9.4 Thuộc tính âm học của tiếng nói 15
1.10 KẾT LUẬN CHƯƠNG 15
CHƯƠNG 2: ĐÁNH GIÁ CHẤT LƯỢNG TIẾNG NÓI 16
2.1 GIỚI THIỆU CHƯƠNG 16
2.2 PHƯƠNG PHÁP ĐÁNH GIÁ CHỦ QUAN 16
2.2.1 Các phương pháp đánh giá tuyệt đối 17
2.2.2 Các phương pháp đánh giá tương đối 17
2.2.2.1 Đánh giá bằng phương pháp so sánh các mẫu tín hiệu 17
2.2.2.2 Phương pháp đánh giá theo sự suy giảm chất lượng 18
2.3 PHƯƠNG PHÁP ĐÁNH GIÁ KHÁCH QUAN 18
2.3.1 Đo tỷ số tín hiệu trên nhiễu trên từng khung 18
2.3.2 Đánh giá mô phỏng theo cảm nhận nghe của con người 20
2.3.2.1 Phương pháp đo Weighted Spectral Slope 20
2.3.2.2 Phương pháp đo Bark Distortion 21
2.3.2.3 Phương pháp đánh giá cảm nhận chất lượng thoại PESQ 22
2.4 KẾT LUẬN CHƯƠNG 22
CHƯƠNG 3: THUẬT TOÁN WIENER FILTERING 23
3.1 GIỚI THIỆU CHƯƠNG 23
3.2 SƠ ĐỒ KHỐI CỦA WIENER FILTERING 23
3.3 THUẬT TOÁN WIENER FILTERING 23
3.3.1 Giới thiệu chung 23
3.3.2 Nguyên lý cơ bản của Wiener Filtering 23
3.4 OVERLAP VÀ ADDING TRONG QUÁ TRÌNH XỬ LÝ TÍN HIỆU TIẾNG NÓI 25
3.4.1 Phân tích tín hiệu theo từng frame 25
3.4.2 Overlap và Adding 26
3.5 ƯỚC LƯỢNG VÀ CẬP NHẬT NHIỄU 27
3.5.1 Voice activity detection 28
3.5.2 Quá trình ước lượng và cập nhật nhiễu 28
3.6 KẾT LUẬN CHƯƠNG 28
CHƯƠNG 4: MÔ PHỎNG BẰNG PHẦN MỀM MATLAB 30
4.1 GIỚI THIỆU CHƯƠNG 30
4.2 QUY TRÌNH THỰC HIỆN VÀ ĐÁNH GIÁ THUẬT TOÁN 30
4.3 LƯU ĐỒ THUẬT TOÁN WIENER FILTERING 32
4.4 CHƯƠNG TRÌNH MÔ PHỎNG 33
4.5 CHƯƠNG TRÌNH CHẠY MÔ PHỎNG 39
4.6 THỰC HIỆN THUẬT TOÁN VÀ ĐÁNH GIÁ 39
4.6.1 Thực hiện xử lý các file âm thanh bị nhiễu với SNR =5dB 39
4.6.1.1 Nhiễu do tiếng ồn với SNR = 5dB 39
4.6.1.2 Nhiễu do người nói xung quanh với SNR =5dB 40
4.6.1.3 Nhiễu do tiếng xe hơi với SNR =5dB 41
4.6.2 Thực hiện xử lý các file âm thanh bị nhiễu với SNR =15dB 43
4.6.2.1 Nhiễu do người nói xung quanh với SNR =15dB 43
4.6.2.2 Nhiễu do tiếng xe hơi với SNR =15dB 44
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ĐỀ TÀI 47
TÀI LIỆU THAM KHẢO x
PHỤ LỤC xi
NHÂN XÉT CỦA CÁN BỘ HƯỚNG DẪN xii
Hình 1.1 Tín hiệu tiếng nói. 4
Hình 1.2 Dạng và sự phân bố phổ năng lượng trung bình nhiễu trên xe. 6
Hình 1.3 Dạng và sự phân bố phổ năng lượng trung bình của nhiễu trên tàu. 6
Hình 1.4 Dạng và sự phân bố phổ năng lượng trung bình của nhiễu trong nhà hàng. 7
Hình 1.5 Mức nhiễu và tiếng nói (được đo bằng SPL dB) trong các môi trường khác nhau. 8
Hình 1.6 Dạng sóng tín hiệu tiếng nói của câu “The wife helped her husband” và dạng sóng của phụ âm “f” trong từ “wife, dạng sóng của đoạn nguyên âm “er” trong từ “her”. 13
Hình 1.7 Mặt cắt dọc của cơ quan tạo tiếng nói. 14
Hình 1.8 Mô hình kỹ thuật tạo tiếng nói. 14
Hình 1.9 Bảng phân loại âm vị trong tiếng Anh của người Mỹ 15
Hình 3.1 Sơ đồ khối cho hai thuật toán SS và WF 23
Hình 3.2 Sơ đồ khối của thuật toán Wiener Filtering. 25
Hình 3.3 Phân tích tín hiệu thành các frame. 26
Hình 3.4 quá trình thực hiện overlap và adding. 27
Hình 4.1. Sơ đồ thực hiện và đánh giá thuật toán tăng cường 30
Hình 4.2 Lưu đồ thuật toán WF 32
Hình 4.3 dạng sóng của tín hiệu sạch 39
Hình 4.4 Dạng sóng của tín hiệu bị nhiễu với SNR = 5dB 39
Hình 4.5 Dạng sóng của tín hiệu sau khi xử lý nhiễu bằng WF với SNR = 5dB 40
Hình 4.6 dạng sóng của tín hiệu sạch 40
Hình 4.7 Dạng sóng của tín hiệu bị nhiễu do người nói xung quanh với SNR = 5dB .41
Hình 4.8 Dạng sóng của tín hiệu sau khi xử lý nhiễu bằng WF với SNR = 5dB 41
Hình 4.9 dạng sóng của tín hiệu sạch 42
Hình 4.10 Dạng sóng của tín hiệu bị nhiễu do tiếng xe hơi với SNR = 5dB. 42
Hình 4.11 Dạng sóng của tín hiệu sau khi xử lý nhiễu bằng WF với SNR = 5dB. 43
Hình 4.12 dạng sóng của tín hiệu sạch 43
Hình 4.13 Dạng sóng của tín hiệu bị nhiễu do người nói xung quanh với SNR = 15dB.
.......................................................................................................................................44
Hình 4.14 Dạng sóng của tín hiệu sau khi xử lý nhiễu bằng WF với SNR = 15dB. 44
Hình 4.15 dạng sóng của tín hiệu sạch 45
Hình 4.16 Dạng sóng của tín hiệu bị nhiễu do tiếng xe hơi với SNR = 15dB. 45
Hình 4.17 Dạng sóng của tín hiệu sau khi xử lý nhiễu bằng WF với SNR = 15dB. 46
Bảng 2.1.Thang điểm đánh giá chất lượng tiếng nói theo MOS 17
Bảng 2.2. Thang điểm đánh giá chất lượng tín hiệu tiếng nói theo CCR 17
Bảng 2.3. Thang đánh giá DCR 18
TIẾNG ANH
Tiếng Anh | Nghĩa tiếng Việt | |
SNR | Signal Noise Ratio | Tỉ số tín hiệu trên nhiễu |
PC | Personal Computer | Máy tính cá nhân |
SPL | Sound Pressure Level | Mức áp suất của âm thanh |
MMSE | Minium Mean-Squared Error | Tối thiểu hoá sai lệch trung bình bình phương |
SVD | Singular Value Decomposition | Phép phân tích giá trị đơn |
DFT | Discrete Fourier Transform | Phép biến đổi Fourier rời rạc |
FFT | Fast Fourier Transform | Phép biến đổi Fourier nhanh |
DTFT | Discrete-Time Fourier Transform | Phép biến đổi Fourier của tín hiệu rời rạc. |
ZT | Z Transform | Phép biến đổi Z |
ROC | Region of Convergence | Miền hội tụ |
IDTFT | Inverse Discrete Fourier Transform | Phép biến đổi ngược Fourier rời rạc |
LTI | Linear Time-Invariant | Hệ thống tuyến tính và bất biến theo thời gian |
ITU-T | InternationalTelecommunications Union-Telecommunication | Hiệp hội tiêu chuẩn viễn thông quốc tế |
ACR | Absolute Categories Rating | Đánh giá theo giá trị tuyệt đối |
MOS | Mean Opinion Scores | Đánh giá theo quan điểm người nghe |
CCR | Comparison Category Rating | Đánh giá bằng cách so sánh |
DCR | Degradation Category Rating | Đánh giá suy giảm chất lượng |
SE | Subjective Evaluation | Đánh giá chủ quan |
OE | Objective Evaluation | Đánh giá khách quan |
WSS | Weighted Spectral Slope | Đo theo trọng số của phổ |
Có thể bạn quan tâm!
- Áp dụng thuật toán Wiener Filtering nâng cao chất lượng tiếng nói - 2
- Mức Nhiễu Và Tiếng Nói (Được Đo Bằng Spl Db) Trong Các Môi Trường
- Thang Điểm Đánh Giá Chất Lượng Tiếng Nói Theo Mos
Xem toàn bộ 69 trang tài liệu này.
Linear Prediction Coefficients | Hệ số dự đoán tuyến tính | |
VAD | Voice Activity Detection | Thăm dò sự hoạt động của tiếng nói |
SS | Spectral Subtraction | Thuật toán giảm nhiễu tín hiệu tiếng nói bằng phương pháp trừ phổ. |
WF | Wiener Filter | Thuật toán giảm nhiễu tín hiệu tiếng nói bằng cách sử dụng bộ lọc Wiener. |