Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói - 7

%spectral distance.

%Saeed Vaseghi

%edited by Esfandiar Zavarehei

%Sep-04

if nargin<4 NoiseMargin=2;

end

if nargin<5 Hangover=8;

end

if nargin<3 NoiseCounter=0;

end

Có thể bạn quan tâm!

Xem toàn bộ 58 trang tài liệu này.

FreqResol=length(signal);

SpectralDist= 20*(log10(signal)-log10(noise)); SpectralDist(find(SpectralDist<0))=0; Dist=mean(SpectralDist);

Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói - 7

if (Dist < NoiseMargin) NoiseFlag=1; NoiseCounter=NoiseCounter+1;

else

NoiseFlag=0;

NoiseCounter=0;

end

% Detect noise only periods and attenuate the signal if (NoiseCounter > Hangover)

SpeechFlag=0; else

SpeechFlag=1; end

function Seg=segment(signal,W,SP,Window)

% SEGMENT chops a signal to overlapping windowed segments

% A= SEGMENT(X,W,SP,WIN) returns a matrix which its columns are segmented

% and windowed frames of the input one dimentional signal, X. W is the

% number of samples per window, default value W=256. SP is the shift

% percentage, default value SP=0.4. WIN is the window that is multiplied by

% each segment and its length should be W. the default window is hamming

% window.

% 06-Sep-04

% Esfandiar Zavarehei if nargin<3

SP=.4;

end

if nargin<2 W=256;

end

if nargin<4 Window=hamming(W);

end

Window=Window(:); %make it a column vector L=length(signal);

SP=fix(W.*SP);

N=fix((L-W)/SP +1); %number of segments Index=(repmat(1:W,N,1)+repmat((0:(N-1))'*SP,1,W))'; hw=repmat(Window,1,N);

Seg=signal(Index).*hw;

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ĐỀ TÀI

Chất lượng của tiếng nói bị suy giảm do sự tác động của nhiễu trong môi trường xung quanh là một vấn đề quan trọng cần phải được giải quyết. Việc tìm ra các phương pháp để triệt nhiễu và giảm nhiễu trong tiếng nói luôn luôn đề tài được quan tâm rất nhiều. Trong các dịch vụ truyền thông với phương tiện ngôn ngữ là tiếng nói thì việc tăng cường, cải thiện chất lượng tiếng nói đã bị nhiễu là rất thiết, giúp cho người nghe có thể nghe rõ và đúng những gì người nói đã nói.

Đồ án đã thực hiện được các vấn đề :

- Tìm hiểu và nghiên cứu các phương pháp cải thiện chất lượng tiếng nói, nhưng tập trung vào thuật toán đã có trong Speech enhancement là Spectral Subtraction.

- Xây dựng được chương trình thực hiện xử lý nhiễu trong các file âm thanh đã bị nhiễu dựa trên thuật toán : Spectral Subtraction.

- Thực hiện và đánh giá tính hiệu quả của thuật toán trong các môi trường nhiễu và mức độ nhiễu khác nhau, từ đó đưa ra các biện pháp tối ưu hóa các thuật toán. Thuật toán giảm nhiễu có hiệu quả khác nhau đối với từng môi trường nhiễu khác nhau.

Tuy nhiên đồ án vẫn chưa giải quyết hết được các vấn đề trong Speech enhancement nên hướng phát triển của đề tài trong tương lai sẽ là :

- Tìm hiểu, nghiên cứu và xây dựng các chương trình thực hiện xử lý nhiễu trong tiếng nói dựa trên các thuật toán khác trong Speech enhancement.

- Nghiên cứu và đưa ra thuật toán mới về xử lý nhiễu và triệt nhiễu trong Speech enhancement.

Hiện nay, thuật toán được thực hiện đối với các dịch vụ ứng dụng thời gian thực và các dịch vụ trong lĩnh vực truyền thông đa phương tiện như : thoại, âm nhạc, truyền hình hội nghị…. Tạo nền tảng cho các thuật toán Speech enhancement trong tương lai.

TÀI LIỆU THAM KHẢO

[1]. Ramabadran, T.,Ashley, J., and McLaughin, M.(1997), Background noise suppression for speech enhancement and coding, Proc. IEEE Workshop Speech Coding Telecommun.

[2]. Ths.Hoàng Lê Uyên Thục, Giáo trình xử lý tín hiệu số, Đại học Bách Khoa – Đại học Đà Nẵng.

[3].Hu, Y. and Loizou, P(2006), Subjective comparison of speech enhancement algorithms, Proc. IEEE Int.Conf. Acoust. Speech Signal Process, I.

[4]. http://www.utdallas.edu/~loizou/speech/noizeus/.

[5 http://luanvan.net.vn/luan-van/

[6]. http://en.wikipedia.org/wiki/Code_Excited_Linear_Prediction.

[7]. Nguyễn Quốc Trung, Xử lý tín hiệu số - tập 1, NXB Khoa học kĩ thuật.

[8]. Lim, J. and Oppenheim, A.V.(1979), Enhancement and bandwidth compression of noisy speech, Proc. IEEE, 67(12),pp. 1586-1604.

[9]. Weiss, M., Aschkenasy, E., and Parsons, T.(1974), Study and the development of the INTEL technique for improving speech intelligibility, Technical Report NSC-FR/ 4023.


kèm.

PHỤ LỤC

Toàn bộ mã nguồn của chương trình thực hiện được lưu trữ trên đĩa CD đính

NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN

-------------------------------------------------------------------------------------

-------------------------------------------------------------------------------------

-------------------------------------------------------------------------------------

-------------------------------------------------------------------------------------

-------------------------------------------------------------------------------------

-------------------------------------------------------------------------------------

-------------------------------------------------------------------------------------

-------------------------------------------------------------------------------------

-------------------------------------------------------------------------------------

-------------------------------------------------------------------------------------

-------------------------------------------------------------------------------------

-------------------------------------------------------------------------------------

-------------------------------------------------------------------------------------


Đà Nẵng, ngày…tháng….năm 2013

Cán bộ hướng dẫn

Xem toàn bộ nội dung bài viết ᛨ

..... Xem trang tiếp theo?
⇦ Trang trước - Trang tiếp theo ⇨

Ngày đăng: 23/05/2023