Các Chỉ Tiêu Đánh Giá Chất Lượng Mô Hình Nhận Dạng Tín Hiệu Điện Tim


Bảng 3.6. Kết quả nhận dạng của Ví dụ 2


ID

Kết quả nhận dạng bằng cây quyết định

25

1

26

1

27

2

28

2

29

3

30

3

Có thể bạn quan tâm!

Xem toàn bộ 98 trang tài liệu này.

3.4. Kết luận chương 3

Phần đầu, tác giả đã trình bày ngắn gọn về cấu trúc của các mạng và phương pháp học của bốn mô hình nhận dạng đơn kinh điển đó là mạng nơ-rôn truyền thẳng nhiều lớp MLP, mạng nơ-rôn logic mờ TSK và máy véc-tơ hỗ trợ SVM và rừng ngẫu nhiên RF.

Phần tiếp theo, tác giả trình bày mô hình nhận dạng đơn sử dụng mạng nơ rôn thông dụng để nhận dạng tín hiệu điện tim như mạng nơ-rôn MLP, TSK, SVM và RF và xây dựng mô hình nhận dạng phối hợp của các mạng nơ rôn trên nhằm tăng độ chính xác cho bài toán nhận dạng.

Chương tiếp theo, sẽ trình bày kết quả tính toán của các phương pháp đề xuất nhận dạng ở chương 3.


Chương 4. KẾT QUẢ TÍNH TOÁN, MÔ PHỎNG


Chương 4 trình bày về phương pháp xây dựng bộ số liệu mẫu từ cơ sở dữ liệu MIT-BIH và MGH/MF; với bộ số liệu mẫu này tác giả sử dụng các mô hình mạng nơ- rôn đơn và các mô hình mạng nơ-rôn phối hợp để nhận dạng tín hiệu điện tim ECG bằng cách mô phỏng trên máy tính, sau đó đánh giá kết quả để làm rò minh chứng cho giải pháp đề xuất của luận văn.

4.1. Xây dựng các bộ số liệu mẫu

4.1.1. Cơ sở dữ liệu MIT-BIH

Trong luận văn sử dụng tín hiệu điện tim mẫu lấy từ bộ cơ sở dữ liệu về chứng loạn nhịp tim nổi tiếng MIT-BIH [15] (có thể tải về được từ www.physionet.org). Đã có nhiều công trình về phân loại tín hiệu điện tim sử dụng bộ cơ sở dữ liệu này để xây dựng và kiểm tra mô hình nhận dạng, như trong các nghiên cứu [5, 20, 25, 26, 27, 28, 29, 32].

Để nhằm mục đích so sánh với các công trình trước đây, luận văn sẽ sử dụng cùng bộ mẫu số liệu như trong các nghiên cứu [5, 28], cụ thể là nhận dạng chứng rối loạn nhịp tim xuất phát từ bộ cơ sở là các đoạn QRS của tín hiệu điện tim từ 19 bệnh nhân (mã số trong cơ sở dữ liệu là 100, 105, 106, 109, 111, 114, 116, 118, 119, 124,

200, 202, 207, 208, 209, 212, 214, 221 và 222). Sử dụng bản ghi ở chuyển đạo I đối với tất cả các bản ghi được lựa chọn. Các bệnh nhân được lựa chọn thường có nhiều hơn một rối loạn nhịp trong các bản ghi của họ, trường hợp xấu nhất là bệnh nhân số 207 có tất cả 7 kiểu rối loạn nhịp tim, chi tiết trình bày ở phần phụ lục.

Trong thử nghiệm chính của luận văn xem xét 7 loại rối loạn nhịp tim: Block nhánh trái (L - Left bundle branch block), block nhánh phải (R - Right bundle branch block), ngoại tâm thu nhĩ (A - Atrial premature beat), ngoại tâm thu thất (V - Ventricular premature beat), rung thất (I - Ventricular flutter wave) và tâm thất lỗi nhịp (E - Ventricular escape beat) và nhịp bình thường (N - Normal sinus rhythm), do các mẫu bệnh không được phân bố đều trong các bản ghi, các bệnh nhân đa phần là nhịp bình thường N, các nhịp bệnh rất ít xuất hiện như nhịp rung thất I, tâm thất lỗi nhịp E. Để xây dựng các bộ số liệu có các mẫu bệnh có thể xuất hiện trong cùng một bệnh nhân (như trường hợp của bệnh nhân 207 xuất hiện cả sáu loại nhịp bệnh, nên trong luận văn sẽ không lấy toàn bộ tất cả các nhịp của tất cả các bản ghi để làm cơ sở dữ liệu, trong các bản ghi của 19 bệnh nhân ở trên lấy ra 6678 mẫu chia thành hai bộ số liệu: 3611 mẫu để phục vụ cho quá trình học (để xây dựng mô hình) và 3068 mẫu sử dụng cho mục đích kiểm tra (kiểm tra độ tin cậy). Số lượng chi tiết mẫu lấy từ bản ghi của 19 bệnh nhân được thống kê chi tiết trong bảng 4.1.


Bảng 4.1. Bảng phân chia số lượng mẫu học và mẫu kiểm tra của 7 loại rối loạn nhịp tim từ CSDL MIT-BIH


Loại nhịp

Tổng số mẫu

Số mẫu học

Số mẫu kiểm tra

N

2000

1065

935

L

1200

639

561

R

1000

515

485

A

902

504

398

V

964

549

451

I

472

271

201

E

105

68

37

Tổng

6643

3611

3068

Bảng 4.2. Bảng phân chia số lượng mẫu học và mẫu kiểm tra của 2 loại nhịp


Loại nhịp

Tổng số mẫu

Số mẫu học

Số mẫu kiểm tra

Bình thường (Normal)

2000

1065

935

Bất thường (Abnormal)

4643

2546

2133

Tổng

6643

3611

3068

Trong bảng 4.1 là số lượng các loại nhịp tim được sử dụng trong quá trình học và kiểm tra của mô hình nhận dạng. Các loại bệnh tim có số lượng giới hạn (ví dụ như nhịp E, I) là do sự giới hạn trong cơ sở dữ liệu MIT-BIH [15]. Số lượng gốc của các nhịp tim bình thường N rất cao, nhưng chúng ta xem những nhịp này như những nhịp đơn giản để phân loại và để tạo ra những kết quả cuối cùng nói chung là độc lập hơn ở số lượng các mẫu trong mỗi nhóm, tác giả giới hạn số lượng các nhịp tim được sử dụng trong các thí nghiệm với một mức hợp lý thông thường vào khoảng 1000 nhịp.

Để tạo được véc-tơ đặc tính và tín hiệu đầu ra tương ứng từ các bản ghi tín hiệu điện tim ECG trong bộ cơ sở dữ liệu MIT-BIH, thì ta thực hiện theo quy trình sau:

- Tách phức bộ QRS: Do trong bộ cơ sở dữ liệu MIT-BIH các tín hiệu ECG đã được đánh dấu vị trí đỉnh R và đã được gán nhãn phân loại bệnh bởi các bác sĩ chuyên ngành nên mỗi mẫu phức bộ QRS, nên trong trường hợp này chưa cần sử dụng thuật toán xác định đỉnh R như đã trình bày trong mục 2.2 mà chỉ cần đọc tuần tự các vị trí đỉnh R của phức bộ QRS trong đường tín hiệu ECG, tách phức bộ QRS bằng cách cắt cửa sổ 250ms xung quanh đỉnh R (125ms trước và 125ms sau vị trí đỉnh R).

1

- Khai triển phức bộ QRS vừa trích ở trên theo các đa thức Hermite theo công thức 4.1 để xác định 16 hệ số khai triển đầu tiên làm đặc tính.

n (x)

2nn!2e

x2

2 Hn (x)


(4.1)


- Xác định khoảng cách R-R từ đỉnh R đang xét tới đỉnh R liền trước để làm đặc tính thứ 17. Giá trị trung bình của 10 đoạn R-R cuối cùng sẽ là đặc tính thứ 18 của phức bộ QRS đang xét.

Như vậy mỗi phức bộ QRS tách ra tương ứng với 18 đặc tính, đầu ra là mã của loại bệnh của nhịp đang xét (đã được đánh dấu trong cơ sở dữ liệu MIT-BIH), ví dụ với 7 loại nhịp khác nhau đầu ra tương ứng sẽ là 7 kênh có giá trị 0 và 1 (6 kênh bằng 0 và kênh có mã tương ứng với loại bệnh sẽ có giá trị 1).

Sau đây là hình ảnh xếp chồng của các mẫu của 6 loại nhịp bệnh với số lượng như trong bảng 4.1. Từ hình 4.1 có thể thấy trở ngại lớn trong việc nhận dạng tín hiệu điện tim là sự biến thiên rất lớn về biên độ lẫn hình dạng của các nhịp tim thuộc cùng một loại bệnh [23]. Hơn nữa, một số loại nhịp thuộc các loại bệnh khác nhau cũng có thể giống nhau về mặt hình thái. Vì thế ta càng thấy rò là bài toán phân loại tín hiệu ECG là bài toán khó.


Ngoại tâm thu nhĩ – A Tâm thất nỗi nhịp – E Block nhánh trái –L Block nhánh 1Ngoại tâm thu nhĩ – A Tâm thất nỗi nhịp – E Block nhánh trái –L Block nhánh 2

Ngoại tâm thu nhĩ – A Tâm thất nỗi nhịp – E


Block nhánh trái –L Block nhánh phải – R Rung thất – I Ngoại tâm thu thất V 3Block nhánh trái –L Block nhánh phải – R Rung thất – I Ngoại tâm thu thất V 4

Block nhánh trái –L Block nhánh phải – R


Rung thất – I Ngoại tâm thu thất V Hình 4 1 Hình dáng mẫu phức bộ QRS của 5Rung thất – I Ngoại tâm thu thất V Hình 4 1 Hình dáng mẫu phức bộ QRS của 6

Rung thất – I Ngoại tâm thu thất - V

Hình 4.1. Hình dáng mẫu phức bộ QRS của các loại nhịp A, E, L, R, I và V

4.1.2. Cơ sở dữ liệu MGH/MF

Ngoài ra, luận văn cũng sử dụng bộ cơ sở dữ liệu thứ hai là MGH/MF [35, 36], bộ CSDL này gồm có 250 bản ghi của tín hiệu ECG, thu thập từ 250 bệnh nhân tim mạch tại các phòng chăm sóc đặc biệt, phòng mổ, phòng thí nghiệm thông tim,... Tại Bệnh viện Đa khoa Massachusetts. Luận văn lựa chọn sử dụng các mẫu tín hiệu ECG của 20 bản ghi có mã số là: 029, 030, 058, 105, 106, 107, 108, 110, 111, 114, 117,

119, 121, 123, 124, 125, 128, 131, 137, 142, lấy ra tổng 4500 mẫu với 3 loại nhịp: Bình thường (N -Normal sinus rhythm), nhịp ngoại tâm thu thất (V-Premature ventricular contraction) và loạn nhịp trên thất (S-Supraventricular premature beat) số lượng chi tiết số mẫu sử dụng được thống kê chi tiết trong bảng 4.3 và bảng 4.4 dưới đây:

Bảng 4.3. Bảng phân chia số lượng mẫu học và mẫu kiểm tra của 3 loại nhịp


Loại nhịp

Tổng số mẫu

Số mẫu học

Số mẫu kiểm tra

N

3000

1997

1003

S

750

502

248

V

750

501

249

Tổng

4500

3000

1500

Bảng 4.4. Bảng phân chia số lượng mẫu học và mẫu kiểm tra của 2 loại nhịp


Loại nhịp

Tổng số mẫu

Số mẫu học

Số mẫu kiểm tra

Bình thường

(normal)

3000

1997

1003

Bất thường

(abnormal)

1500

1003

497

Tổng

4500

3000

1500


Ngoại tâm thất thu – V Loạn nhịp thất trên – S Bình thường – N Hình 4 2 7

Ngoại tâm thất thu – V Loạn nhịp thất trên – S Bình thường – N

Hình 4.2. Hình dáng mẫu phức bộ QRS của các loại nhịp V, S, N

Để tạo được véc-tơ đặc tính và tín hiệu đầu ra tương ứng từ các bản ghi tín hiệu điện tim ECG trong bộ cơ sở dữ liệu MGH/MF, thì ta thực hiện tương tự như đối với bộ cơ sở dữ liệu MIT-BIH.

4.2. Các chỉ tiêu đánh giá chất lượng mô hình nhận dạng tín hiệu điện tim

Các mô hình nhận dạng (các mô hình đơn và cả mô hình kết hợp) được đánh giá thông qua các chỉ tiêu sau:

- Số mẫu nhận dạng sai;

- FN (False Negative): Số trường hợp chẩn đoán âm tính sai, tức là trường hợp bệnh nhân có bệnh nhưng chẩn đoán nhầm là bình thường;

- TN (True Negative): Số trường hợp chẩn đoán âm tính đúng;

- FP (False Positive): Số trường hợp chẩn đoán dương tính sai, tức là trường hợp người bệnh bình thường nhưng chẩn đoán có bệnh;

- TP (True Positive): Số trường hợp chẩn đoán dương tính đúng;

- Sensitivity (True Positive Rate): Tỷ lệ chẩn đoán dương tính đúng,


Sensitivity

TP TP FN


.100%


(4.2)

- Specificity (True Negative Rate): Tỷ lệ chẩn đoán âm tính đúng


Specificity

TN TN FP


.100%

(4.3)

Mô hình nhận dạng có chất lượng và độ tin cậy cao khi:

- Số mẫu nhận dạng sai, số chẩn đoán dương tính sai FP, số chẩn đoán âm tính sai FN thấp;

- Tỷ lệ chẩn đoán dương tính đúng Sensitivity, tỷ lệ chẩn đoán âm tính đúng

Specificity càng cao;

Yêu cầu thực tế về chất lượng của các mô hình nhận dạng tín hiệu điện tim ECG là rất cao, trong các chỉ tiêu để đánh giá chất lượng mô hình đã liệt kê ở trên thì lưu ý đến thông số FN (số chẩn đoán âm tính sai) trong thực tế nếu FN cao sẽ gây


nguy hiểm cho người vì mô hình nhận dạng sẽ không phát hiện được bệnh trong thực tế là có bệnh, do đó nếu mô hình nhận dạng có FN càng giảm thì chất lượng mô hình được đánh giá càng tăng.

4.3. Kết quả mô hình nhận dạng đơn

4.3.1. Trên bộ cơ sở dữ liệu MIT-BIH

a) Thử nghiệm trên bộ dữ liệu trong bảng 4.1

Nhận dạng 7 loại nhịp, các mô hình nhận dạng cơ sở MLP, SVM, TSK và RF

được huấn luyện độc lập trên cùng một bộ dữ liệu học, có kết quả như sau:

- Mạng MLP

Cấu trúc như trong [6], 18 nơ-rôn đầu vào (tương ứng với 18 giá trị của véc-tơ đặc tính), 20 nơ-rôn ẩn, có 7 nơ-rôn đầu ra (tương ứng với 7 loại rối loạn nhịp tim),

- Mạng TSK

Cấu trúc lựa chọn như trong [5, 6], có 21 luật suy luận, 7 kết quả đầu ra;

- Máy hỗ trợ véc-tơ SVM

Cấu trúc lựa chọn như [31], mô hình SVM phân loại 7 lớp, dùng phương pháp

OVO nên có 21 bộ SVM nhị phân thành phần;

- Rừng ngẫu nhiên RF

Áp dụng theo phương pháp của L. Breiman (2001) [19], rừng ngẫu nhiên RF có 100 cây quyết định thành phần.

Kết quả thử nghiệm của các mô hình nhận dạng cơ sở trên cùng bộ dữ liệu kiểm tra trong bảng 4.1, kết quả trình bày ở dạng ma trận như trong các bảng từ 4.5 đến 4.9: Trong đó cột là các kết quả chuẩn (được đánh dấu trước), hàng là kết quả nhận dạng, đường chéo chính của ma trận là số mẫu nhận dạng đúng, các giá trị ngoài đường chéo chính là các mẫu nhận dạng sai, kết quả cụ thể như sau:

Bảng 4.5. Ma trận phân bố kết quả nhận dạng 7 loại mẫu nhịp bằng mạng MLP


Mẫu

Kết quả

N

L

R

A

V

I

E

N

905

5

4

5

4

0

0

L

5

536

0

0

2

0

1

R

3

0

476

5

1

0

1

A

17

6

2

382

6

4

0

V

3

9

1

5

429

2

0

I

2

3

2

0

7

195

0

E

0

2

0

1

2

0

35

Tổng sai số

30

25

9

16

22

6

2


Bảng 4.6. Ma trận phân bố kết quả nhận dạng 7 loại mẫu nhịp bằng mạng TSK


Mẫu

Kết quả

N

L

R

A

V

I

E

N

920

8

2

9

4

0

0

L

0

518

0

1

3

0

0

R

4

0

481

12

1

0

0

A

9

19

0

375

2

2

0

V

2

14

1

1

439

0

0

I

0

0

1

0

3

199

0

E

0

2

0

0

0

0

37

Tổng sai số

15

43

4

23

13

2

0

Bảng 4.7. Ma trận phân bố kết quả nhận dạng 7 loại mẫu nhịp bằng mạng SVM


Mẫu

Kết quả

N

L

R

A

V

I

E

N

919

7

1

7

0

0

0

L

2

546

1

1

3

3

1

R

1

0

479

4

0

0

0

A

11

2

2

385

0

0

0

V

2

5

1

1

448

1

0

I

0

1

1

0

0

197

0

E

0

0

0

0

0

0

36

Tổng sai số

16

15

6

13

3

4

1

Bảng 4.8. Ma trận phân bố kết quả nhận dạng 7 loại mẫu nhịp bằng RF


Mẫu Kết quả

N

L

R

A

V

I

E

N

914

6

3

11

0

0

0

L

1

547

0

0

4

0

1

R

1

0

478

4

0

0

0

A

18

4

1

382

3

0

0

V

1

3

1

1

443

3

0

I

0

1

2

0

1

198

0

E

0

0

0

0

0

0

36

Xem toàn bộ nội dung bài viết ᛨ

..... Xem trang tiếp theo?
⇦ Trang trước - Trang tiếp theo ⇨

Ngày đăng: 23/06/2022