Mạng Tương Tác Y Học Dưới Góc Nhìn Toàn Cảnh Của Tập Dữ Liệu Gốc

Y khoa thu được 438 từ khoá. Các từ khoá này được phân thành 3 nhóm: cơ quan, triệu chứng và bệnh. Danh sách từ khoá được đề cập tại Bảng 3.4. (chi tiết tại Phụ lục 2).

Bảng 3.4. Danh sách các từ khóa


Nhóm

Từ khóa

Cơ quan

abdomen, airway, ankl, aorta, arteri, arteriol, axon, bladder, blood,

bone, bowel, brain,brainstem, breast, breech, bronchiol, bulbar, …

Triệu chứng

abscess, acidosis, addict, alkalosi, amnesia, anorexia, anxieti,

apnea, ataxia, atrophi, bacteraemia, bleed, blister, …

Bệnh

adenocarcinoma, adenoma, allergi, alzheim, amyloidosi, anaemia,

anderson, aneurysm, anthrax, aphasia, arrhythmia, …

Có thể bạn quan tâm!

Xem toàn bộ 73 trang tài liệu này.


3.2.3. Ma trận tương tác‌

Mỗi tập con trong 50 tập con chúng tôi tiến hành tính toán ma trận tương tác riêng rẽ. Kết quả tạo ra 50 ma trận tương tác, mỗi ma trận có kích thước 438x438, tương đương với 191,406 kết nối. Kiểm định giả thuyết thống kê t-test được áp dụng cho mỗi kết nối trên 50 ma trận để loại bỏ những kết nối ý nghĩa thấp. Kết quả số kết nối có ý nghĩa giảm từ 191,406 xuống còn 1,950 (1%). Ở dạng số hoá, số lượng kết nối này chính là mạng tương tác. Trong việc dựng hình minh hoạ, để thuận tiện 1000 kết nối có giá trị lớn nhất được lựa chọn.

Tuy nhiên, đối với các tập dữ liệu Tim mạch, Nội tiết, Thần kinh thuộc các ngành hẹp hơn, khi đó lượng dữ liệu sẽ ít hơn so với tập dữ liệu gốc tương ứng số lượng các thực thể và kết nối cũng ít hơn.

3.3. Mạng tương tác và kiểm định định tính‌


Trên tập dữ liệu toàn thể, mạng tương tác của tất cả các thực thể với 1000 kết nối mạnh nhất được thể hiện ở Hình 3. 1.. Các thực thể quan trọng (được hiểu là có sự ảnh hưởng to lớn đến nhiều yếu tố khác) có kích thước biểu diễn lớn, ví dụ như: máu (Blood), nhiễm khuẩn (Infect), tim (Heart), đau (Pain),… Sự mạnh yếu của tương tác đang phản ánh góc nhìn tập dữ liệu từ cách thức xây dựng phương pháp.

Để kiểm chứng khả năng hợp lý của mạng, thuật toán cũng tự động chia các từ khoá thành các nhóm dựa vào sự ảnh hưởng qua lại lẫn nhau của các thực thể. Trên hình vẽ các thực thể cùng nhóm thể hiện qua cùng màu sắc và chúng có xu hướng tập

trung đứng gần với nhau. Sự hợp lý của mạng tương tác thông qua việc khi phân tích một cặp tương tác bất kỳ luôn có thể giải thích hợp lý bằng tri thức Y học.

Với 4 trường hợp: Tập dữ liệu gốc, Tim mạch, Nội tiết, Thần kinh và 3 loại mạng: tất cả các từ khóa tương tác với nhau, Triệu chứng- Cơ quan, Bệnh- Triệu chúng ta biểu diễn được 12 mạng tương tác.

3.3.1. Mạng tương tác tổng thể‌


Hình 3 1 Mạng tương tác Y học dưới góc nhìn toàn cảnh của tập dữ liệu gốc 1


Hình 3. 1. Mạng tương tác Y học dưới góc nhìn toàn cảnh của tập dữ liệu gốc

Mạng tương tác của tập dữ liệu gốc có 234 thực thể và 1000 kết nối. Chúng được chia làm 4 nhóm tương ứng với 4 màu sắc khác nhau và các nhóm phân bố đều trên hình. Các thực thể như máu (Blood), nhiễm khuẩn (Infect), đau (Pain), xương (Bone) thuộc 4 nhóm có kích thước lớn nhất (giá trị tương tác lớn nhất) thể hiện sự quan trọng của nó đối với các thực thể xung quanh.

Để kiểm chứng định tính hiệu quả của mạng tương tác, những từ khoá được trích xuất từ mạng của tập dữ liệu gốc (Hình 3. 1.). Dựa vào Bảng 3.5. (chọn ngẫu nhiên 10 thực thể) triệu chứng tăng huyết áp (Hypertension) có thể liên quan tới tim (Heart), phổi (Lung), gan (Liver), … trong đó sự liên quan tới tim có trọng số là lớn nhất, phù hợp với kiến thức lâm sàng. Tương tự viêm phổi (Pneumonia) liên quan tới phổi có trọng số lớn nhất, …Vấn đề này rất có tiềm năng ứng dụng khi phân tích các bất thường ở lâm sàng.

Bảng 3.5. Bảng thống kê giá trị tương tác giữa các thực thể của tập dữ liệu gốc


All

Heart

Lung

Liver

Brain

Cancer

Hypertension

13.38

3.50

3.56

2.02

2.40

Pneumonia

1.50

3.86

1.14

0.45

1.03

Cirrhosis

1.18

0.31

9.44

0.16

0.93

Dementia

2.46

0.30

0.39

11.33

2.28

Carcinoma

0.61

3.85

4.05

0.66

14.51

Hình 3 2 Mạng tương tác Y học dưới góc nhìn toàn cảnh của tập dữ liệu Tim 2

Hình 3. 2. Mạng tương tác Y học dưới góc nhìn toàn cảnh của tập dữ liệu Tim mạch

Mạng tương tác của tập dữ liệu Tim mạch có 203 thực thể và 1000 kết nối. Khác với tập dữ liệu gốc, tập dữ liệu Tim mạch chỉ chia làm 3 nhóm. Máu (Blood), tim (Heart), mạch (Vascular) thuộc 3 nhóm có kích thước lớn nhất.

Dựa vào Bảng 3.6., đối với tập dữ liệu Tim mạch, tăng huyết áp (Hypertension)- tim (Heart), viêm phổi (Pneumonia)- phổi (Lung), bệnh gan mãn tính (Cirrhosis)- gan (Liver), sa sút trí tuệ (Dementia)- não (Brain), ung thư biểu mô (Carcinoma)- phổi là những cặp liên quan có trọng số lớn nhất.

Bảng 3.6. Bảng thống kê giá trị tương tác giữa các thực thể của tập dữ liệu Tim mạch


CARDIOLOGY

Heart

Lung

Liver

Brain

Cancer

Hypertension

53.37

10.58

5.84

6.19

1.32

Pneumonia

3.67

5.22

1.31

0.98

0.32

Cirrhosis

3.98

0.30

8.30

0.18

0.16

Dementia

1.05

0.01

0.65

3.77

0.14

Carcinoma

1.07

2.91

0.73

0.45

1.28


Trong tập dữ liệu này, các cặp liên quan có trọng số lớn nhất gần tương tự như tập dữ liệu gốc, tuy nhiên ung thư biểu mô liên qaun tới phổi là lớn nhất so với tập dữ liệu gốc là ung thư. Nguyên nhân là do tim mạch thì không bao giờ có thể bị ung thư nên ung thư biểu mô liên quan ít đến ung thư. Và đối với các thực thể tim, phổi, gan, não thì ung thư biêu mô liên quan tới phổi là phù hợp.

Hình 3 3 Mạng tương tác Y học dưới góc nhìn toàn cảnh của tập dữ liệu Nội 3

Hình 3. 3. Mạng tương tác Y học dưới góc nhìn toàn cảnh của tập dữ liệu Nội tiết

Mạng tương tác của tập dữ liệu Nội tiết có 234 thực thể và 1000 kết nối. Chúng chia làm 4 nhóm. Máu (Blood), nhiễm khuẩn (Infect), đau (Pain), yếu (Impair) thuộc 4 nhóm có kích thước lớn nhất.

Dựa vào Bảng 3.7., đối với tập dữ liệu Nội tiết, tăng huyết áp (Hypertension)- tim (Heart), viêm phổi (Pneumonia)- phổi (Lung), bệnh gan mãn tính (Cirrhosis)- gan (Liver), sa sút trí tuệ (Dementia)- tim, ung thư biểu mô (Carcinoma)- ung thư (Cancer) là những cặp liên quan có trọng số lớn nhất.

Bảng 3.7. Bảng thống kê giá trị tương tác giữa các thực thể của tập dữ liệu Nội tiết


ENDOCRINE

Heart

Lung

Liver

Brain

Cancer

Hypertension

21.71

2.04

13.54

5.95

7.27

Pneumonia

0.47

1.66

0.62

0.62

0.32

Cirrhosis

8.82

0.61

49.2

1.27

5.55

Dementia

1.3

0.27

0.34

0.02

0.11

Carcinoma

3.03

4.88

15.4

1.82

33.06


Trong tập dữ liệu này, các cặp liên quan có trọng số lớn nhất gần tương tự như tập dữ liệu gốc, tuy nhiên sa sút trí tuệ liên quan đến tim là nhiều nhất so với tập dữ liệu gốc là não. Do trong tập dữ liệu này, cơ chế của sa sút trí tuệ thiên về thể dịch nhiều hơn là thần kinh nên ta có sự liên quan này.

Xem tất cả 73 trang.

Ngày đăng: 09/09/2024