người bệnh, nhiễu do nguồn điện, do môi trường, do sai số trong tính toán, nhiễu từ các thiết bị điện tử trong quá trình thu nhận dữ liệu.
Trong bài báo, nhóm tác giả đã đưa ra phương pháp sử dụng FastICA để tách hỗn hợp cũng như loại bỏ nhiễu trong tín hiệu điện tâm đồ. Và đã đề xuất phương pháp Newton’s cải tiến để giảm số vòng lặp, tiết kiệm thời gian và tài nguyên tính toán. Với các ưu điểm của FastICA việc tách và loại bỏ nhiễu AC, nhiễu cơ đạt được kết quả tốt ngay cả khi tỷ số Tín hiệu/Tạp âm (SNR) rất thấp. Ở hai trường hợp mô phỏng tác giả đã được đưa ra để minh họa cho tính hiệu quả của phương pháp đề xuất.
1.4. Định hướng nghiên cứu của đề tài
Ngày nay, nhu cầu kiểm tra sức khỏe định kỳ của mỗi người ngày càng được nâng cao. Với sự phát triển của khoa học công nghệ cùng với những phát minh mới trong lĩnh vực điện tử đã tạo động lực giúp con người sáng tạo ra được những sản phẩm thông minh phục vụ cho lợi ích của con người một cách thuận tiện hơn. Từ những phân tích ở mục 1.2 và 1.3 cho ta thấy những tiến bộ và sự phát triển mạnh mẽ của đo lường, điều khiển đã cho phép tạo ra những thiết bị đo tín hiệu điện tim theo nhiều phương pháp khác nhau. Theo đó, việc xây dựng mô hình phối hợp các mạng Nơ-rôn nhận dạng tín hiệu điện tim (ECG) sẽ là tiền đề để nền y học nói chung và ngành chế tạo thiết bị y tế của Việt Nam đạt được những thành tựu mới.
Nội dung nghiên cứu chính của đề tài:
- Tổng quan về các phương pháp nhận dạng tín hiệu điện tim;
- Giới thiệu chung về mạng Nơ – rôn;
- Xây dựng mô hình phối hợp các mạng nơ-rôn nhận dạng tín hiệu điện tim;
- Tính toán, mô phỏng kết quả;
Có thể bạn quan tâm!
- Xây dựng mô hình phối hợp các mạng Nơ-rôn nhận dạng tín hiệu điện tim (ECG) - 1
- Xây dựng mô hình phối hợp các mạng Nơ-rôn nhận dạng tín hiệu điện tim (ECG) - 2
- Tổng Quan Về Các Phương Pháp Nhận Dạng Tín Hiệu Điện Tim
- Một Số Mạng Nơ-Rôn Được Đề Xuất Để Ứng Dụng Nhận Dạng Tín Hiệu Điện Tim
- Thuật Toán Học Theo Bước Giảm Cực Đại Cho Mạng Mlp
- Xây Dựng Mô Hình Phối Hợp Các Mạng Nơ-Rôn Nhận Dạng Tín Hiệu Điện Tim
Xem toàn bộ 98 trang tài liệu này.
1.5. Kết luận chương 1
Chương 1, đã trình bày ngắn gọn về tín hiệu điện tim, tổng quan về một số nghiên cứu liên quan đến nhận dạng tín hiệu điện tim (ECG) trong trong nước và quốc tế từ đó đề xuất định hướng nghiên cứu của đề tài.
Phần đầu chương trình bày khái quát về tín hiệu điện tim và các phương pháp, kỹ thuật nhận dạng tín hiệu điện tim được sử dụng hiện nay. Trong phần tiếp theo tổng quan về các công trình nghiên cứu trong và ngoài nước ứng dụng mạng Nơ-rôn để nhận dạng tính hiệu ECG.
Cuối chương đề xuất định hướng nghiên cứu của luận văn với mục tiêu xây dựng giải pháp nhận dạng mới đạt được độ chính xác, tiện dụng và hiệu quả hỗ trợ tốt nhất cho việc đo và nhận dạng các tín hiệu nhịp tim.
Chương 2, tiếp theo của luận văn sẽ trình bày tổng quan về mạng Nơ-rôn nhân
tạo. Ứng dụng mạng Nơ-rôn cho bài toán nhận dạng tín hiệu.
Chương 2. GIỚI THIỆU CHUNG VỀ MẠNG NƠ-RÔN
2.1. Trí tuệ nhân tạo
J. McCarthy là người đầu tiên đưa cụm từ “Trí tuệ nhân tạo” trở thành một khái niệm khoa học. McCarthy và cộng sự cho rằng nghiên cứu trí tuệ nhân tạo nhằm mô tả chính xác các khía cạnh của xử lý trí tuệ và học (để có được tri thức) và tạo ra được các hệ thống, máy mô phỏng hoạt động học và xử lý trí tuệ.
Trí tuệ nhân tạo (TTNT), tiếng Anh là artificial intelligence hay chữ viết tắt được dùng phổ biến là AI, còn có thể hiểu bình dân hơn là ‘thông minh nhân tạo’, tức là sự thông minh của máy móc do con người tạo ra, đặc biệt tạo ra cho máy tính, robot, hay các máy móc có các thành phần tính toán điện tử. Trí tuệ nhân tạo là một lĩnh vực của khoa học và công nghệ nhằm làm cho máy có những khả năng của trí tuệ và trí thông minh của con người, tiêu biểu như biết suy nghĩ và lập luận để giải quyết vấn đề, biết giao tiếp do hiểu ngôn ngữ và tiếng nói, biết học và tự thích nghi, …
Ở giai đoạn đầu, TTNT hướng tới xây dựng các hệ thống, máy có khả năng sử dụng ngôn ngữ tự nhiên, trừu tượng hóa - hình thức hóa các khái niệm và giải quyết vấn đề dựa trên tiếp cận lôgic, ra quyết định trong điều kiện thiếu thông tin. TTNT là lĩnh vực liên ngành của Triết học, Tâm lý học, Khoa học thần kinh, Toán học, Điều khiển học, Khoa học máy tính, Ngôn ngữ học, Kinh tế
Tiếp cận thực tế TTNT là lĩnh vực nghiên cứu triển khai, hướng tới phát triển máy tính (nói riêng) và máy (nói chung) với năng lực trí tuệ có thể chứng minh (cảm nhận, đối sánh; đo đếm, đánh giá) được.
Một số năng lực trí tuệ điển hình là: Học từ kinh nghiệm (trích rút tri thức từ kinh nghiệm) và áp dụng tri thức; Xác định và trích chọn các đặc trưng quan trọng của các đối tượng, sự kiện, quá trình; Xử lý tình huống phức tạp; Phản ứng nhanh chóng và chính xác đối với tình huống mới; Nhận dạng và hiểu được ngữ nghĩa hình ảnh; Xử lý và thao tác ký hiệu; Sáng tạo và có trí tưởng tượng; Sử dụng heuristic (mẹo). Việc chứng minh khả năng trí tuệ của máy hoặc do con người kiểm định (kiểm thử Turing) hoặc đánh giá khách quan (sử dụng các công cụ thống kê, lô gic vị từ và mệnh đề).
Hình 2.1. Các quá trình phát triển của trí tuệ nhân tạo [37].
* Các khu vực chính mà TTNT ảnh hưởng
Nhìn vào hình 2.2 có thể thấy những chỉ dẫn các khu vực chính của TTNT là hệ chuyên gia, người máy, hệ thống thị giác máy, hệ thống xử lý ngôn ngữ tự nhiên, hệ thống học và mạng nơ-rôn.
Hệ chuyên gia: Xử lý các tình huống tư vấn (xác định vấn đề tư vấn, thu thập thông tin dữ liệu, suy diễn giải quyết vấn đề, lựa chọn giải pháp phù hợp), tương tự như chuyên gia con người trong miền ứng dụng cụ thể.
Hình 2.2. Ảnh hưởng của TTNT tới các lĩnh vực[37]
Người máy: TTNT có thể tự thực hiện được các hành vi có trí tuệ giống con người, nhờ được trang bị các hệ thống phần mềm, thiết bị TTNT. Để hạn chế ở mức cao nhất các rủi ro trong khai thác và sử dụng người máy TTNT, ba luật hoạt động của người máy cần được tuân thủ: Người máy không có hành động gây hại cho con người và cần hành động phù hợp khi con người bị hại; Người máy tuân lệnh con người, ngoại trừ lệnh gây hại cho con người (để không xung đột với luật hoạt động thứ nhất); Người máy biết cách tự bảo vệ mình ngoại trừ trường hợp bị xung đột với luật hoạt động thứ nhất và luật hoạt động thứ hai. Cần phân biệt người máy TTNT với người máy công nghiệp làm các công việc buồn tẻ, độc hại và nguy hiểm.
Hệ thống thị giác: Máy có khả năng nhận dạng được từ hình ảnh; các đối tượng, sự kiện, quá trình trong môi trường thế giới thực xung quanh và xác lập vị trí của các đối tượng này. Hệ thống thị giác máy có các chức năng: nhận biết đối tượng; định vị đối tượng trong không gian; bám, điều hướng, theo dòi đối tượng chuyển động; và đoán nhận hành vi của đối tượng.
Hình 2.3. Mô hình xử lý ngôn ngữ điển hình của TTNT [37]
Hệ thống xử lý ngôn ngữ tự nhiên (Natural language processing, computational linguistics, human language technology, computer speech and language processing): Màm cho máy tính có khả năng hiểu và phản ứng khi tiếp nhận câu nói và chỉ thị được biểu thị bằng ngôn ngữ tự nhiên như tiếng Việt, tiếng Anh... Xử lý ngôn ngữ tự nhiên là khu vực nghiên cứu TTNT đã có quá trình phát triển lâu dài bảy thập kỷ, thu hút cộng đồng nghiên cứu đông đảo trên thế giới và cả ở Việt Nam. Xử lý ngôn ngữ tự nhiên gồm xử lý văn bản, xử lý tiếng nói và xử lý tiếng nói – văn bản.
Tri thức của con người nhận được từ ba nguồn: (i) tiếp thụ sinh học: tiếp thụ thông qua quá trình tiến hóa sinh tồn của loài người được di truyền qua các thế hệ; (ii) tiếp thu văn hóa: tiếp thu thông qua ngôn ngữ được cha mẹ, gia đình và giáo viên dùng để truyền tri thức cho thế hệ sau; (iii) tự học suốt đời: tích lũy của cá nhân các tri thức và kỹ năng. Tự học suốt đời giúp con người tự nâng cấp năng lực học để học càng nhanh hơn và hiệu quả hơn. Học máy trong TTNT hướng tới máy tính có năng lực “học” (thu nhận tri thức) tương tự như con người, nhờ có tri thức mà cải thiện cách thức hoạt động, đáp ứng khi nhận được thông tin phản hồi từ môi trường bên ngoài trong các tình huống. Học máy thống kê, đặc biệt là học sâu (deep learning), cùng với dữ liệu lớn, hiện đang là một xu hướng chủ chốt, tạo ra sự phát triển kỳ diệu của TTNT trong hơn một thập kỷ vừa qua. Học chuyển đổi (transfer learning), học chuyển
đổi sâu (deep transfer learning), học máy suốt đời (lifelong machine learning) là các kỹ thuật học máy hiện đại, cho phép giải quyết vấn đề trong tình huống thiếu thông tin quan trọng hoặc xử lý tình huống mới.
Mạng nơ-rôn: là khu vực TTNT cho phép hệ thống máy tính mô phỏng hoạt động giống như bộ não con người trong việc học mẫu dữ liệu và đoán nhận phân lớp đầu vào. Hệ thống mạng nơ-rôn thường sử dụng kiến trúc song song các bộ vi xử lý mảng dựa trên một cấu trúc mạng giống như bộ não con người.
2.2. Nơ-rôn sinh học
Não người là tổ chức vật chất cấp cao, có cấu tạo vô cùng phức tạp, dày đặc các mối liên kết giữa các nơ-rôn nhưng xử lý thông tin rất linh hoạt trong môi trường bất định.
Qua quá trình nghiên cứu về bộ não, người ta thấy rằng: bộ não con người bao gồm khoảng 1011 nơ-rôn tham gia vào khoảng 1015 kết nối trên 6 các đường truyền. Mỗi đường truyền này dài khoảng hơn một mét. Các nơ-rôn có nhiều đặc điểm chung với các tế bào khác trong cơ thể, ngoài ra chúng còn có những khả năng mà các tế bào khác không có được, đó là khả năng nhận, xử lý và truyền các tín hiệu điện hóa trên các đường mòn nơ-rôn, các con đường này tạo nên hệ thống giao tiếp của bộ não.
Trong bộ não người có khoảng 1011 - 1012 tế bào thần kinh được gọi là các nơ- rôn và mỗi nơ-rôn có thể liên kết với 104 nơ-rôn khác thông qua các khớp nối thần kinh (synapse). Dưới con mắt của những người làm tin học cấu tạo của mỗi nơ-rôn gồm các thành phần cơ bản gồm:
- Thân nơ-rôn được giới hạn trong một màng membran và trong cùng là nhân. Nó là nơi tiếp nhận, tổng hợp và phát ra các xung thần kinh hay các thông tin sau khi đã được tổng hợp. Từ thân nơ-rôn còn có rất nhiều đường rẽ nhánh tạm gọi là rễ.
- “Bus” liên kết nơ-rôn này với các nơ-rôn khác được gọi là axon, trên axon có các đường rẽ nhánh. Nơ-rôn còn có thể liên kết với các nơ-rôn khác qua các rễ. Chính vì cách liên kết đa dạng như vậy nên mạng nơ-rôn có độ liên kết rất cao.
Hình 2.4. Mô hình mạng nơ-rôn sinh học
- Các rễ của nơ-rôn được chia làm hai loại: rễ đầu vào nhận thông tin từ các nơ- rôn khác qua axon và rễ đầu ra đưa thông tin qua axon tới các nơ-rôn khác. Một nơ-rôn có thể có nhiều rễ đầu vào, nhưng chỉ có một rễ đầu ra. Bởi vậy nếu coi nơ-rôn như một khâu điều khiển thì nó chính là khâu có nhiều đầu vào và một đầu ra.
Quá trình hoạt động của một nơ-rôn là một quá trình điện hoá tự nhiên. Khi có tác động từ bên ngoài vào nơ-rôn, tức ở đầu vào của nơ-rôn xuất hiện một tín hiệu tác động vượt quá ngưỡng cân bằng của nó thì nơ-rôn sẽ ở trạng thái kích thích. Trong tế bào nơ-rôn xảy ra hàng loạt các phản ứng hoá học tạo thành lực tác động làm nơ-rôn bị kích thích hoàn toàn. Thế năng sinh ra khi nơ-rôn ở trạng thái bị kích thích hoàn toàn này chỉ tồn tại vài mili giây sau đó nơ-rôn lại trở về trạng thái cân bằng cũ. Thế năng này được chuyển vào mạng qua axon và có khả năng kích thích hoặc kìm hãm tự nhiên các nơ-rôn khác trong mạng.
Một tính chất rất cơ bản của mạng nơ-rôn sinh học là các đáp ứng theo kích thích có khả năng thay đổi theo thời gian. Các đáp ứng có thể tăng lên, giảm đi hoặc hoàn toàn biến mất. Qua các nhánh axon liên kết các tế bào nơ-rôn với nhau, sự thay đổi trạng thái của một nơ-rôn dẫn theo sự thay đổi trạng thái của những nơ-rôn khác và dẫn tới sự thay đổi của toàn bộ mạng nơ-rôn. Việc thay đổi trạng thái của mạng nơ-rôn có thể thực hiện qua một quá trình “dạy” hoặc do khả năng “học” tự nhiên.
Hoạt động tư duy của con người phần nhiều mang tính chủ quan định tính, dựa trên những bài học, kinh nghiệm học được từ khi còn nhỏ. Càng lớn dần thì những bài học hay kinh nghiệm của con người ngày càng nhiều, giúp con người giải quyết các vấn dề trong tự nhiên, xã hội tốt hơn. Bộ não có khả năng tự thay đổi cấu trúc để thích nghi dần với môi trường, làm cho cấu trúc bộ não ngày càng trở nên phức tạp sau mỗi lần học. Cấu trúc của mạng nơ-rôn sinh học cũng luôn luôn được phát triển và thay đổi. Một số cấu trúc của nơ-rôn được xác định trước, một số sau này mới được hình thành và một số thì bị huỷ bỏ qua quá trình chọn lọc tự nhiên, học và thích nghi.
Qua quá trình tìm hiểu, nghiên cứu cấu trúc và hoạt động của bộ não người, các nhà khoa học đã và đang xây dựng và phát triển các mô hình xử lý thông tin mô phỏng hoạt dộng của bộ não người. Đó chính là mô hình mạng nơ-rôn nhân tạo.
2.3. Mạng nơ-rôn nhân tạo
2.3.1. Lịch sử hình thành và phát triển
Mạng nơ-rôn nhân tạo (Artificial Neural Network-ANN) là một hệ thống xử lý thông tin phỏng theo cách thức xử lý thông tin của các hệ nơ-rôn sinh học. Nó được tạo lên từ một số lượng lớn các phần tử (gọi là phần tử xử lý hay nơ-rôn) kết nối với nhau thông qua các liên kết (gọi là trọng số liên kết) làm việc như một thể thống nhất để giải quyết một vấn đề cụ thể nào đó. Các phần tử này được liên kết với nhau và cùng hoạt động song song. Bởi vậy mạng nơ-rôn nhân tạo có hành vi như bộ não người với các khả năng học (learning) và tái tạo (recall) lại những gì đã được dạy; tổng
hợp thông tin từ sự luyện tập các mẫu dữ liệu. Đây chính là lý do khiến mạng nơ-rôn nhân tạo phát triển rất mạnh mẽ và được ứng dụng nhiều trong thực tế, đặc biệt trong lĩnh vực dự báo, nhận dạng, điều khiển...
Năm 1943, Warrem McCulloch và nhà toán học Walter Pitts đã chỉ ra rằng: về nguyên tắc mạng nơ-rôn nhân tạo có thể tính toán bất kỳ một hàm số học hay logic nào. Vàn những năm tiếp sau đó, các nhà khoa học Donald Hebb, Friedrick Hayek, Rosenblatt, Minsky và Papert, Paul Werbos đã có những nghiên cứu về mạng nơ-rôn như các luật thích nghi, sự phân tán trong các mạng nơ-rôn, phát triển và ứng dụng phương pháp học lan truyền ngược BP (back-propagation). Năm 1982, John Hopfield đã chỉ ra cách thức các mạng nơ-rôn làm việc và những công việc chúng có thể thực hiện được, từ đó đã thúc đẩy trở lại các nghiên cứu về mạng nơ-rôn.
Ngày nay, không chỉ dừng lại ở mức nghiên cứu lý thuyết, các nghiên cứu ứng dụng mạng nơ-rôn để giải quyết các bài toán thực tế được diễn ra ở khắp mọi nơi. Các ứng dụng mạng nơ-rôn ra đời ngày càng nhiều và ngày càng hoàn thiện hơn. Điển hình là các ứng dụng: xử lý ngôn ngữ (Language Processing), nhận dạng kí tự (Character Recognition), nhận dạng tiếng nói (Voice Recognition), nhận dạng mẫu (Pattern Recognition), xử lý tín hiệu (Signal Processing), Lọc dữ liệu (Data Filtering),…
2.3.2. Mô hình mạng nơ-rôn nhân tạo
Mạng nơ-rôn nhân tạo bao gồm nhiều nơ-rôn độc lập liên kết với nhau. Trước khi định nghĩa thế nào là mạng nơ-rôn nhân tạo, chúng ta sẽ tìm hiểu mô hình của một nơ-rôn nhân tạo.
Một nơ-rôn nhân tạo phản ánh các tính chất cơ bản của nơ-rôn sinh học. Mỗi nơ-rôn nhân tạo là một đơn vị xử lí thông tin làm cơ sở cho hoạt động của một mạng nơ-rôn. Nó có chức năng nhận tín hiệu vào, tổng hợp và xử lý các tín hiệu vào để tính tín hiệu ra. Dưới đây là một mô hình của một nơ-rôn nhân tạo:
x1
w1 j
j
j
x
w
2 j
net
j
yj
2
f (net )
j
wnj
xn
Hình 2.5. Mô hình một nơ-rôn nhân tạo
Trong đó:
- xi
với i
1,2,..., n : Các tín hiệu đầu vào;
- wij
với i
1,2,..., n : Các trọng số tương ứng với đầu vào;
- j : Ngưỡng kích hoạt của nơ-rôn j ;
- netj : Tín hiệu tổng hợp đầu vào của nơ-rôn j;
- f (netj ) : Hàm kích hoạt;
- yj : Tín hiệu ra của nơ-rôn j .
Đầu vào của nơ-rôn nhân tạo gồm n tín hiệu
xi với i
1,2,..., n . Mỗi tín hiệu
đầu vào tương ứng với một trọng số
wij , nó thể hiện mức độ ảnh hưởng của tín hiệu xi
đến nơ-rôn j . Tín hiệu đầu vào của một nơ-rôn có thể là dữ liệu từ bên ngoài mạng, hoặc đầu ra của một nơ-rôn khác, hoặc là đầu ra của chính nó.
Nhằm tăng khả năng thích nghi của mạng nơ-rôn trong quá trình học, người ta sử dụng thêm một tham số (Bias) gán cho mỗi nơ-rôn. Tham số đó còn gọi là trọng số của nơ-rôn, ta kí hiệu trọng số của nơ-rôn thứ j là j .
Các tín hiệu đầu vào của mỗi nơ-rôn được tổng hợp bằng một bộ cộng, kết quả
cho ta một giá trị gọi là
netj
của nơ-rôn thứ j. Ta giả định
netj
là hàm của các tín hiệu
xi và các trọng số
wij .
Có nhiều cách để tính tổng tín hiệu vào của nơ-rôn, có thể là:
n
x1w1 j
x2w2 j
...
xn wnj
xi wij
i 1
netj . (2.1)
hoặc
netj
max[min
xi ,
wij
], i = 1, 2, …, n. (2.2)
Nếu
wij
thì nơ-rôn được coi là đang ở trạng thái kích thích. Ngược lại, nếu
0
wij
thì nơ-rôn ở trạng thái kiềm chế.
0
Sau khi tổng hợp được tín hiệu đầu vào
netj , sử dụng hàm kích hoạt f biến
đổi
netj
để thu được tín hiệu đầu ra outj .
outj
f netj
yj
(2.3)
Tóm lại có thể xem nơ-rôn là một hàm phi tuyến nhiều đầu vào, một đầu ra. Hàm kích hoạt phải thoả mãn các điều kiện sau:
- Tín hiệu đầu ra phải không âm với mọi giá trị của
netj , j = 1, 2, …, n.
- Hàm f phải liên tục và bị chặn trong khoảng 0,1 .