• Σάββας Γρηγοριάδης

Εφαρμογές Τεχνητής Νοημοσύνης στην Καρδιολογία. (Ά μέρος)


Εισαγωγή


Λίγα θέματα είναι έχουν τόσο ενδιαφέρον, όσο η δυνητική ικανότητα της σύγχρονης τεχνολογίας να αναπτύξει δυνατότητες παρόμοιες με αυτές των ανθρώπων. Η ικανότητα των μηχανών ή των συστημάτων υπολογιστών να μιμούνται τις διαδικασίες ανθρώπινης νοημοσύνης ονομάζεται τεχνητή νοημοσύνη (AI). Η τεχνητή νοημοσύνη γίνεται ιδιαίτερα προηγμένη σε διάφορους επαγγελματικούς κλάδους και η τρέχουσα πρόκλησή είναι να μεταφερθεί όλη αυτή την ανάπτυξη στον ιατρικό τομέα και συγκεκριμένα στην καρδιολογία.

Οι όροι επιστήμη δεδομένων, μαζικά δεδομένα, τεχνητή νοημοσύνη και νοημοσύνη των μηχανών (machine learning) έχουν διαφορετικές έννοιες, παρά το γεγονός ότι ανήκουν στον ίδιο κλάδο: την ανάλυση και την εξαγωγή πληροφοριών από δεδομένα. Ωστόσο, αυτές οι έννοιες χρησιμοποιούνται μερικές φορές εναλλακτικά και με διφορούμενους τρόπους.

Ο όρος μαζικά δεδομένα επινοήθηκε για πρώτη φορά το 2005 από τον R. Magoulas, ο οποίος τον περιέγραψε ως τεράστιο όγκο δεδομένων που, λόγω μεγέθους, κατακλύζει το παραδοσιακό λογισμικό αποθήκευσης και επεξεργασίας. Με τη σειρά του, ο κόσμος των μεγάλων δεδομένων περιστρέφεται γύρω από τις επτά μαγικούς άξονες: όγκος δεδομένων, ταχύτητα, ποικιλία, ειλικρίνεια, εγκυρότητα, μεταβλητότητα και αξία. Δηλαδή, τα μαζικά δεδομένα παράγουν πληροφορίες με μεγάλη ταχύτητα, ελέγχοντας την ακεραιότητα των δεδομένων και παρουσιάζοντας τεράστια ποικιλία όσον αφορά τη φύση και τον τύπο (π.χ. κείμενο, εικόνες, βίντεο, διαφορετικά συστήματα και διαφορετικούς παρόχους).. Αυτές οι μεγάλες τράπεζες δεδομένων μπορούν να υποστηρίξουν την καθημερινή μας πρακτική βοηθώντας στη θέσπιση πρωτοκόλλων, στην προώθηση τυποποιημένης και έγκαιρης διάγνωσης ασθενειών, στην προώθηση της εξέλιξης της νόσου και στον σχεδιασμό της θεραπείας υποστήριξης για τους ασθενείς μας.

Αυτός ο τύπος επεξεργασίας πληροφοριών δεν θα ήταν δυνατός χωρίς τις πρόσφατες τεχνολογικές εξελίξεις στην τεχνητή νοημοσύνη. Η τεχνητή νοημοσύνη χρησιμοποιεί εργαλεία ικανά να εντοπίζουν υπάρχοντα μοτίβα στα δεδομένα.

Ο όρος μηχανική μάθηση επινοήθηκε για πρώτη φορά το 1959 από την AL Samuel. Στόχος της είναι η ανάπτυξη αλγορίθμων που θα επιτρέπουν στα συστήματα πληροφορικής να λαμβάνουν αποφάσεις και να μαθαίνουν από τα αποτελέσματα. Τα συστήματα αυτά θα μπορούσαν έτσι να μάθουν να κάνουν κάτι χωρίς να τους έχει δοθεί ρητά ο απαιτούμενος προγραμματισμός.

Μεταξύ των πολλών τεχνικών machine learning (ML), υπάρχει όλο και περισσότερο ενδιαφέρον για τα μοντέλα deep learning (DL). Αυτά βασίζουν την προγνωστική τους ισχύ σε τεχνητά νευρωνικά δίκτυα (NN) και χαρακτηρίζονται από πολλαπλά επίπεδα επεξεργασίας πληροφοριών (μετασχηματισμοί) που τους επιτρέπουν να αναλύουν σύνολα δεδομένων με πιο σύνθετα μοτίβα. Αυτοί οι αλγόριθμοι επιτρέπουν βασικές προόδους στην αναγνώριση ομιλίας και εικόνας. το τελευταίο είναι ιδιαίτερα σημαντικό στην καρδιολογία.

Το πεδίο της επιστήμης των δεδομένων περιλαμβάνει όλες τις πτυχές που σχετίζονται με την παραγωγή των υφιστάμενων πληροφοριών που περιέχονται στα δεδομένα. Περιλαμβάνει επιστημονικές μεθόδους, διαδικασίες και συστήματα για την εξαγωγή γνώσεων ή την ανάπτυξη καλύτερης κατανόησης των δεδομένων, εφαρμόζοντας συνήθως νέες τεχνικές επεξεργασίας όπως η τεχνητή νοημοσύνη. Παρόλο που η τεχνητή νοημοσύνη και η ML χρησιμοποιούνται συχνά ως συνώνυμα, είναι διαφορετικά. Η τεχνητή νοημοσύνη καλύπτει ευρύτερο πεδίο εφαρμογής αυτής της τεχνολογικής επανάστασης και περιλαμβάνει τόσο την ML όσο και τη DL.


Τεχνητή Νοημοσύνη



Σήμερα, είναι δύσκολο να βρεθεί ένας καθολικός ορισμός αυτού που είναι γνωστό ως τεχνητή νοημοσύνη. Ο ίδιος ο όρος εφαρμόζεται συχνά στον τομέα της επιστήμης των υπολογιστών που προσπαθεί να μιμηθεί τις ανθρώπινες γνωστικές διαδικασίες, την ικανότητα μάθησης και την αποθήκευση γνώσεων. Άλλοι ορισμοί είναι ευρύτεροι και περιλαμβάνουν την κατανόηση και την κατασκευή ευφυών οντοτήτων, οι οποίοι γενικά νοούνται ως λογισμικό ηλεκτρονικών υπολογιστών. Όσον αφορά τους τύπους εργασιών, η τεχνητή νοημοσύνη μπορεί να αναφέρεται σε αυτοματοποιημένα συστήματα ικανά, για παράδειγμα, να μεταφράζουν ένα έγγραφο, να αναγνωρίζουν τους ανθρώπους με τα χαρακτηριστικά του προσώπου τους ή να οδηγούν αυτοκίνητο. Ωστόσο, η τεχνητή νοημοσύνη δεν περιορίζεται στη μίμηση ανθρώπινων καθηκόντων: σε ορισμένες περιπτώσεις, είναι σε θέση να νικήσει τον καλύτερο εμπειρογνώμονα σε έναν τομέα λαμβάνοντας αποφάσεις με χαμηλότερα ποσοστά σφάλματος από ό, τι είναι ανθρωπίνως δυνατό ή εντοπίζοντας μοτίβα ανεπαίσθητα για το ανθρώπινο μάτι. Επομένως, η τεχνητή νοημοσύνη επιτρέπει την ανάλυση πληροφοριών με ξεχωριστή προσέγγιση από την παραδοσιακή.


Αυτόματη αναγνώριση ομιλίας και επεξεργασία φυσικής γλώσσας


Στόχος αυτών των κλάδων είναι η ανάπτυξη μηχανισμών επικοινωνίας μεταξύ ανθρώπων και μηχανών που χρησιμοποιούν φυσική γλώσσα. Στον ιατρικό τομέα, η αυτόματη αναγνώριση ομιλίας χρησιμοποιείται ήδη για την καταγραφή των κλινικών πληροφοριών των ασθενών. Επιπλέον, η επεξεργασία φυσικής γλώσσας επιτρέπει, όπως έχει ήδη παρατηρηθεί σε αρκετά παραδείγματα στην Ισπανία στον τομέα της καρδιολογίας, της ταξινόμησης ασθενειών και της επιλογής της καταλληλότερης κοόρτης για μια κλινική μελέτη με την ανάλυση μητρώων ιατρικών αρχείων.


Πρόβλεψη, σύσταση και διαγνωστικοί αλγόριθμοι


Αυτή είναι ίσως η πιο ώριμη περιοχή στους κόσμους της ιατρικής και της καρδιολογίας και των ML και DL. Το ενδιαφέρον έγκειται κυρίως στην αυτοματοποίηση επαναλαμβανόμενων εργασιών, όπως η αξιολόγηση διαγνωστικών εξετάσεων, όσο και στη δημιουργία γνώσης μέσω της ανάλυσης κλινικών δεδομένων.


Ανάλυση όρασης και εικόνας υπολογιστή


Αυτός ο επιστημονικός κλάδος περιλαμβάνει μεθόδους απόκτησης, επεξεργασίας, ανάλυσης και κατανόησης εικόνων του πραγματικού κόσμου, προκειμένου να παραχθούν αριθμητικές ή συμβολικές πληροφορίες που μπορούν να υποβληθούν σε επεξεργασία από έναν υπολογιστή. Οι τεχνικές αυτές έχουν υποστεί μια μεγάλη επανάσταση τα τελευταία χρόνια λόγω της εφαρμογής αλγορίθμων DL και είναι ένας από τους κλάδους που συμβάλλουν περισσότερο στην ιατρική σήμερα, και ως εκ τούτου στην καρδιολογία, όπως περιγράφεται παρακάτω.


Ρομποτική και τεχνητή νοημοσύνη


Στη ρομποτική και την τεχνητή νοημοσύνη, ο στόχος είναι η κατασκευή φυσικών συστημάτων με έξυπνη συμπεριφορά. Ο τομέας αυτός έχει πολλά χρόνια ανάπτυξης, αλλά βιώνει μια άνθηση στους διάφορους τομείς που περιλαμβάνει (π.χ. αυτόματη αναγνώριση ομιλίας, όραση υπολογιστή). Στην καρδιαγγειακή επιστήμη, η ανάπτυξή της συνεχίζεται εδώ και χρόνια στον τομέα της χειρουργικής επέμβασης, με σαφές παράδειγμα το χειρουργικό σύστημα Da Vinci.


Συστήματα εμπειρογνωμόνων


Στην τεχνητή νοημοσύνη, ένα εξειδικευμένο σύστημα είναι λογισμικό που μιμείται την ικανότητα λήψης αποφάσεων ενός ανθρώπινου εμπειρογνώμονα. Τα συστήματα αυτά βασίζονται σε κανόνες ή ακόμη και κλινικές περιπτώσεις. Εδώ και αρκετό καιρό, υπάρχουν διαθέσιμα εξειδικευμένα ιατρικά συστήματα που προσπαθούν να προσομοιώσουν τη συλλογιστική των ειδικών και να παρέχουν την πιθανή διάγνωση και τη βέλτιστη διαχείριση των ασθενών, ακόμη και στην καρδιολογία.


Deep Learning και απεικόνιση


Η ανάλυση εικόνας είναι το πεδίο με τις πιο γρήγορες εξελίξεις στην τεχνητή νοημοσύνη και ως εκ τούτου είναι ιδιαίτερα σχετικό με την καρδιολογία. Η καθημερινή ανάλυση διαφόρων καρδιολογικών εικόνων μπορεί να είναι κουραστική και χρονοβόρα. Ωστόσο, η καθημερινή μας εργασία μπορεί ήδη να βελτιωθεί με τα διάφορα εργαλεία, με βάση τα NN, που είναι διαθέσιμα για αυτόματη επεξεργασία εικόνας.

Τα NNs3 είναι ένας τύπος αλγορίθμου τεχνητής νοημοσύνης που είναι ανάλογος με τη διαδικασία μάθησης που συμβαίνει στους νευρώνες του εγκεφάλου. Από την ανάπτυξή του ως υπολογιστικό μοντέλο, έχουν προκύψει αλγόριθμοι κατάρτισης και αρχιτεκτονικές δικτύου που έχουν βελτιώσει σημαντικά την ακρίβεια και την αποτελεσματικότητα της μάθησης, λειτουργώντας με όλο και μικρότερο αριθμό δεδομένων κατάρτισης. Όταν αυτές οι αρχιτεκτονικές αποτελούνται από πολλά στρώματα νευρώνων, χρησιμοποιείται ο όρος DL. Τα NN είναι επίσης πολύ ευέλικτα και μπορούν να χρησιμοποιηθούν σε εποπτευόμενα, χωρίς επίβλεψη και πλαίσια μάθησης ενίσχυσης. Για την εφαρμογή τους, διατίθενται διάφορες πλατφόρμες ανοιχτού κώδικα, όπως το TensorFlow, το Pytorch, το Keras και το Caffe. Τα μειονεκτήματα των τεχνικών DL περιλαμβάνουν το υψηλό υπολογιστικό κόστος τους. Επιπλέον, απαιτείται υψηλός βαθμός εμπειρογνωμοσύνης για τη σωστή προσαρμογή τους και, στην περίπτωση της εποπτευόμενης μάθησης, απαιτείται ένα σύνολο μη αυτόματα σχολιασμένων εικόνων, οι οποίες μπορεί μερικές φορές να είναι εξαιρετικά ακριβές.

Στο πεδίο της καρδιακής απεικόνισης, οι τεχνικές τεχνητής νοημοσύνης έχουν διάφορους στόχους. Αυτές περιλαμβάνουν την τμηματοποίηση και την ταυτοποίηση των διαφόρων δομών της καρδιάς την ταξινόμηση εικόνων που έχουν καταχωρηθεί με διαφορετικές συνθήκες, την ανίχνευση και τμηματοποίηση βλαβών, την καταχώριση εικόνας και την ταξινόμηση ιστών από ιστολογικές εικόνες. Άλλες εργασίες σχετίζονται με τη δημιουργία τεχνητών εικόνων που είναι όσο το δυνατόν πιο ρεαλιστικές.

Η έρευνα εφαρμογής τεχνικών DL στην καρδιολογική απεικόνιση έχει αναπτυχθεί τα τελευταία 3 χρόνια. Μεταξύ των προκλήσεων που είναι πιθανό να διερευνηθούν τα επόμενα χρόνια είναι συνδυασμένες αναλύσεις διαφορετικών απεικονιστικών πηγών, η ενσωμάτωση κλινικών δεδομένων και ιατρικών εκθέσεων και η μελέτη των χρονικών αλλαγών στις καρδιακές εικόνες.


Περιορισμοί


Το κύριο χαρακτηριστικό της τεχνητής νοημοσύνης όσον αφορά τα μοντέλα ML ή DL είναι ότι η μάθηση βασίζεται στον προσδιορισμό προτύπων σε σύνολα δεδομένων. Αυτή η φιλοσοφία είναι ταυτόχρονα ένα ισχυρό σημείο, επειδή οι υπολογιστές είναι εξαιρετικά αποτελεσματικοί και ακριβείς στην εύρεση τέτοιων προτύπων όταν υπάρχουν και ένας περιορισμός, για διάφορους λόγους. Πρώτον, επειδή ο όγκος των δεδομένων που απαιτούνται για την απόκτηση ενός ακριβούς μοντέλου μπορεί να είναι σημαντικός. Αυτό μπορεί να αποτελέσει πρόβλημα στην ιατρική, όπου η εφαρμογή αυτόματων συστημάτων συλλογής δεδομένων μόλις αρχίζει, τα συστήματα αυτά πρέπει να πληρούν καθιερωμένα νομικά και δεοντολογικά κριτήρια, και ορισμένες σπάνιες ασθένειες έχουν αναπόφευκτα λίγες μελέτες. Επιπλέον, ακόμη και με αλγορίθμους με καλά αποτελέσματα για ένα σύνολο δεδομένων, τα μοντέλα ML και DL υποφέρουν από αδυναμία σωστής ανίχνευσης και ταξινόμησης περιπτώσεων που δεν έχουν δει προηγουμένως. Σε αυτό το πλαίσιο, η αξιοπιστία και η ποιότητα της πηγής δεδομένων είναι απαραίτητες για να είναι ρεαλιστικός και σωστός ένας αλγόριθμος.