Κύριος Αλλα Ανάλυση δεδομένων Time-to-Event

Ανάλυση δεδομένων Time-to-Event

ΣΦΑΙΡΙΚΗ ΕΙΚΟΝΑ

Λογισμικό

Περιγραφή

Ιστοσελίδες

Αναγνώσεις

ΚΥΚΛΟΣ ΜΑΘΗΜΑΤΩΝ

ΣΦΑΙΡΙΚΗ ΕΙΚΟΝΑ

Αυτή η σελίδα περιγράφει εν συντομία μια σειρά ερωτήσεων που πρέπει να ληφθούν υπόψη κατά την ανάλυση δεδομένων από ώρα σε συμβάν και παρέχει μια σχολιασμένη λίστα πόρων για περισσότερες πληροφορίες.

Περιγραφή

Τι είναι μοναδικό για τα δεδομένα χρονικής εκδήλωσης (TTE);

Τα δεδομένα Time-to-event (TTE) είναι μοναδικά επειδή το αποτέλεσμα ενδιαφέροντος δεν είναι μόνο εάν συνέβη ή όχι ένα συμβάν, αλλά και όταν συνέβη αυτό το συμβάν. Οι παραδοσιακές μέθοδοι λογιστικής και γραμμικής παλινδρόμησης δεν ταιριάζουν ώστε να μπορούν να συμπεριλάβουν τόσο τις εκδηλώσεις όσο και τις πτυχές του χρόνου ως αποτέλεσμα στο μοντέλο. Οι παραδοσιακές μέθοδοι παλινδρόμησης επίσης δεν είναι εξοπλισμένες για να χειριστούν τη λογοκρισία, έναν ειδικό τύπο δεδομένων που λείπουν που εμφανίζονται στις αναλύσεις χρόνου-προς-συμβάν, όταν τα άτομα δεν βιώνουν το γεγονός ενδιαφέροντος κατά τη διάρκεια του χρόνου παρακολούθησης. Παρουσία λογοκρισίας, ο πραγματικός χρόνος στο συμβάν υποτιμάται. Ειδικές τεχνικές για δεδομένα TTE, όπως θα συζητηθεί παρακάτω, έχουν αναπτυχθεί για να χρησιμοποιούν τις μερικές πληροφορίες για κάθε θέμα με λογοκρισμένα δεδομένα και να παρέχουν αμερόληπτες εκτιμήσεις επιβίωσης. Αυτές οι τεχνικές ενσωματώνουν δεδομένα από πολλαπλά χρονικά σημεία σε διάφορα θέματα και μπορούν να χρησιμοποιηθούν για τον άμεσο υπολογισμό των ποσοστών, των χρονικών αναλογιών και των λόγων κινδύνου.

Ποιες είναι οι σημαντικές μεθοδολογικές εκτιμήσεις των δεδομένων χρόνου-σε-συμβάν;

Υπάρχουν 4 κύριες μεθοδολογικές εκτιμήσεις στην ανάλυση δεδομένων χρόνου ή συμβάντος ή επιβίωσης. Είναι σημαντικό να υπάρχει ένας σαφής ορισμός του γεγονότος-στόχου, της χρονικής προέλευσης, της χρονικής κλίμακας και να περιγραφεί πώς οι συμμετέχοντες θα βγουν από τη μελέτη. Μόλις αυτά προσδιοριστούν καλά, τότε η ανάλυση γίνεται πιο απλή. Συνήθως υπάρχει ένα συμβάν μεμονωμένου στόχου, αλλά υπάρχουν επεκτάσεις αναλύσεων επιβίωσης που επιτρέπουν πολλαπλά συμβάντα ή επαναλαμβανόμενα συμβάντα.

Ποια είναι η χρονική προέλευση;

Η ώρα προέλευσης είναι το σημείο στο οποίο ξεκινά ο χρόνος παρακολούθησης. Τα δεδομένα TTE μπορούν να χρησιμοποιήσουν μια ποικιλία προέλευσης χρόνου που καθορίζονται σε μεγάλο βαθμό από το σχεδιασμό της μελέτης, καθένα από τα οποία έχει σχετικά οφέλη και μειονεκτήματα. Τα παραδείγματα περιλαμβάνουν τον χρόνο αναφοράς ή την ηλικία αναφοράς. Η προέλευση του χρόνου μπορεί επίσης να προσδιοριστεί από ένα καθοριστικό χαρακτηριστικό, όπως η έναρξη της έκθεσης ή η διάγνωση. Αυτή είναι συχνά μια φυσική επιλογή εάν το αποτέλεσμα σχετίζεται με αυτό το χαρακτηριστικό. Άλλα παραδείγματα περιλαμβάνουν τη γέννηση και το ημερολογιακό έτος. Για μελέτες κοόρτης, η χρονική κλίμακα είναι συνήθως ο χρόνος της μελέτης.

Υπάρχει άλλη επιλογή για χρονική κλίμακα εκτός από το χρόνο στη μελέτη;

Η ηλικία είναι μια άλλη συχνά χρησιμοποιούμενη χρονική κλίμακα, όπου η ηλικία αναφοράς είναι η χρονική προέλευση και τα άτομα βγαίνουν από την εκδήλωση ή την λογοκρισία. Μοντέλα με ηλικία ως χρονική κλίμακα μπορούν να προσαρμοστούν για εφέ ημερολογίου. Μερικοί συγγραφείς προτείνουν η ηλικία και όχι ο χρόνος στη μελέτη να χρησιμοποιείται ως χρονοδιάγραμμα, καθώς μπορεί να παρέχει λιγότερο προκατειλημμένες εκτιμήσεις.

Τι είναι η λογοκρισία;

Μία από τις συγκεκριμένες προκλήσεις για την ανάλυση επιβίωσης είναι ότι μόνο ορισμένα άτομα θα έχουν βιώσει το συμβάν μέχρι το τέλος της μελέτης, και ως εκ τούτου οι χρόνοι επιβίωσης θα είναι άγνωστοι για ένα υποσύνολο της ομάδας μελέτης. Αυτό το φαινόμενο ονομάζεται λογοκρισία και μπορεί να προκύψει με τους ακόλουθους τρόπους: ο συμμετέχων στη μελέτη δεν έχει ακόμη βιώσει το σχετικό αποτέλεσμα, όπως υποτροπή ή θάνατος, μετά το πέρας της μελέτης. ο συμμετέχων στη μελέτη χάνεται για παρακολούθηση κατά τη διάρκεια της περιόδου μελέτης · Ή, ο συμμετέχων στη μελέτη βιώνει ένα διαφορετικό γεγονός που καθιστά αδύνατη την περαιτέρω παρακολούθηση. Τέτοιοι λογοκριμένοι χρόνοι διαστήματος υποτιμούν τον πραγματικό αλλά άγνωστο χρόνο στο συμβάν. Για τις περισσότερες αναλυτικές προσεγγίσεις, η λογοκρισία θεωρείται τυχαία ή μη ενημερωτική.

Υπάρχουν τρεις βασικοί τύποι λογοκρισίας, δεξιά, αριστερά και διάστημα. Εάν τα συμβάντα συμβαίνουν πέρα ​​από το τέλος της μελέτης, τότε τα δεδομένα λογοκρίνονται σωστά. Τα δεδομένα με αριστερή λογοκρισία εμφανίζονται όταν παρατηρείται το συμβάν, αλλά η ακριβής ώρα του συμβάντος είναι άγνωστη. Τα δεδομένα με λογοκρισία διαστήματος εμφανίζονται όταν παρατηρείται το συμβάν, αλλά οι συμμετέχοντες μπαίνουν και βγαίνουν από την παρατήρηση, οπότε η ακριβής ώρα του συμβάντος είναι άγνωστη. Οι περισσότερες αναλυτικές μέθοδοι επιβίωσης έχουν σχεδιαστεί για παρατηρήσεις με σωστή λογοκρισία, αλλά υπάρχουν διαθέσιμες μέθοδοι για δεδομένα διαστήματος και λογοκρισίας αριστερά.

Ποιο είναι το θέμα ενδιαφέροντος;

Η επιλογή του αναλυτικού εργαλείου πρέπει να καθοδηγείται από το ερευνητικό ζήτημα που σας ενδιαφέρει. Με τα δεδομένα TTE, το ερευνητικό ερώτημα μπορεί να λάβει διάφορες μορφές, οι οποίες επηρεάζουν ποια λειτουργία επιβίωσης είναι η πιο σχετική με το ερευνητικό ερώτημα. Τρεις διαφορετικοί τύποι ερευνητικών ερωτημάτων που μπορεί να ενδιαφέρουν τα δεδομένα TTE περιλαμβάνουν:

  1. Ποιο ποσοστό ατόμων θα παραμείνει απαλλαγμένο από την εκδήλωση μετά από ένα συγκεκριμένο χρονικό διάστημα;

  2. Ποιο ποσοστό ατόμων θα έχει το συμβάν μετά από ένα συγκεκριμένο χρονικό διάστημα;

  3. Ποιος είναι ο κίνδυνος του γεγονότος σε μια συγκεκριμένη χρονική στιγμή, μεταξύ εκείνων που έχουν επιβιώσει μέχρι εκείνο το σημείο;

Κάθε μία από αυτές τις ερωτήσεις αντιστοιχεί σε διαφορετικό τύπο λειτουργίας που χρησιμοποιείται στην ανάλυση επιβίωσης:

  1. Survival Function, S (t): η πιθανότητα ότι ένα άτομο θα επιβιώσει πέρα ​​από το χρόνο t [Pr (T> t)]

  2. Συνάρτηση πυκνότητας πιθανότητας, F (t) ή συνάρτηση αθροιστικής επίπτωσης, R (t): η πιθανότητα ότι ένα άτομο θα έχει χρόνο επιβίωσης μικρότερο ή ίσο με t [Pr (T≤t)]

  3. Λειτουργία επικινδυνότητας, h (t): η στιγμιαία δυνατότητα εμφάνισης ενός συμβάντος τη στιγμή t, υπό την προϋπόθεση ότι έχει επιβιώσει εκείνη τη στιγμή

  4. Αθροιστική συνάρτηση κινδύνου, H (t): το ολοκλήρωμα της συνάρτησης κινδύνου από το χρόνο 0 έως το χρόνο t, που ισούται με την περιοχή κάτω από την καμπύλη h (t) μεταξύ του χρόνου 0 και του χρόνου t

Εάν μία από αυτές τις λειτουργίες είναι γνωστή, οι άλλες συναρτήσεις μπορούν να υπολογιστούν χρησιμοποιώντας τους ακόλουθους τύπους:

S (t) = 1 - F (t) Η συνάρτηση επιβίωσης και η συνάρτηση πυκνότητας πιθανότητας είναι 1

h (t) = f (t) / S (t) Ο στιγμιαίος κίνδυνος ισούται με την άνευ όρων πιθανότητα

βιώνει το συμβάν στο χρόνο t, κλιμακωτό από το κλάσμα ζωντανό στο χρόνο t

H (t) = -log [S (t)] Η αθροιστική συνάρτηση κινδύνου ισούται με το αρνητικό ημερολόγιο της επιβίωσης

λειτουργία

S (t) = e –H (t) Η συνάρτηση επιβίωσης ισούται με τον εκθεσιακό αρνητικό σωρευτικό κίνδυνο

λειτουργία

Αυτές οι μετατροπές χρησιμοποιούνται συχνά σε μεθόδους ανάλυσης επιβίωσης, όπως θα συζητηθεί παρακάτω. Γενικά, μια αύξηση στο h (t), ο στιγμιαίος κίνδυνος, θα οδηγήσει σε αύξηση του H (t), του αθροιστικού κινδύνου, που μεταφράζεται σε μείωση του S (t), της λειτουργίας επιβίωσης.

Ποιες παραδοχές πρέπει να γίνουν για τη χρήση τυπικών τεχνικών για δεδομένα χρονικών συμβάντων;

Η κύρια υπόθεση για την ανάλυση δεδομένων TTE είναι αυτή της μη ενημερωτικής λογοκρισίας: τα άτομα που λογοκρίνονται έχουν την ίδια πιθανότητα να βιώσουν ένα επόμενο συμβάν με τα άτομα που παραμένουν στη μελέτη. Η ενημερωτική λογοκρισία είναι ανάλογη με τα μη αγνοούμενα δεδομένα που λείπουν, τα οποία θα προκαλέσουν την ανάλυση. Δεν υπάρχει οριστικός τρόπος για να ελέγξετε εάν η λογοκρισία δεν είναι ενημερωτική, αν και η διερεύνηση των μοτίβων λογοκρισίας μπορεί να υποδεικνύει εάν μια παραδοχή μη ενημερωτικής λογοκρισίας είναι λογική. Εάν υπάρχει υποψία πληροφοριακής λογοκρισίας, μπορούν να χρησιμοποιηθούν αναλύσεις ευαισθησίας, όπως σενάρια βέλτιστης και χειρότερης περίπτωσης, για να προσπαθήσουμε να ποσοτικοποιήσουμε την επίδραση που έχει η πληροφοριακή λογοκρισία στην ανάλυση.

Μια άλλη υπόθεση κατά την ανάλυση δεδομένων TTE είναι ότι υπάρχει επαρκής χρόνος παρακολούθησης και αριθμός συμβάντων για επαρκή στατιστική ισχύ. Αυτό πρέπει να εξεταστεί στη φάση σχεδιασμού της μελέτης, καθώς οι περισσότερες αναλύσεις επιβίωσης βασίζονται σε μελέτες κοόρτης.

Αξίζει να αναφερθούν επιπλέον παραδοχές απλούστευσης, καθώς συχνά γίνονται σε επισκοπήσεις της ανάλυσης επιβίωσης. Ενώ αυτές οι υποθέσεις απλοποιούν τα μοντέλα επιβίωσης, δεν είναι απαραίτητο να πραγματοποιούνται αναλύσεις με δεδομένα TTE. Οι προηγμένες τεχνικές μπορούν να χρησιμοποιηθούν εάν παραβιάζονται αυτές οι υποθέσεις:

  • Χωρίς επίδραση κοόρτης στην επιβίωση: για μια κοόρτη με μακρά περίοδο πρόσληψης, υποθέστε ότι τα άτομα που εντάσσονται νωρίς έχουν τις ίδιες πιθανότητες επιβίωσης με εκείνες από αυτές που συμμετέχουν αργά

  • Σωστή λογοκρισία μόνο στα δεδομένα

  • Οι εκδηλώσεις είναι ανεξάρτητες μεταξύ τους

Ποιοι τύποι προσεγγίσεων μπορούν να χρησιμοποιηθούν για την ανάλυση επιβίωσης;

Υπάρχουν τρεις κύριες προσεγγίσεις για την ανάλυση δεδομένων TTE: μη παραμετρικές, ημι-παραμετρικές και παραμετρικές προσεγγίσεις. Η επιλογή της προσέγγισης προς χρήση πρέπει να βασίζεται στο ερευνητικό ζήτημα που ενδιαφέρει. Συχνά, περισσότερες από μία προσεγγίσεις μπορούν να χρησιμοποιηθούν κατάλληλα στην ίδια ανάλυση.

Ποιες είναι οι μη παραμετρικές προσεγγίσεις στην ανάλυση επιβίωσης και πότε είναι κατάλληλες;

Οι μη παραμετρικές προσεγγίσεις δεν βασίζονται σε υποθέσεις σχετικά με το σχήμα ή τη μορφή παραμέτρων στον υποκείμενο πληθυσμό. Στην ανάλυση επιβίωσης, μη παραμετρικές προσεγγίσεις χρησιμοποιούνται για την περιγραφή των δεδομένων με την εκτίμηση της συνάρτησης επιβίωσης, S (t), μαζί με τη διάμεση και τα τεταρτημόρια του χρόνου επιβίωσης. Αυτά τα περιγραφικά στατιστικά στοιχεία δεν μπορούν να υπολογιστούν απευθείας από τα δεδομένα λόγω λογοκρισίας, τα οποία υποτιμούν τον πραγματικό χρόνο επιβίωσης σε λογοκρισμένα θέματα, οδηγώντας σε στρεβλωμένες εκτιμήσεις του μέσου, μέσου και άλλων περιγραφών. Οι μη παραμετρικές προσεγγίσεις χρησιμοποιούνται συχνά ως το πρώτο βήμα μιας ανάλυσης για τη δημιουργία αμερόληπτων περιγραφικών στατιστικών και συχνά χρησιμοποιούνται σε συνδυασμό με ημι-παραμετρικές ή παραμετρικές προσεγγίσεις.

Εκτιμητής Kaplan-Meier

Η πιο κοινή μη παραμετρική προσέγγιση στη βιβλιογραφία είναι ο εκτιμητής Kaplan-Meier (ή όριο προϊόντος). Ο υπολογιστής Kaplan-Meier λειτουργεί χωρίζοντας την εκτίμηση του S (t) σε μια σειρά βημάτων / διαστημάτων βάσει των παρατηρούμενων χρόνων συμβάντων. Οι παρατηρήσεις συμβάλλουν στην εκτίμηση του S (t) έως ότου συμβεί το συμβάν ή μέχρι να λογοκριθούν. Για κάθε διάστημα, υπολογίζεται η πιθανότητα επιβίωσης έως το τέλος του διαστήματος, δεδομένου ότι τα άτομα κινδυνεύουν στην αρχή του διαστήματος (αυτό συνήθως αναφέρεται ως pj = (nj - dj) / nj). Το εκτιμώμενο S (t) για κάθε τιμή t ισούται με το προϊόν επιβίωσης κάθε διαστήματος έως και συμπεριλαμβανομένου του χρόνου t. Οι κύριες παραδοχές αυτής της μεθόδου, εκτός από τη μη ενημερωτική λογοκρισία, είναι ότι η λογοκρισία συμβαίνει μετά από αποτυχίες και ότι δεν υπάρχει επίδραση κοόρτης στην επιβίωση, οπότε τα άτομα έχουν την ίδια πιθανότητα επιβίωσης ανεξάρτητα από το πότε ήρθαν υπό μελέτη.

Το εκτιμώμενο S (t) από τη μέθοδο Kaplan-Meier μπορεί να σχεδιαστεί ως μια σταδιακή συνάρτηση με το χρόνο στον άξονα Χ. Αυτή η πλοκή είναι ένας καλός τρόπος για να απεικονίσετε την εμπειρία επιβίωσης της κοόρτης και μπορεί επίσης να χρησιμοποιηθεί για την εκτίμηση του μέσου όρου (όταν S (t) ≤0,5) ή τεταρτημόρια του χρόνου επιβίωσης. Αυτά τα περιγραφικά στατιστικά στοιχεία μπορούν επίσης να υπολογιστούν απευθείας χρησιμοποιώντας τον εκτιμητή Kaplan-Meier. Τα διαστήματα εμπιστοσύνης 95% (CI) για S (t) βασίζονται σε μετασχηματισμούς του S (t) για να διασφαλιστεί ότι το 95% CI είναι εντός 0 και 1. Η πιο συνηθισμένη μέθοδος στη βιβλιογραφία είναι ο εκτιμητής Greenwood.

Εκτιμητής πίνακα ζωής

Ο εκτιμητής του πίνακα ζωής της συνάρτησης επιβίωσης είναι ένα από τα πρώτα παραδείγματα εφαρμοσμένων στατιστικών μεθόδων, που έχουν χρησιμοποιηθεί για πάνω από 100 χρόνια για να περιγράψουν τη θνησιμότητα σε μεγάλους πληθυσμούς. Ο εκτιμητής του πίνακα ζωής είναι παρόμοιος με τη μέθοδο Kaplan-Meier, εκτός του ότι τα διαστήματα βασίζονται στο ημερολογιακό χρόνο αντί για τα παρατηρούμενα συμβάντα. Δεδομένου ότι οι μέθοδοι του πίνακα ζωής βασίζονται σε αυτά τα διαστήματα ημερολογίου και δεν βασίζονται σε μεμονωμένα συμβάντα / χρόνους λογοκρισίας, αυτές οι μέθοδοι χρησιμοποιούν το μέσο μέγεθος κινδύνου που ορίζεται ανά διάστημα για να εκτιμήσουν το S (t) και πρέπει να υποθέσουν ότι η λογοκρισία συνέβη ομοιόμορφα στο χρονικό διάστημα του ημερολογίου. Για αυτόν τον λόγο, ο εκτιμητής του πίνακα ζωής δεν είναι τόσο ακριβής όσο ο εκτιμητής Kaplan-Meier, αλλά τα αποτελέσματα θα είναι παρόμοια σε πολύ μεγάλα δείγματα.

Εκτιμητής Nelson-Aalen

Μια άλλη εναλλακτική λύση για τον Kaplan-Meier είναι ο εκτιμητής Nelson-Aalen, ο οποίος βασίζεται στη χρήση μιας μεθόδου διαδικασίας μέτρησης για την εκτίμηση της αθροιστικής συνάρτησης κινδύνου, H (t). Η εκτίμηση του H (t) μπορεί στη συνέχεια να χρησιμοποιηθεί για την εκτίμηση του S (t). Οι εκτιμήσεις του S (t) που προκύπτουν χρησιμοποιώντας αυτήν τη μέθοδο θα είναι πάντα μεγαλύτερες από την εκτίμηση K-M, αλλά η διαφορά θα είναι μικρή μεταξύ των δύο μεθόδων σε μεγάλα δείγματα.

Μπορούν να χρησιμοποιηθούν μη παραμετρικές προσεγγίσεις για αναλύσιμες ή πολυμεταβλητές αναλύσεις;

Οι μη παραμετρικές προσεγγίσεις όπως ο εκτιμητής Kaplan-Meier μπορούν να χρησιμοποιηθούν για τη διεξαγωγή μη αναλλοίωτων αναλύσεων για κατηγορικούς παράγοντες ενδιαφέροντος. Οι παράγοντες πρέπει να είναι κατηγοριοποιημένοι (είτε στη φύση είτε μια συνεχής μεταβλητή χωρισμένη σε κατηγορίες) επειδή η συνάρτηση επιβίωσης, S (t), εκτιμάται για κάθε επίπεδο της κατηγορηματικής μεταβλητής και στη συνέχεια συγκρίνεται μεταξύ αυτών των ομάδων. Το εκτιμώμενο S (t) για κάθε ομάδα μπορεί να γραφτεί και να συγκριθεί οπτικά.

Οι δοκιμές με βάση την κατάταξη μπορούν επίσης να χρησιμοποιηθούν για τη στατιστική δοκιμή της διαφοράς μεταξύ των καμπυλών επιβίωσης. Αυτές οι δοκιμές συγκρίνουν τον παρατηρούμενο και τον αναμενόμενο αριθμό συμβάντων σε κάθε χρονικό σημείο μεταξύ ομάδων, υπό την μηδενική υπόθεση ότι οι λειτουργίες επιβίωσης είναι ίσες μεταξύ των ομάδων. Υπάρχουν αρκετές εκδόσεις αυτών των δοκιμών βάσει κατάταξης, οι οποίες διαφέρουν στο βάρος που δίνεται σε κάθε χρονικό σημείο στον υπολογισμό της στατιστικής δοκιμής. Δύο από τις πιο συνηθισμένες δοκιμές με βάση την κατάταξη που φαίνονται στη βιβλιογραφία είναι η δοκιμή κατάταξης, η οποία δίνει σε κάθε χρονικό σημείο ίσο βάρος και η δοκιμή Wilcoxon, η οποία σταθμίζει κάθε χρονικό σημείο με τον αριθμό των ατόμων που κινδυνεύουν. Με βάση αυτό το βάρος, το τεστ Wilcoxon είναι πιο ευαίσθητο στις διαφορές μεταξύ καμπυλών νωρίς κατά την παρακολούθηση, όταν περισσότερα άτομα βρίσκονται σε κίνδυνο. Άλλες δοκιμές, όπως το τεστ Peto-Prentice, χρησιμοποιούν βάρη μεταξύ αυτών των δοκιμών κατάταξης και Wilcoxon. Οι δοκιμές με βάση την κατάταξη υπόκεινται στην πρόσθετη υπόθεση ότι η λογοκρισία είναι ανεξάρτητη από την ομάδα και όλα περιορίζονται από μικρή ισχύ για την ανίχνευση διαφορών μεταξύ ομάδων όταν διασχίζουν τις καμπύλες επιβίωσης. Παρόλο που αυτές οι δοκιμές παρέχουν μια τιμή p της διαφοράς μεταξύ καμπυλών, δεν μπορούν να χρησιμοποιηθούν για τον υπολογισμό των μεγεθών των εφέ (η τιμή p της τιμής καταγραφής log είναι, ωστόσο, ισοδύναμη με την τιμή p για έναν κατηγοριακό παράγοντα ενδιαφέροντος σε ένα μη μεταβλητό Cox μοντέλο).

Τα μη παραμετρικά μοντέλα είναι περιορισμένα στο ότι δεν παρέχουν εκτιμήσεις εφέ και δεν μπορούν γενικά να χρησιμοποιηθούν για την αξιολόγηση της επίδρασης πολλαπλών παραγόντων ενδιαφέροντος (μοντέλα πολλαπλών μεταβλητών). Για το λόγο αυτό, οι μη παραμετρικές προσεγγίσεις χρησιμοποιούνται συχνά σε συνδυασμό με ημι- ή πλήρως παραμετρικά μοντέλα στην επιδημιολογία, όπου τα μοντέλα πολλαπλών μεταβλητών χρησιμοποιούνται συνήθως για τον έλεγχο των συγχυτών.

Μπορούν να προσαρμοστούν οι καμπύλες Kaplan-Meier;

Είναι ένας κοινός μύθος ότι οι καμπύλες Kaplan-Meier δεν μπορούν να προσαρμοστούν και αυτό αναφέρεται συχνά ως λόγος για τη χρήση ενός παραμετρικού μοντέλου που μπορεί να δημιουργήσει καμπύλες επιβίωσης προσαρμοσμένες σε συντεταγμένες. Ωστόσο, έχει αναπτυχθεί μια μέθοδος για τη δημιουργία προσαρμοσμένων καμπυλών επιβίωσης χρησιμοποιώντας αντίστροφη στάθμιση πιθανότητας (IPW). Στην περίπτωση ενός μόνο συνδυασμού, τα IPW μπορούν να εκτιμηθούν μη παραμετρικά και είναι ισοδύναμα με την άμεση τυποποίηση των καμπυλών επιβίωσης στον πληθυσμό της μελέτης. Στην περίπτωση πολλαπλών συνδυασμών, πρέπει να χρησιμοποιηθούν ημι- ή πλήρως παραμετρικά μοντέλα για τον υπολογισμό των βαρών, τα οποία στη συνέχεια χρησιμοποιούνται για τη δημιουργία καμπυλών επιβίωσης πολλαπλών συν-ποικιλιών. Τα πλεονεκτήματα αυτής της μεθόδου είναι ότι δεν υπόκειται στην υπόθεση αναλογικών κινδύνων, μπορεί να χρησιμοποιηθεί για συντεταγμένες που ποικίλλουν χρονικά, και μπορεί επίσης να χρησιμοποιηθεί για συνεχείς συντεταγμένες.

Γιατί χρειαζόμαστε παραμετρικές προσεγγίσεις για την ανάλυση δεδομένων από χρόνο σε συμβάν;

Χρησιμοποιείται μια μη παραμετρική προσέγγιση στην ανάλυση δεδομένων TTE για την απλή περιγραφή των δεδομένων επιβίωσης σε σχέση με τον υπό εξέταση παράγοντα. Τα μοντέλα που χρησιμοποιούν αυτήν την προσέγγιση αναφέρονται επίσης ως μη διαχωρίσιμα μοντέλα. Πιο συνηθισμένα, οι ερευνητές ενδιαφέρονται για τη σχέση μεταξύ πολλών συντεταγμένων και του χρόνου σε εκδήλωση. Η χρήση ημι- και πλήρως παραμετρικών μοντέλων επιτρέπει την ανάλυση του χρόνου στο συμβάν σε σχέση με πολλούς παράγοντες ταυτόχρονα και παρέχει εκτιμήσεις για την ισχύ του αποτελέσματος για κάθε συστατικό παράγοντα.

Τι είναι μια ημι-παραμετρική προσέγγιση και γιατί χρησιμοποιείται τόσο συχνά;

σχολή συνεχιζόμενων σπουδών

Το Cox Proportional μοντέλο είναι η πιο συχνά χρησιμοποιούμενη προσέγγιση πολλαπλών μεταβλητών για την ανάλυση δεδομένων επιβίωσης στην ιατρική έρευνα. Πρόκειται ουσιαστικά για ένα μοντέλο παλινδρόμησης χρόνου-σε-συμβάν, το οποίο περιγράφει τη σχέση μεταξύ της επίπτωσης του συμβάντος, όπως εκφράζεται από τη συνάρτηση κινδύνου, και ενός συνόλου συνδιαλλαγών. Το μοντέλο Cox γράφεται ως εξής:

συνάρτηση κινδύνου, h (t) = h0 (t) exp {β1X1 + β2X2 +… + βpXp}

Θεωρείται ημι-παραμετρική προσέγγιση επειδή το μοντέλο περιέχει ένα μη παραμετρικό στοιχείο και ένα παραμετρικό στοιχείο. Το μη παραμετρικό στοιχείο είναι ο βασικός κίνδυνος, h0 (t). Αυτή είναι η τιμή του κινδύνου όταν όλα τα συντεταγμένα είναι ίση με το 0, γεγονός που υπογραμμίζει τη σημασία του κεντραρίσματος των συνδυασμένων στο μοντέλο για ερμηνεία. Μην συγχέετε τον κίνδυνο βάσης ως τον κίνδυνο τη στιγμή 0. Η συνάρτηση κινδύνου βάσης εκτιμάται μη παραμετρικά, και έτσι σε αντίθεση με τα περισσότερα άλλα στατιστικά μοντέλα, οι χρόνοι επιβίωσης δεν θεωρείται ότι ακολουθούν μια συγκεκριμένη στατιστική κατανομή και το σχήμα της γραμμής βάσης ο κίνδυνος είναι αυθαίρετος. Η βασική συνάρτηση κινδύνου δεν χρειάζεται να εκτιμηθεί για να γίνουν συμπεράσματα σχετικά με τον σχετικό κίνδυνο ή την αναλογία κινδύνου. Αυτό το χαρακτηριστικό καθιστά το μοντέλο Cox πιο στιβαρό από τις παραμετρικές προσεγγίσεις, επειδή δεν είναι ευάλωτο σε λάθος προσδιορισμό του βασικού κινδύνου.

Η παραμετρική συνιστώσα αποτελείται από τον συνδιαμεταφορέα. Ο συνδυασμός φορέων πολλαπλασιάζει τον βασικό κίνδυνο με την ίδια ποσότητα ανεξάρτητα από το χρόνο, επομένως το αποτέλεσμα οποιουδήποτε συνδυασμού είναι το ίδιο ανά πάσα στιγμή κατά τη διάρκεια της παρακολούθησης, και αυτή είναι η βάση για την παραδοχή των αναλογικών κινδύνων.

Ποια είναι η υπόθεση αναλογικών κινδύνων;

Η παραδοχή αναλογικών κινδύνων είναι ζωτικής σημασίας για τη χρήση και την ερμηνεία ενός μοντέλου Cox.

Σύμφωνα με αυτήν την υπόθεση, υπάρχει μια σταθερή σχέση μεταξύ του αποτελέσματος ή της εξαρτώμενης μεταβλητής και του συντεταγμένου φορέα. Οι συνέπειες αυτής της υπόθεσης είναι ότι οι λειτουργίες κινδύνου για δύο άτομα είναι ανάλογες ανά πάσα στιγμή και ο λόγος κινδύνου δεν ποικίλλει ανάλογα με το χρόνο. Με άλλα λόγια, εάν ένα άτομο έχει κίνδυνο θανάτου σε κάποιο αρχικό χρονικό σημείο που είναι διπλάσιο από αυτόν ενός άλλου ατόμου, τότε σε κάθε μεταγενέστερο χρονικό σημείο ο κίνδυνος θανάτου παραμένει διπλάσιος. Αυτή η υπόθεση υπονοεί ότι οι καμπύλες κινδύνου για τις ομάδες πρέπει να είναι ανάλογες και να μην υπερβαίνουν. Επειδή αυτή η υπόθεση είναι τόσο σημαντική, πρέπει σίγουρα να δοκιμαστεί.

Πώς ελέγχετε την υπόθεση αναλογικών κινδύνων;

Υπάρχει μια ποικιλία τεχνικών, τόσο βάσει γραφικών όσο και βάσει δοκιμών, για την αξιολόγηση της εγκυρότητας της παραδοχής των αναλογικών κινδύνων. Μια τεχνική είναι να σχεδιάσετε απλώς τις καμπύλες επιβίωσης Kaplan – Meier εάν συγκρίνετε δύο ομάδες χωρίς συντεταγμένες. Εάν οι καμπύλες διασταυρώνονται, ενδέχεται να παραβιαστεί η υπόθεση αναλογικών κινδύνων. Μια σημαντική προειδοποίηση για αυτήν την προσέγγιση πρέπει να ληφθεί υπόψη για μικρές μελέτες. Μπορεί να υπάρχει μεγάλη ποσότητα σφάλματος που σχετίζεται με την εκτίμηση των καμπυλών επιβίωσης για μελέτες με μικρό μέγεθος δείγματος, επομένως οι καμπύλες μπορεί να διασταυρωθούν ακόμη και όταν ικανοποιείται η υπόθεση αναλογικών κινδύνων. Το συμπληρωματικό λογότυπο log-log είναι μια πιο ισχυρή δοκιμή που απεικονίζει τον λογάριθμο του αρνητικού λογάριθμου της εκτιμώμενης λειτουργίας επιζώντος έναντι του λογάριθμου του χρόνου επιβίωσης. Εάν οι κίνδυνοι είναι ανάλογοι μεταξύ ομάδων, αυτή η πλοκή θα παράγει παράλληλες καμπύλες. Μια άλλη κοινή μέθοδος για τη δοκιμή της παραδοχής αναλογικών κινδύνων είναι να συμπεριληφθεί ένας όρος χρονικής αλληλεπίδρασης για να προσδιοριστεί εάν το HR αλλάζει με την πάροδο του χρόνου, καθώς ο χρόνος είναι συχνά ο ένοχος για μη αναλογικότητα των κινδύνων. Η απόδειξη ότι ο όρος χρονικής αλληλεπίδρασης της ομάδας * δεν είναι μηδενική αποτελεί ένδειξη έναντι αναλογικών κινδύνων.

Τι γίνεται αν η παραδοχή αναλογικών κινδύνων δεν ισχύει;

Εάν διαπιστώσετε ότι η υπόθεση PH δεν ισχύει, δεν χρειάζεται απαραίτητα να εγκαταλείψετε τη χρήση του μοντέλου Cox. Υπάρχουν επιλογές για τη βελτίωση της μη αναλογικότητας στο μοντέλο. Για παράδειγμα, μπορείτε να συμπεριλάβετε και άλλα συντεταγμένα στο μοντέλο, είτε νέα συντεταγμένα, μη γραμμικούς όρους για υπάρχουσες συνδιαλλαγές, είτε αλληλεπιδράσεις μεταξύ συνδιαβατών. Ή μπορείτε να στρωματοποιήσετε την ανάλυση σε μία ή περισσότερες μεταβλητές. Αυτό υπολογίζει ένα μοντέλο στο οποίο ο βασικός κίνδυνος επιτρέπεται να είναι διαφορετικός σε κάθε στρώμα, αλλά τα συντεταγμένα αποτελέσματα είναι ίδια στα στρώματα. Άλλες επιλογές περιλαμβάνουν τη διαίρεση του χρόνου σε κατηγορίες και τη χρήση μεταβλητών δεικτών για να επιτρέπεται η αναλογία κινδύνου να ποικίλλει με την πάροδο του χρόνου και η αλλαγή της χρονικής μεταβλητής ανάλυσης (π.χ. από το παρελθόν χρόνο στην ηλικία ή το αντίστροφο).

Πώς εξετάζετε την εφαρμογή του ημι-παραμετρικού μοντέλου;

Εκτός από τον έλεγχο παραβιάσεων της παραδοχής αναλογικότητας, υπάρχουν και άλλες πτυχές του μοντέλου που πρέπει να εξεταστούν. Στατιστικά παρόμοια με αυτά που χρησιμοποιούνται στη γραμμική και λογιστική παλινδρόμηση μπορούν να εφαρμοστούν για την εκτέλεση αυτών των εργασιών για μοντέλα Cox με κάποιες διαφορές, αλλά οι βασικές ιδέες είναι οι ίδιες και στις τρεις ρυθμίσεις. Είναι σημαντικό να ελέγξετε τη γραμμικότητα του συνδυασμένου φορέα, το οποίο μπορεί να γίνει εξετάζοντας τα υπολείμματα, όπως κάνουμε στη γραμμική παλινδρόμηση. Ωστόσο, τα υπολείμματα στα δεδομένα TTE δεν είναι τόσο απλά όσο είναι σε γραμμική παλινδρόμηση, εν μέρει επειδή η αξία του αποτελέσματος είναι άγνωστη για ορισμένα από τα δεδομένα και τα υπολείμματα είναι συχνά λοξά. Έχουν αναπτυχθεί διάφοροι τύποι υπολειμμάτων προκειμένου να αξιολογηθεί το κατάλληλο μοντέλο Cox για δεδομένα TTE. Στα παραδείγματα περιλαμβάνονται οι Martingale και Schoenfeld, μεταξύ άλλων. Μπορείτε επίσης να δείτε τα υπολείμματα για να εντοπίσετε παρατηρήσεις με μεγάλη επιρροή και κακή εφαρμογή. Υπάρχουν επίσης δοκιμές καλής προσαρμογής που αφορούν συγκεκριμένα τα μοντέλα Cox, όπως το τεστ Gronnesby και Borgan, και το προγνωστικό δείκτη Hosmer και Lemeshow. Μπορείτε επίσης να χρησιμοποιήσετε το AIC για να συγκρίνετε διαφορετικά μοντέλα, αν και η χρήση του R2 είναι προβληματική.

Γιατί να χρησιμοποιήσετε μια παραμετρική προσέγγιση;

Ένα από τα κύρια πλεονεκτήματα των ημι-παραμετρικών μοντέλων είναι ότι ο βασικός κίνδυνος δεν χρειάζεται να προσδιοριστεί προκειμένου να εκτιμηθούν οι λόγοι κινδύνου που περιγράφουν τις διαφορές στον σχετικό κίνδυνο μεταξύ ομάδων. Εντούτοις, μπορεί να είναι ενδιαφέρουσα η εκτίμηση του ίδιου του βασικού κινδύνου. Σε αυτήν την περίπτωση, είναι απαραίτητη μια παραμετρική προσέγγιση. Στις παραμετρικές προσεγγίσεις, προσδιορίζονται τόσο η λειτουργία κινδύνου όσο και η επίδραση των συντεταγμένων. Η συνάρτηση κινδύνου εκτιμάται βάσει μιας υποτιθέμενης κατανομής στον υποκείμενο πληθυσμό.

Τα πλεονεκτήματα της χρήσης μιας παραμετρικής προσέγγισης στην ανάλυση επιβίωσης είναι:

  • Οι παραμετρικές προσεγγίσεις είναι πιο ενημερωτικές από τις μη και ημι-παραμετρικές προσεγγίσεις. Εκτός από τον υπολογισμό των σχετικών εκτιμήσεων επιπτώσεων, μπορούν επίσης να χρησιμοποιηθούν για την πρόβλεψη του χρόνου επιβίωσης, των ποσοστών κινδύνου και των μέσων και μέσων χρόνων επιβίωσης. Μπορούν επίσης να χρησιμοποιηθούν για να κάνουν απόλυτες προβλέψεις κινδύνου με την πάροδο του χρόνου και να σχεδιάσουν καμπύλες επιβίωσης προσαρμοσμένες σε συνδιακύμανση.

  • Όταν η παραμετρική μορφή έχει καθοριστεί σωστά, τα παραμετρικά μοντέλα έχουν περισσότερη ισχύ από τα ημι-παραμετρικά μοντέλα. Είναι επίσης πιο αποτελεσματικά, οδηγώντας σε μικρότερα τυπικά σφάλματα και ακριβέστερες εκτιμήσεις.

  • Οι παραμετρικές προσεγγίσεις βασίζονται στην πλήρη μέγιστη πιθανότητα εκτίμησης παραμέτρων.

  • Τα υπολείμματα παραμετρικών μοντέλων έχουν τη γνωστή μορφή της διαφοράς στο παρατηρούμενο έναντι του αναμενόμενου.

Το κύριο μειονέκτημα της χρήσης μιας παραμετρικής προσέγγισης είναι ότι βασίζεται στην υπόθεση ότι η υποκείμενη κατανομή του πληθυσμού έχει καθοριστεί σωστά. Τα παραμετρικά μοντέλα δεν είναι ισχυρά ως προς την εσφαλμένη προδιαγραφή, γι 'αυτό τα ημι-παραμετρικά μοντέλα είναι πιο κοινά στη βιβλιογραφία και είναι λιγότερο επικίνδυνα να χρησιμοποιηθούν όταν υπάρχει αβεβαιότητα σχετικά με την υποκείμενη κατανομή του πληθυσμού.

Πώς επιλέγετε την παραμετρική φόρμα;

Η επιλογή της κατάλληλης παραμετρικής μορφής είναι το πιο δύσκολο μέρος της παραμετρικής ανάλυσης επιβίωσης. Η προδιαγραφή της παραμετρικής μορφής θα πρέπει να βασίζεται στην υπόθεση της μελέτης, μαζί με προηγούμενες γνώσεις και βιολογική λογική του σχήματος του βασικού κινδύνου. Για παράδειγμα, εάν είναι γνωστό ότι ο κίνδυνος θανάτου αυξάνεται δραματικά αμέσως μετά τη χειρουργική επέμβαση και στη συνέχεια μειώνεται και ισοπεδώνεται, θα ήταν ακατάλληλο να προσδιοριστεί η εκθετική κατανομή, η οποία αναλαμβάνει έναν συνεχή κίνδυνο με την πάροδο του χρόνου. Τα δεδομένα μπορούν να χρησιμοποιηθούν για να εκτιμηθεί εάν η συγκεκριμένη φόρμα φαίνεται να ταιριάζει στα δεδομένα, αλλά αυτές οι μέθοδοι βάσει δεδομένων πρέπει να συμπληρώνουν, όχι να αντικαθιστούν, υπολογιζόμενες από υποθέσεις επιλογές.

Ποια είναι η διαφορά μεταξύ ενός μοντέλου αναλογικών κινδύνων και ενός μοντέλου επιταχυνόμενου χρόνου αστοχίας;

Αν και το μοντέλο αναλογικών κινδύνων Cox είναι ημι-παραμετρικό, τα μοντέλα αναλογικών κινδύνων μπορούν επίσης να είναι παραμετρικά. Τα παραμετρικά μοντέλα αναλογικών κινδύνων μπορούν να γραφτούν ως:

h (t, X) = h0 (t) exp (Xi β) = h0 (t) λ

όπου ο βασικός κίνδυνος, h0 (t), εξαρτάται μόνο από το χρόνο, t, αλλά όχι από το X, και το λ είναι μια συνάρτηση ειδικής μονάδας συνδιακύμανσης, η οποία δεν εξαρτάται από το t, που κλιμακώνει τη λειτουργία κινδύνου βάσης πάνω ή κάτω. Το λ δεν μπορεί να είναι αρνητικό. Σε αυτό το μοντέλο, το ποσοστό κινδύνου είναι μια πολλαπλασιαστική συνάρτηση του βασικού κινδύνου και οι λόγοι κινδύνου μπορούν να ερμηνευθούν με τον ίδιο τρόπο όπως στο ημι-παραμετρικό μοντέλο αναλογικών κινδύνων.

Τα μοντέλα Accelerated Time Failure (AFT) είναι μια κατηγορία παραμετρικών μοντέλων επιβίωσης που μπορούν να ευθυγραμμιστούν λαμβάνοντας το φυσικό ημερολόγιο του μοντέλου χρόνου επιβίωσης. Το απλούστερο παράδειγμα ενός μοντέλου AFT είναι το εκθετικό μοντέλο, το οποίο γράφεται ως:

ln(T) = β0 + β1X1+….+ βpXp + ε*

Η κύρια διαφορά μεταξύ των μοντέλων AFT και των μοντέλων PH είναι ότι τα μοντέλα AFT υποθέτουν ότι τα εφέ των συνδιακύμαντων είναι πολλαπλασιαστικά σε κλίμακα χρόνου, ενώ τα μοντέλα Cox χρησιμοποιούν την κλίμακα κινδύνου όπως φαίνεται παραπάνω. Οι εκτιμήσεις παραμέτρων από τα μοντέλα AFT ερμηνεύονται ως εφέ στη χρονική κλίμακα, η οποία μπορεί είτε να επιταχύνει είτε να επιβραδύνει τον χρόνο επιβίωσης. Exp (β)> 1 από ένα μοντέλο AFT σημαίνει ότι ο παράγοντας επιταχύνει τον χρόνο επιβίωσης ή οδηγεί σε μεγαλύτερη επιβίωση. Λήξη (β)<1 decelerates survival time (shorter survival). AFT models assume that estimated time ratios are constant across the time scale. A time ratio of 2, for example, can be interpreted as the median time to death in group 1 is double the median time to death in group 2 (indicated longer survival for group 1).

Ορισμένες κατανομές σφαλμάτων μπορούν να γραφτούν και να ερμηνευθούν ως μοντέλα PH και AFT (π.χ. εκθετικά, Weibull), άλλα είναι μόνο PH (δηλ. Gompertz) ή μόνο μοντέλα AFT (δηλ. Log-logistic) και άλλα δεν είναι μοντέλα PH ή AFT (δηλ. τοποθέτηση ύπνου).

Τι μορφές μπορούν να υποθέσουν τα παραμετρικά μοντέλα;

Η συνάρτηση κινδύνου μπορεί να έχει οποιαδήποτε μορφή αρκεί το h (t)> 0 για όλες τις τιμές του t. Ενώ το πρωταρχικό μέλημα για την παραμετρική μορφή πρέπει να είναι η προηγούμενη γνώση του σχήματος του βασικού κινδύνου, κάθε κατανομή έχει τα δικά της πλεονεκτήματα και μειονεκτήματα. Μερικές από τις πιο κοινές φόρμες θα εξηγηθούν εν συντομία, με περισσότερες πληροφορίες διαθέσιμες στη λίστα πόρων.

Εκθετική κατανομή

Η εκθετική κατανομή προϋποθέτει ότι το h (t) εξαρτάται μόνο από τους συντελεστές του μοντέλου και τα συντεταγμένα και είναι σταθερό με την πάροδο του χρόνου. Το κύριο πλεονέκτημα αυτού του μοντέλου είναι ότι είναι και ένα μοντέλο αναλογικού κινδύνου και ένα μοντέλο επιταχυνόμενου χρόνου αστοχίας, έτσι ώστε οι εκτιμήσεις των επιπτώσεων να μπορούν να ερμηνευθούν είτε ως λόγοι κινδύνου είτε ως λόγοι χρόνου. Το κύριο μειονέκτημα αυτού του μοντέλου είναι ότι είναι συχνά αδικαιολόγητο να αναλαμβάνουμε σταθερό κίνδυνο με την πάροδο του χρόνου.

Διανομή Weibull

Η κατανομή Weibull είναι παρόμοια με την εκθετική κατανομή. Ενώ η εκθετική κατανομή αναλαμβάνει έναν σταθερό κίνδυνο, η κατανομή Weibull αναλαμβάνει έναν μονοτονικό κίνδυνο που μπορεί είτε να αυξάνεται είτε να μειώνεται αλλά όχι και τα δύο. Έχει δύο παραμέτρους. Η παράμετρος σχήματος (σ) ελέγχει εάν ο κίνδυνος αυξάνεται (σ1) (στην εκθετική κατανομή, αυτή η παράμετρος έχει οριστεί σε 1). Η παράμετρος κλίμακας, (1 / σ) exp (-β0 / σ), καθορίζει την κλίμακα αυτής της αύξησης / μείωσης. Δεδομένου ότι η κατανομή Weibull απλοποιείται στην εκθετική κατανομή όταν σ = 1, η μηδενική υπόθεση ότι σ = 1 μπορεί να δοκιμαστεί χρησιμοποιώντας μια δοκιμή Wald. Το κύριο πλεονέκτημα αυτού του μοντέλου είναι ότι είναι και ένα μοντέλο PH και AFT, επομένως μπορούν να εκτιμηθούν τόσο οι λόγοι κινδύνου όσο και οι λόγοι χρόνου. Και πάλι, το κύριο μειονέκτημα είναι ότι η υπόθεση της μονοτονικότητας του βασικού κινδύνου μπορεί να είναι αβάσιμη σε ορισμένες περιπτώσεις.

Διανομή Gompertz

Η κατανομή Gompertz είναι ένα μοντέλο PH που ισούται με την κατανομή log-Weibull, οπότε το αρχείο καταγραφής της συνάρτησης κινδύνου είναι γραμμικό σε t. Αυτή η κατανομή έχει ένα εκθετικά αυξανόμενο ποσοστό αποτυχίας και είναι συχνά κατάλληλο για αναλογιστικά δεδομένα, καθώς ο κίνδυνος θνησιμότητας αυξάνεται επίσης εκθετικά με την πάροδο του χρόνου.

Κατανομή Log-Logistic

Η διανομή log-logistic είναι ένα μοντέλο AFT με όρο σφάλματος που ακολουθεί την τυπική διανομή logistic. Μπορεί να ταιριάζει σε μη μονοτονικούς κινδύνους και γενικά ταιριάζει καλύτερα όταν ο υποκείμενος κίνδυνος ανεβαίνει σε μια κορυφή και έπειτα πέσει, κάτι που μπορεί να είναι εύλογο για ορισμένες ασθένειες όπως η φυματίωση. Η διανομή log-logistic δεν είναι μοντέλο PH, αλλά είναι μοντέλο αναλογικής απόδοσης. Αυτό σημαίνει ότι υπόκειται στην παραδοχή αναλογικών αποδόσεων, αλλά το πλεονέκτημα είναι ότι οι συντελεστές κλίσης μπορούν να ερμηνευθούν ως λόγοι χρόνου και επίσης ως λόγοι αποδόσεων. Ένας λόγος πιθανότητας 2 από ένα παραμετρικό λογαριθμικό μοντέλο, για παράδειγμα, θα ερμηνευόταν ως οι πιθανότητες επιβίωσης πέραν του χρόνου t μεταξύ των ατόμων με x = 1 είναι διπλάσιες από τις πιθανότητες μεταξύ των ατόμων με x = 0.

Γενικευμένη κατανομή γάμμα (GG)

Η γενικευμένη κατανομή γάμμα (GG) είναι στην πραγματικότητα μια οικογένεια διανομών που περιέχει σχεδόν όλες τις πιο συχνά χρησιμοποιούμενες διανομές, συμπεριλαμβανομένων των εκθετικών, Weibull, log normal και gamma. Αυτό επιτρέπει συγκρίσεις μεταξύ των διαφόρων κατανομών. Η οικογένεια GG περιλαμβάνει επίσης και τους τέσσερις από τους πιο συνηθισμένους τύπους λειτουργιών κινδύνου, γεγονός που καθιστά την κατανομή GG ιδιαίτερα χρήσιμη καθώς το σχήμα της λειτουργίας κινδύνου μπορεί να βοηθήσει στη βελτιστοποίηση της επιλογής μοντέλου.

Προσέγγιση Splines

Δεδομένου ότι ο μόνος γενικός περιορισμός της προδιαγραφής της συνάρτησης κινδύνου βάσης είναι thath (t)> 0 για όλες τις τιμές του t, μπορούν να χρησιμοποιηθούν splines για μέγιστη ευελιξία στη μοντελοποίηση του σχήματος του κινδύνου βάσης. Οι περιορισμένες κυβικές σφήνες είναι μια μέθοδος που έχει πρόσφατα προταθεί στη βιβλιογραφία για ανάλυση παραμετρικής επιβίωσης, καθώς αυτή η μέθοδος επιτρέπει ευελιξία στο σχήμα, αλλά περιορίζει τη λειτουργία να είναι γραμμική σε άκρα όπου τα δεδομένα είναι αραιά. Τα splines μπορούν να χρησιμοποιηθούν για τη βελτίωση της εκτίμησης και είναι επίσης πλεονεκτικά για την παρέκταση, καθώς μεγιστοποιούν την προσαρμογή στα παρατηρούμενα δεδομένα. Εάν προσδιοριστεί σωστά, οι εκτιμήσεις εφέ από μοντέλα που εφαρμόζουν χρησιμοποιώντας splines δεν θα πρέπει να είναι προκατειλημμένες. Όπως και σε άλλες αναλύσεις παλινδρόμησης, οι προκλήσεις στην τοποθέτηση splines μπορεί να περιλαμβάνουν την επιλογή του αριθμού και της θέσης των κόμβων και ζητήματα με την υπερβολική προσαρμογή.

Πώς εξετάζετε την παραμετρική εφαρμογή;

Το πιο σημαντικό στοιχείο της αξιολόγησης της παραμετρικής προσαρμογής του μοντέλου είναι να ελέγξετε αν τα δεδομένα υποστηρίζουν την καθορισμένη παραμετρική φόρμα. Αυτό μπορεί να εκτιμηθεί οπτικά με γραφική παράσταση του αθροιστικού κινδύνου βάσει μοντέλου έναντι της εκτιμώμενης λειτουργίας αθροιστικού κινδύνου Kaplan-Meier. Εάν η καθορισμένη φόρμα είναι σωστή, το γράφημα θα πρέπει να περάσει από την προέλευση με κλίση 1. Η δοκιμή Grønnesby-Borgan good-of-fit μπορεί επίσης να χρησιμοποιηθεί για το αν ο παρατηρούμενος αριθμός συμβάντων είναι σημαντικά διαφορετικός από τον αναμενόμενο αριθμό συμβάντων σε ομάδες που διαφοροποιούνται από τις βαθμολογίες κινδύνου. Αυτό το τεστ είναι πολύ ευαίσθητο στον αριθμό των ομάδων που επιλέχθηκαν, και τείνει να απορρίψει την μηδενική υπόθεση της επαρκούς προσαρμογής πολύ ελεύθερα εάν επιλεγούν πολλές ομάδες, ειδικά σε μικρά σύνολα δεδομένων. Η δοκιμή δεν έχει ισχύ για τον εντοπισμό παραβιάσεων μοντέλου, ωστόσο, εάν έχουν επιλεγεί πάρα πολλές ομάδες. Για αυτόν τον λόγο, φαίνεται ανεπιθύμητο να βασίζεστε μόνο σε μια δοκιμή καλής προσαρμογής για να προσδιορίσετε εάν η καθορισμένη παραμετρική φόρμα είναι λογική.

Το AIC μπορεί επίσης να χρησιμοποιηθεί για τη σύγκριση μοντέλων που εκτελούνται με διαφορετικές παραμετρικές φόρμες, με το χαμηλότερο ενδεικτικό AIC για την καλύτερη εφαρμογή. Το AIC δεν μπορεί να χρησιμοποιηθεί για σύγκριση παραμετρικών και ημι-παραμετρικών μοντέλων, ωστόσο, δεδομένου ότι τα παραμετρικά μοντέλα βασίζονται στους παρατηρούμενους χρόνους συμβάντων και τα ημι-παραμετρικά μοντέλα βασίζονται στη σειρά των χρόνων συμβάντων. Και πάλι, αυτά τα εργαλεία θα πρέπει να χρησιμοποιηθούν για να εξεταστεί αν η συγκεκριμένη φόρμα ταιριάζει στα δεδομένα, αλλά η λογική του συγκεκριμένου υποκείμενου κινδύνου εξακολουθεί να είναι η πιο σημαντική πτυχή της επιλογής μιας παραμετρικής φόρμας.

Μόλις προσδιοριστεί η καθορισμένη παραμετρική μορφή ώστε να ταιριάζει καλά στα δεδομένα, παρόμοιες μέθοδοι με εκείνες που περιγράφηκαν προηγουμένως για ημι-αναλογικά μοντέλα κινδύνου μπορούν να χρησιμοποιηθούν για την επιλογή μεταξύ διαφορετικών μοντέλων, όπως υπολειπόμενα οικόπεδα και δοκιμές καλής προσαρμογής.

Τι γίνεται αν οι προβλέψεις αλλάξουν με την πάροδο του χρόνου;

Στα πρότυπα δηλώσεις που γράφτηκαν παραπάνω, έχουμε υποθέσει ότι τα ανοίγματα είναι σταθερά κατά τη διάρκεια της παρακολούθησης. Τα ανοίγματα με τιμές που αλλάζουν με την πάροδο του χρόνου ή ποικίλες χρονικές διαφορές, μπορούν να συμπεριληφθούν σε μοντέλα επιβίωσης αλλάζοντας τη μονάδα ανάλυσης από το άτομο σε χρονική περίοδο που η έκθεση είναι σταθερή. Αυτό διασπά τον χρόνο-ατόμου των ατόμων σε διαστήματα που κάθε άτομο συμβάλλει στο σύνολο κινδύνου του εκτεθειμένου και του μη εκτεθειμένου για αυτό το συνδιακύμανση. Η βασική παραδοχή της συμπερίληψης ενός χρονικά μεταβαλλόμενου συνδυασμού με αυτόν τον τρόπο είναι ότι η επίδραση του χρονικά μεταβαλλόμενου συνδυασμού δεν εξαρτάται από το χρόνο.

Για ένα μοντέλο αναλογικού κινδύνου Cox, η συμπερίληψη ενός ποικίλου χρονικού διακύμανσης θα έχει τη μορφή: h (t) = h0 (t) e ^ β1x1 (t). Οι χρονικά ποικίλες συντεταγμένες μπορούν επίσης να συμπεριληφθούν σε παραμετρικά μοντέλα, αν και είναι λίγο πιο περίπλοκο και δύσκολο να ερμηνευθεί. Τα παραμετρικά μοντέλα μπορούν επίσης να μοντελοποιήσουν ποικίλες χρονικές συντεταγμένες χρησιμοποιώντας splines για μεγαλύτερη ευελιξία.

Σε γενικές γραμμές, οι χρονικά μεταβαλλόμενες συντεταγμένες θα πρέπει να χρησιμοποιούνται όταν υποτίθεται ότι ο κίνδυνος εξαρτάται περισσότερο από τις μεταγενέστερες τιμές του συνδιαμορφωμένου από την τιμή του συνδιακύμανσης κατά την έναρξη. Οι προκλήσεις που προκύπτουν με χρονικά μεταβαλλόμενες συντεταγμένες λείπουν δεδομένα σχετικά με την συνδιακύμανση σε διαφορετικά χρονικά σημεία και μια πιθανή μεροληψία για την εκτίμηση του κινδύνου, εάν το χρονικά μεταβαλλόμενο συντελεστή είναι στην πραγματικότητα μεσολαβητής.

Τι είναι η ανταγωνιστική ανάλυση κινδύνων;

Οι παραδοσιακές μέθοδοι ανάλυσης επιβίωσης υποθέτουν ότι συμβαίνει μόνο ένας τύπος γεγονότος ενδιαφέροντος. Ωστόσο, υπάρχουν πιο προηγμένες μέθοδοι που επιτρέπουν τη διερεύνηση διαφόρων τύπων συμβάντων στην ίδια μελέτη, όπως ο θάνατος από πολλαπλές αιτίες. Ανταγωνιστική ανάλυση κινδύνων χρησιμοποιείται για αυτές τις μελέτες στις οποίες η διάρκεια επιβίωσης τελειώνει με την πρώτη από πολλές εκδηλώσεις. Απαιτούνται ειδικές μέθοδοι επειδή η ανάλυση του χρόνου σε κάθε συμβάν ξεχωριστά μπορεί να προκαταλάβει. Συγκεκριμένα σε αυτό το πλαίσιο, η μέθοδος KM τείνει να υπερεκτιμά το ποσοστό των ατόμων που βιώνουν συμβάντα. Η ανταγωνιστική ανάλυση κινδύνων χρησιμοποιεί τη μέθοδο της αθροιστικής επίπτωσης, στην οποία η συνολική πιθανότητα συμβάντος ανά πάσα στιγμή είναι το άθροισμα των πιθανοτήτων για το συγκεκριμένο συμβάν. Τα μοντέλα εφαρμόζονται γενικά εισάγοντας κάθε συμμετέχοντα στη μελέτη αρκετές φορές - ένα ανά τύπο συμβάντος. Για κάθε συμμετέχοντα στη μελέτη, ο χρόνος σε οποιοδήποτε συμβάν λογοκρίνεται τη στιγμή κατά την οποία ο ασθενής παρουσίασε το πρώτο συμβάν. Για περισσότερες πληροφορίες, ανατρέξτε στη σελίδα Advancedepidemiology.org στη διεύθυνση ανταγωνιστικοί κίνδυνοι .

Ποια είναι τα αδύναμα μοντέλα και γιατί είναι χρήσιμα για συσχετισμένα δεδομένα;

Τα συσχετιζόμενα δεδομένα επιβίωσης μπορεί να προκύψουν λόγω επαναλαμβανόμενων γεγονότων που βιώνει ένα άτομο ή όταν οι παρατηρήσεις συγκεντρώνονται σε ομάδες. Είτε λόγω έλλειψης γνώσεων είτε για σκοπιμότητα, ορισμένες συντεταγμένες που σχετίζονται με το γεγονός ενδιαφέροντος ενδέχεται να μην μετρηθούν. Τα μοντέλα αδυναμίας αντιπροσωπεύουν την ετερογένεια που προκαλείται από μη μετρημένες συντεταγμένες προσθέτοντας τυχαία εφέ, τα οποία δρουν πολλαπλασιαστικά στη λειτουργία κινδύνου. Τα εύθραυστα μοντέλα είναι ουσιαστικά επεκτάσεις του μοντέλου Cox με την προσθήκη τυχαίων εφέ. Παρόλο που υπάρχουν διάφορα σχήματα ταξινόμησης και ονοματολογία που χρησιμοποιούνται για την περιγραφή αυτών των μοντέλων, τέσσερις συνήθεις τύποι μοντέλων αδυναμίας περιλαμβάνουν κοινόχρηστο, ένθετο, κοινόχρηστο και πρόσθετο εύθραυστο.

Υπάρχουν άλλες προσεγγίσεις για την ανάλυση επαναλαμβανόμενων δεδομένων συμβάντων;

Τα δεδομένα επαναλαμβανόμενων συμβάντων συσχετίζονται, καθώς ενδέχεται να προκύψουν πολλαπλά συμβάντα εντός του ίδιου θέματος. Ενώ τα εύθραυστα μοντέλα είναι μια μέθοδος για τον υπολογισμό αυτού του συσχετισμού σε επαναλαμβανόμενες αναλύσεις συμβάντων, μια πιο απλή προσέγγιση που μπορεί επίσης να εξηγήσει αυτήν τη συσχέτιση είναι η χρήση ισχυρών τυπικών σφαλμάτων (SE). Με την προσθήκη ισχυρών SE, η επαναλαμβανόμενη ανάλυση συμβάντων μπορεί να γίνει ως απλή επέκταση είτε ημι-παραμετρικών είτε παραμετρικών μοντέλων.

Αν και είναι εύκολο να εφαρμοστούν, υπάρχουν πολλοί τρόποι μοντελοποίησης επαναλαμβανόμενων δεδομένων συμβάντων χρησιμοποιώντας ισχυρά SE. Αυτές οι προσεγγίσεις διαφέρουν ως προς τον τρόπο καθορισμού του κινδύνου που ορίζεται για κάθε επανάληψη. Με αυτόν τον τρόπο, απαντούν σε ελαφρώς διαφορετικές ερωτήσεις μελέτης, οπότε η επιλογή της προσέγγισης μοντελοποίησης που θα πρέπει να βασίζεται στην υπόθεση της μελέτης και την εγκυρότητα των υποθέσεων μοντελοποίησης.

Η διαδικασία μέτρησης, ή η προσέγγιση Andersen-Gill, για επαναλαμβανόμενη μοντελοποίηση συμβάντων προϋποθέτει ότι κάθε επανάληψη είναι ανεξάρτητο συμβάν και δεν λαμβάνει υπόψη τη σειρά ή τον τύπο του συμβάντος. Σε αυτό το μοντέλο, ο χρόνος παρακολούθησης για κάθε θέμα ξεκινά στην αρχή της μελέτης και χωρίζεται σε τμήματα που ορίζονται από γεγονότα (υποτροπές). Τα θέματα συμβάλλουν στον καθορισμένο κίνδυνο για ένα συμβάν, υπό την προϋπόθεση ότι παρακολουθούνται εκείνη τη στιγμή (δεν λογοκρίνονται). Αυτά τα μοντέλα είναι απλά προσαρμοσμένα ως μοντέλο Cox με την προσθήκη ενός ισχυρού εκτιμητή SE και οι λόγοι κινδύνου ερμηνεύονται ως η επίδραση της συνδιακύμανσης στο ποσοστό υποτροπής κατά την περίοδο παρακολούθησης. Αυτό το μοντέλο θα ήταν ακατάλληλο, ωστόσο, εάν η υπόθεση ανεξαρτησίας δεν είναι λογική.

Οι υπό όρους προσεγγίσεις υποθέτουν ότι ένα θέμα δεν κινδυνεύει για ένα επόμενο συμβάν έως ότου συμβεί ένα προηγούμενο συμβάν και συνεπώς λαμβάνει υπόψη τη σειρά των συμβάντων. Είναι κατάλληλα χρησιμοποιώντας ένα στρωματοποιημένο μοντέλο, με τον αριθμό συμβάντος (ή τον αριθμό επανάληψης, σε αυτήν την περίπτωση), ως μεταβλητή στρωμάτων και συμπεριλαμβανομένων των ισχυρών SE. Υπάρχουν δύο διαφορετικές προσεγγίσεις υπό όρους που χρησιμοποιούν διαφορετικές χρονικές κλίμακες, και ως εκ τούτου έχουν διαφορετικά σύνολα κινδύνου. Η προσέγγιση υπό όρους πιθανότητας χρησιμοποιεί τον χρόνο από την αρχή της μελέτης για να καθορίσει τα χρονικά διαστήματα και είναι κατάλληλη όταν το ενδιαφέρον βρίσκεται σε πλήρη πορεία της διαδικασίας του επαναλαμβανόμενου συμβάντος. Η προσέγγιση χρόνου κενού επαναφέρει ουσιαστικά το ρολόι για κάθε επανάληψη χρησιμοποιώντας το χρόνο από το προηγούμενο συμβάν για τον καθορισμό χρονικών διαστημάτων, και είναι καταλληλότερη όταν ενδιαφέρουν συμβάντα (ή υποτροπές) - ειδικές εκτιμήσεις εφέ.

Τέλος, οι οριακές προσεγγίσεις (επίσης γνωστές ως WLW - Wei, Lin και Weissfeld - προσέγγιση) θεωρούν κάθε γεγονός ως ξεχωριστή διαδικασία, επομένως τα θέματα διατρέχουν κίνδυνο για όλα τα γεγονότα από την αρχή της παρακολούθησης, ανεξάρτητα από το εάν έχουν βιώσει προηγούμενη εκδήλωση. Αυτό το μοντέλο είναι κατάλληλο όταν τα γεγονότα πιστεύεται ότι προκύπτουν από διαφορετικές υποκείμενες διαδικασίες, έτσι ώστε ένα άτομο να μπορεί να βιώσει ένα τρίτο συμβάν, για παράδειγμα, χωρίς να βιώσει το 1ο. Αν και αυτή η υπόθεση φαίνεται αβάσιμη με ορισμένους τύπους δεδομένων, όπως υποτροπές καρκίνου, θα μπορούσε να χρησιμοποιηθεί για να μοντελοποιήσει τις υποτροπές τραυματισμών για μια χρονική περίοδο, όταν τα άτομα θα μπορούσαν να βιώσουν διαφορετικούς τύπους τραυματισμών κατά τη χρονική περίοδο που δεν έχουν φυσική σειρά. Τα οριακά μοντέλα μπορούν επίσης να ταιριάζουν χρησιμοποιώντας στρωματοποιημένα μοντέλα με ισχυρά SE.

Αναγνώσεις

Αυτό το έργο είχε ως στόχο να περιγράψει τις μεθοδολογικές και αναλυτικές αποφάσεις που μπορεί να αντιμετωπίσει κανείς όταν εργάζεται με δεδομένα από ώρα σε εκδήλωση, αλλά σε καμία περίπτωση δεν είναι εξαντλητικό. Παρακάτω παρέχονται πόροι για να εμβαθύνουμε σε αυτά τα θέματα.

Βιβλία και κεφάλαια

Vittinghoff E, Glidden DV, Shiboski SC, McCulloch CE (2012). Μέθοδοι παλινδρόμησης στη βιοστατιστική, 2η Νέα Υόρκη, Νέα Υόρκη: Springer.

  • Εισαγωγικό κείμενο σε μοντέλα γραμμικής, λογιστικής, επιβίωσης και επαναλαμβανόμενων μετρήσεων, καλύτερο για όσους θέλουν ένα βασικό σημείο εκκίνησης.

  • Το κεφάλαιο ανάλυσης επιβίωσης παρέχει μια καλή επισκόπηση αλλά όχι βάθος. Τα παραδείγματα βασίζονται σε STATA.

Hosmer DW, Lemeshow S, Μάιος S. (2008) Ανάλυση εφαρμοσμένης επιβίωσης: Μοντελοποίηση παλινδρόμησης των δεδομένων Time-to-Event, 2η έκδοση. Hoboken, NJ: John Wiley & Sons, Inc.

  • Σε βάθος επισκόπηση των μη παραμετρικών, ημι-παραμετρικών και παραμετρικών μοντέλων Cox, η καλύτερη για εκείνες που είναι γνώστες σε άλλους τομείς στατιστικών. Οι προηγμένες τεχνικές δεν καλύπτονται σε βάθος, αλλά παρέχονται αναφορές σε άλλα ειδικά εγχειρίδια.

Kleinbaum DG, Klein M (2012). Survival Analysis: A Self-Learning Text, 3η έκδοση. Νέα Υόρκη, Νέα Υόρκη: Springer Science + Business Media, LLC

  • Εξαιρετικό εισαγωγικό κείμενο

Klein JP, Moeschberger ML (2005). Ανάλυση επιβίωσης: Τεχνικές λογοκρισίας και περικομμένων δεδομένων, 2η έκδοση. Νέα Υόρκη, Νέα Υόρκη: Springer Science + Business Media, LLC

  • Σχεδιασμένο για μεταπτυχιακούς φοιτητές, αυτό το βιβλίο παρέχει πολλά πρακτικά παραδείγματα

Therneau TM, Grambsch PM (2000). Μοντελοποίηση δεδομένων επιβίωσης: Επέκταση του μοντέλου Cox. Νέα Υόρκη, Νέα Υόρκη: Springer Science + Business Media, LLC

  • Καλή εισαγωγή στην προσέγγιση της διαδικασίας μέτρησης και στην ανάλυση συσχετισμένων δεδομένων επιβίωσης. Ο συγγραφέας έγραψε επίσης το πακέτο επιβίωσης στο R

Allison PD (2010). Ανάλυση επιβίωσης με χρήση SAS: Ένας οδηγός πρακτικής, 2η έκδοση. Cary, NC: SAS Institute

  • Ένα εξαιρετικό εφαρμοσμένο κείμενο για χρήστες SAS

Bagdonavicius V, Nikulin M (2002). Accelerated Life Models: Μοντελοποίηση και Στατιστική Ανάλυση. Boca Raton, FL: Chapman & Hall / CRC Press.

  • Καλός πόρος για περισσότερες πληροφορίες σχετικά με παραμετρικά και ημι-παραμετρικά επιταχυνόμενα μοντέλα χρόνου αστοχίας και πώς συγκρίνονται με αναλογικά μοντέλα κινδύνου

Μεθοδολογικά άρθρα

Εισαγωγικά / Επισκόπηση Άρθρα

Hougaard Ρ (1999). Βασικές αρχές των δεδομένων επιβίωσης. Βιομετρικά 55 (1): 13-22. PMID: 11318147 .

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Ανάλυση επιβίωσης μέρος Ι: βασικές έννοιες και πρώτες αναλύσεις. Br J Cancer 89 (2): 232-8. PMID: 12865907

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Ανάλυση επιβίωσης μέρος II: ανάλυση πολυμεταβλητών δεδομένων - εισαγωγή σε έννοιες και μεθόδους. Br J Cancer 89 (3): 431-6. PMID: 1288808

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Ανάλυση επιβίωσης μέρος II: ανάλυση πολυμεταβλητών δεδομένων - επιλογή ενός μοντέλου και αξιολόγηση της επάρκειας και της καταλληλότητάς του. Br J Cancer 89 (4): 605-11. PMID: 12951864

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Ανάλυση επιβίωσης μέρος IV: περαιτέρω έννοιες και μέθοδοι στην ανάλυση επιβίωσης. Br J Cancer 89 (5): 781-6. PMID: 12942105

  • Η σειρά των τεσσάρων παραπάνω άρθρων είναι μια εξαιρετική εισαγωγική επισκόπηση των μεθόδων ανάλυσης επιβίωσης που είναι εξαιρετικά καλογραμμένη και κατανοητή - συνιστάται ιδιαίτερα.

Ηλικία ως χρονική κλίμακα

Korn EL, Graubard BI, Midthune D (1997). Ανάλυση χρόνου-με-γεγονότος της διαχρονικής παρακολούθησης μιας έρευνας: επιλογή της χρονικής κλίμακας. Am J Epidemiol 145 (1): 72-80. PMID: 8982025

  • Έγγραφο που υποστηρίζει τη χρήση της ηλικίας ως χρονικής κλίμακας και όχι ως χρόνου μελέτης.

Ingram DD, Makuc DM, Feldman JJ (1997). Re: Ανάλυση χρόνου-με-γεγονότος της διαχρονικής παρακολούθησης μιας έρευνας: επιλογή της χρονικής κλίμακας. Am J Epidemiol 146 (6): 528-9. PMID: 9290515 .

  • Σχολιάστε στο χαρτί Korn που περιγράφει τις προφυλάξεις που πρέπει να ληφθούν όταν χρησιμοποιείτε την ηλικία ως το χρονικό διάστημα.

Thiébaut AC, Bénichou J (2004). Επιλογή χρονικής κλίμακας στην ανάλυση μοντέλου Cox των επιδημιολογικών δεδομένων κοόρτης: μια μελέτη προσομοίωσης. Stat Med 30; 23 (24): 3803-20. PMID: 15580597

  • Μελέτη προσομοίωσης που δείχνει το μέγεθος της μεροληψίας για διαφορετικούς βαθμούς συσχέτισης μεταξύ ηλικίας και συνδιακύμανσης ενδιαφέροντος κατά τη χρήση του χρόνου στη μελέτη ως χρονικής κλίμακας.

Canchola AJ, Stewart SL, Bernstein L, et αϊ. Οπισθοδρόμηση Cox χρησιμοποιώντας διαφορετικές χρονικές κλίμακες. Διατίθεται στη διεύθυνση: http://www.lexjansen.com/wuss/2003/DataAnalysis/i-cox_time_scales.pdf .

  • Ένα ωραίο χαρτί που συγκρίνει 5 μοντέλα παλινδρόμησης Cox με παραλλαγές είτε στην ώρα μελέτης είτε στην ηλικία με την κλίμακα χρόνου με τον κωδικό SAS.

Λογοκρισία

Huang CY, Ning J, Qin J (2015). Ημιπαραμετρική συμπεράσματα πιθανότητας για δεδομένα με αριστερή περικοπή και λογοκρισία. Βιοστατιστική [epub] PMID: 25796430 .

  • Αυτό το άρθρο έχει μια ωραία εισαγωγή στην ανάλυση των λογοκρισμένων δεδομένων και παρέχει μια νέα διαδικασία εκτίμησης για την κατανομή του χρόνου επιβίωσης με δεδομένα αριστερά-περικομμένα και δεξιά. Είναι πολύ πυκνό και έχει προηγμένη στατιστική εστίαση.

Cain KC, Harlow SD, Little RJ, Nan B, Yosef M, Taffe JR, Elliott MR (2011). Μεροληψία λόγω αριστερού περικοπής και λογοκρισίας αριστερά σε διαχρονικές μελέτες αναπτυξιακών και ασθενειών. Am J Epidemiol 173 (9): 1078-84. PMID: 21422059 .

  • Ένας εξαιρετικός πόρος που εξηγεί τη μεροληψία που υπάρχει στα δεδομένα λογοκρισίας αριστερά από επιδημιολογική προοπτική.

Sun J, Sun L, Zhu C (2007). Δοκιμή του μοντέλου αναλογικών αποδόσεων για δεδομένα λογοκρισίας διαστήματος. Ανάλυση δεδομένων διάρκειας ζωής 13: 37–50. PMID 17160547 .

  • Ένα άλλο στατιστικά πυκνό άρθρο σχετικά με μια λεπτή πτυχή της ανάλυσης δεδομένων TTE, αλλά παρέχει μια καλή εξήγηση των δεδομένων με λογοκρισία διαστήματος.

Robins JM (1995a) Μια αναλυτική μέθοδος για τυχαιοποιημένες δοκιμές με ενημερωτική λογοκρισία: Μέρος Ι. Ανάλυση δεδομένων διάρκειας ζωής 1: 241–254. PMID 9385104 .

Robins JM (1995b) Μια αναλυτική μέθοδος για τυχαιοποιημένες δοκιμές με ενημερωτική λογοκρισία: Μέρος II. Ανάλυση δεδομένων διάρκειας ζωής 1: 417–434. PMID 9385113 .

  • Δύο εργασίες που συζητούν μεθόδους αντιμετώπισης της ενημερωτικής λογοκρισίας.

Μη παραμετρικές μέθοδοι επιβίωσης

Borgan Ø (2005) Εκτιμητής Kaplan-Meier. Εγκυκλοπαίδεια Βιοστατιστικής DOI: 10.1002 / 0470011815.b2a11042

  • Εξαιρετική επισκόπηση του εκτιμητή Kaplan-Meier και της σχέσης του με τον εκτιμητή Nelson-Aalen

Rodríguez G (2005). Μη παραμετρική εκτίμηση σε μοντέλα επιβίωσης. Διαθέσιμο από: http://data.princeton.edu/pop509/NonParametricSurvival.pdf

  • Εισαγωγή στις μη παραμετρικές μεθόδους και στο μοντέλο αναλογικού κινδύνου Cox που εξηγεί τις σχέσεις μεταξύ μεθόδων με τους μαθηματικούς τύπους

Cole SR, Hernan MA (2004). Προσαρμοσμένες καμπύλες επιβίωσης με αντίστροφα βάρη πιθανότητας. Μέθοδοι υπολογισμού Προγράμματα Biomed 75 (1): 35-9. PMID: 15158046

  • Περιγράφει τη χρήση του IPW ​​για τη δημιουργία προσαρμοσμένων καμπυλών Kaplan-Meier. Περιλαμβάνει ένα παράδειγμα και μια μακροεντολή SAS.

Zhang M (2015). Ισχυρές μέθοδοι για τη βελτίωση της αποτελεσματικότητας και τη μείωση της προκατάληψης στην εκτίμηση των καμπυλών επιβίωσης σε τυχαιοποιημένες κλινικές δοκιμές. Ανάλυση δεδομένων διάρκειας ζωής 21 (1): 119-37. PMID: 24522498

  • Προτεινόμενη μέθοδος για καμπυλωτές καμπύλες επιβίωσης προσαρμοσμένες σε RCTs

Ημι-παραμετρικές μέθοδοι επιβίωσης

Cox DR (1972) Μοντέλα παλινδρόμησης και πίνακες ζωής (με συζήτηση). J R Statist Soc B 34: 187–220.

  • Η κλασική αναφορά.

Christensen E (1987) Πολυπαραγοντική ανάλυση επιβίωσης χρησιμοποιώντας το μοντέλο παλινδρόμησης Cox. Ηπατολογία 7: 1346–1358. PMID 3679094 .

  • Περιγράφει τη χρήση του μοντέλου Cox χρησιμοποιώντας ένα παρακινητικό παράδειγμα. Εξαιρετική ανασκόπηση των βασικών πτυχών της ανάλυσης μοντέλου Cox, συμπεριλαμβανομένου του τρόπου προσαρμογής ενός μοντέλου Cox και του ελέγχου των υποθέσεων μοντέλου.

Grambsch PM, Therneau TM (1994) Αναλογικές δοκιμές κινδύνων και διαγνωστικά με βάση σταθμισμένα υπολείμματα. Βιομετρία 81: 515–526.

  • Ένα σε βάθος έγγραφο για τη δοκιμή της υπόθεσης αναλογικών κινδύνων. Καλός συνδυασμός θεωρίας και προηγμένης στατιστικής εξήγησης.

Ng'andu NH (1997) Μια εμπειρική σύγκριση στατιστικών δοκιμών για την εκτίμηση της ανάλογης υπόθεσης κινδύνων του μοντέλου Cox. Stat Med 16: 611-626. PMID 9131751 .

  • Ένα άλλο σε βάθος έγγραφο σχετικά με τη δοκιμή της υπόθεσης αναλογικών κινδύνων, αυτό περιλαμβάνει συζήτηση για τον έλεγχο υπολειμμάτων και τα αποτελέσματα της λογοκρισίας.

Παραμετρικές μέθοδοι επιβίωσης

Rodrίguez, G (2010). Παραμετρικά μοντέλα επιβίωσης. Διαθέσιμο από: http://data.princeton.edu/pop509/ParametricSurvival.pdf

  • σύντομη εισαγωγή στις πιο κοινές κατανομές που χρησιμοποιούνται στην ανάλυση παραμετρικής επιβίωσης

Nardi A, Schemper M (2003). Σύγκριση Cox και παραμετρικών μοντέλων σε κλινικές μελέτες. Stat Med 22 (23): 2597-610. PMID: 14652863

  • Παρέχει καλά παραδείγματα που συγκρίνουν ημι-παραμετρικά μοντέλα με μοντέλα που χρησιμοποιούν κοινές παραμετρικές κατανομές και εστιάζει στην αξιολόγηση της προσαρμογής του μοντέλου

Royston P, Parmar MK (2002). Ευέλικτα παραμετρικά μοντέλα αναλογικών κινδύνων και αναλογικών αποδόσεων για λογοκριμένα δεδομένα επιβίωσης, με εφαρμογή σε προγνωστικά μοντέλα και εκτίμηση των θεραπευτικών επιδράσεων. Stat Med 21 (15): 2175-97. PMID: 12210632

  • Καλή εξήγηση για βασικά μοντέλα αναλογικών κινδύνων και πιθανοτήτων και συγκρίσεις με κυβικά διαχωριστικά

Cox C, Chu H, Schneider MF, Muñoz A (2007). Παραμετρική ανάλυση επιβίωσης και ταξινόμηση των λειτουργιών κινδύνου για τη γενικευμένη κατανομή γάμμα. Statist Med 26: 4352-4374. PMID 17342754 .

  • Παρέχει μια εξαιρετική επισκόπηση των παραμετρικών μεθόδων επιβίωσης, συμπεριλαμβανομένης της ταξινόμησης των λειτουργιών κινδύνου και μια εις βάθος συζήτηση της γενικευμένης οικογένειας κατανομής γάμμα.

Crowther MJ, Lambert PC (2014). Ένα γενικό πλαίσιο για παραμετρική ανάλυση επιβίωσης. Stat Med 33 (30): 5280-97. PMID: 25220693

  • Περιγράφει περιοριστικές παραδοχές παραμετρικών κατανομών που χρησιμοποιούνται συνήθως και εξηγεί τη μεθοδολογία περιορισμένης κυβικής σπονδυλικής στήλης

Sparling YH, Younes N, Lachin JM, Bautista OM (2006). Παραμετρικά μοντέλα επιβίωσης για δεδομένα λογοκρισίας διαστήματος με συντεταγμένες εξαρτώμενες από το χρόνο. Βιομετρικά 7 (4): 599-614. PMID: 16597670

  • Επέκταση και παράδειγμα τρόπου χρήσης παραμετρικών μοντέλων με δεδομένα λογοκρισίας διαστήματος

Ποικίλες χρονικές μεταβολές

Fisher LD, Lin DY (1999). Εξαρτώμενες από το χρόνο συντεταγμένες στο μοντέλο παλινδρόμησης αναλογικών κινδύνων Cox. Annu Rev Δημόσια Υγεία 20: 145-57. PMID: 10352854

  • Ολοκληρωμένη και κατανοητή εξήγηση των χρονικών διακυμάνσεων σε μοντέλα Cox, με ένα μαθηματικό παράρτημα

Petersen Τ (1986). Εφαρμογή παραμετρικών μοντέλων επιβίωσης με συντεταγμένες εξαρτώμενες από το χρόνο. Appl Statist 35 (3): 281-88.

  • Πυκνό άρθρο, αλλά με ένα χρήσιμο παράδειγμα

Ανταγωνιστική ανάλυση κινδύνου

Ανατρέξτε στην ενότητα Ανταγωνιστικοί κίνδυνοι

Tai B, Machin D, White I, Gebski V (2001) Ανταγωνιστική ανάλυση κινδύνων ασθενών με οστεοσάρκωμα: σύγκριση τεσσάρων διαφορετικών προσεγγίσεων. Stat Med 20: 661–684. PMID 11241570 .

  • Ένα καλό σε βάθος έγγραφο που περιγράφει τέσσερις διαφορετικές μεθόδους ανάλυσης δεδομένων ανταγωνιστικών κινδύνων και χρησιμοποιεί δεδομένα από μια τυχαιοποιημένη δοκιμή ασθενών με οστεοσάρκωμα για τη σύγκριση αυτών των τεσσάρων προσεγγίσεων.

Checkley W, Brower RG, Muñoz A (2010). Συμπεράσματα για αμοιβαία αποκλειστικά αγωνιστικά γεγονότα μέσω ενός συνδυασμού γενικευμένων διανομών γάμμα. Επιδημιολογία 21 (4): 557–565. PMID 20502337 .

  • Έγγραφο για τους ανταγωνιστικούς κινδύνους χρησιμοποιώντας τη γενικευμένη κατανομή γάμμα.

Ανάλυση ομαδοποιημένων δεδομένων και ευπαθών μοντέλων

Yamaguchi T, Ohashi Y, Matsuyama Y (2002) Αναλογικά μοντέλα κινδύνων με τυχαία αποτελέσματα για την εξέταση των κεντρικών επιδράσεων σε κλινικές δοκιμές καρκίνου πολλών κέντρων. Stat Methods Med Res 11: 221-236. PMID 12094756 .

  • Ένα έγγραφο με εξαιρετική θεωρητική και μαθηματική εξήγηση ότι λαμβάνεται υπόψη η ομαδοποίηση κατά την ανάλυση δεδομένων επιβίωσης από πολυκεντρικές κλινικές δοκιμές.

O'Quigley J, Stare J (2002) Αναλογικά μοντέλα κινδύνων με αδυναμίες και τυχαία εφέ. Stat Med 21: 3219–3233. PMID 12375300 .

  • Μία σύγκριση μεταξύ των αδύναμων μοντέλων και των μοντέλων τυχαίων εφέ.

Balakrishnan N, Peng Y (2006). Γενικευμένο μοντέλο αδυναμίας γάμμα. Statist Med 25: 2797-2816. PMID

  • Ένα έγγραφο για μοντέλα αδυναμίας που χρησιμοποιούν τη γενικευμένη κατανομή γάμμα ως κατανομή αδυναμίας.

Rondeau V, Mazroui Y, Gonzalez JR (2012). frailtypack: Ένα πακέτο R για την ανάλυση των συσχετιζόμενων δεδομένων επιβίωσης με μοντέλα αδυναμίας που χρησιμοποιούν εκτιμώμενη πιθανότητα εκτίμησης ή παραμετρική εκτίμηση. Εφημερίδα του Στατιστικού Λογισμικού 47 (4): 1-28.

  • R βινιέτα πακέτου με καλές πληροφορίες για τα εύθραυστα μοντέλα.

Schaubel DE, Cai J (2005). Ανάλυση συγκεντρωτικών δεδομένων επαναλαμβανόμενων συμβάντων με εφαρμογή σε ποσοστά νοσηλείας σε ασθενείς με νεφρική ανεπάρκεια. Βιοστατιστική 6 (3): 404-19. PMID 15831581 .

  • Εξαιρετικό έγγραφο στο οποίο οι συγγραφείς παρουσιάζουν δύο μεθόδους για την ανάλυση δεδομένων επαναλαμβανόμενων συμβάντων σε σύμπλεγμα και στη συνέχεια συγκρίνουν τα αποτελέσματα από τα προτεινόμενα μοντέλα με αυτά που βασίζονται σε ένα εύθραυστο μοντέλο.

Gharibvand L, Liu L (2009). Ανάλυση δεδομένων επιβίωσης με συγκεντρωτικά συμβάντα. Έγγραφο 237-2009 SAS Global Forum 2009.

  • Σύντομη και κατανοητή πηγή για ανάλυση δεδομένων από χρόνο σε συμβάν με ομαδοποιημένα συμβάντα με διαδικασίες SAS.

Ανάλυση επαναλαμβανόμενων γεγονότων

Twisk JW, Smidt N, de Vente W (2005). Εφαρμοσμένη ανάλυση των επαναλαμβανόμενων γεγονότων: μια πρακτική επισκόπηση. J Epidemiol Community Health 59 (8): 706-10. PMID: 16020650

  • Πολύ εύκολη στην κατανόηση εισαγωγή στην επαναλαμβανόμενη μοντελοποίηση συμβάντων και στην έννοια των συνόλων κινδύνου

Villegas R, Juliá O, Ocaña J (2013). Εμπειρική μελέτη συσχετισμένων χρόνων επιβίωσης για επαναλαμβανόμενα συμβάντα με αναλογικά περιθώρια κινδύνου και το αποτέλεσμα συσχέτισης και λογοκρισίας. BMC Med Res Methodol 13:95. PMID: 23883000

  • Χρησιμοποιεί προσομοιώσεις για να ελέγξει την ανθεκτικότητα διαφορετικών μοντέλων για επαναλαμβανόμενα δεδομένα συμβάντων

Kelly PJ, Lim LL (2000). Ανάλυση επιβίωσης για επαναλαμβανόμενα δεδομένα συμβάντων: εφαρμογή σε μολυσματικές ασθένειες παιδικής ηλικίας. Stat Med 19 (1): 13-33. PMID: 10623190

  • Εφαρμοσμένα παραδείγματα των τεσσάρων κύριων προσεγγίσεων για μοντελοποίηση επαναλαμβανόμενων δεδομένων συμβάντων

Wei LJ, Lin DY, Weissfeld L (1989). Ανάλυση παλινδρόμησης πολυπαραγοντικών ατελών δεδομένων χρόνου αποτυχίας με μοντελοποίηση οριακών κατανομών. Περιοδικό της Αμερικανικής Στατιστικής Ένωσης 84 (108): 1065-1073

Το αρχικό άρθρο που περιγράφει οριακά μοντέλα για επαναλαμβανόμενη ανάλυση συμβάντων

ΚΥΚΛΟΣ ΜΑΘΗΜΑΤΩΝ

Θερινό Ινστιτούτο Επιδημιολογίας και Υγείας του Πληθυσμού στο Πανεπιστήμιο της Κολούμπια (EPIC)

Statistics Horizons, ιδιωτικός πάροχος ειδικών στατιστικών σεμιναρίων που διδάσκονται από ειδικούς στον τομέα

  • 5ήμερο σεμινάριο για την ιστορία των γεγονότων και την ανάλυση επιβίωσης που προσφέρθηκε στις 15-19 Ιουλίου 2015 στη Φιλαδέλφεια, που διδάχθηκε από τον Paul Allison. Δεν απαιτείται προηγούμενη γνώση της ανάλυσης επιβίωσης. Για περισσότερες πληροφορίες, δείτε http://statisticalhorizons.com/seminars/public-seminars/eventhistory13

Διακοσμητικό θεσμικό πρόγραμμα Inter-University Consortium for Political and Social Research (ICPSR) in Quantitative Methods of Social Research, μέρος του Ινστιτούτου Κοινωνικής Έρευνας στο Πανεπιστήμιο του Michigan

  • Τριήμερο σεμινάριο για την ανάλυση επιβίωσης, μοντελοποίηση ιστορικού γεγονότων και ανάλυση διάρκειας που προσφέρθηκε στις 22-24 Ιουνίου 2015 στο Μπέρκλεϊ της Καλιφόρνια, με διδασκαλία τον Tenko Raykov του Michigan State University Πλήρης επισκόπηση των μεθόδων επιβίωσης σε διάφορους κλάδους (όχι μόνο δημόσια υγεία): http://www.icpsr.umich.edu/icpsrweb/sumprog/courses/0200

Το Ινστιτούτο Στατιστικής Έρευνας προσφέρει δύο διαδικτυακά μαθήματα για ανάλυση επιβίωσης, που προσφέρονται πολλές φορές το χρόνο. Αυτά τα μαθήματα βασίζονται στο εγχειρίδιο Εφαρμοσμένης ανάλυσης των Klein και Kleinbaum (βλ. Παρακάτω) και μπορούν να ληφθούν a la carte ή ως μέρος ενός προγράμματος πιστοποιητικών στατιστικά:

  • Εισαγωγή στην ανάλυση επιβίωσης, με έμφαση στα ημι-παραμετρικά μοντέλα Cox, που διδάσκονται από τον David Kleinbaum ή τον Matt Strickland: http://www.statistics.com/survival/

  • Προηγμένη ανάλυση επιβίωσης, συμπεριλαμβανομένων παραμετρικών μοντέλων, ανάλυσης υποτροπής και μοντέλων αδυναμίας, που διδάσκονται από τον Matt Strickland: http://www.statistics.com/survival2/

Το Ινστιτούτο Ψηφιακής Έρευνας και Εκπαίδευσης στο UCLA προσφέρει αυτό που αποκαλούν σεμινάρια μέσω της ιστοσελίδας τους για ανάλυση επιβίωσης σε διαφορετικά στατιστικά προγράμματα. Αυτά τα σεμινάρια καταδεικνύουν πώς να διεξάγεται ανάλυση εφαρμοζόμενης επιβίωσης, εστιάζοντας περισσότερο στον κώδικα παρά στη θεωρία.

Ενδιαφέροντα Άρθρα

Επιλογή Συντάκτη

Το GOOGLE ΔΕΛΤΙΖΕΙ ΕΝΗΜΕΡΩΣΕΙΣ ΑΣΦΑΛΕΙΑΣ ΓΙΑ ΤΟ CHROME ΣΤΙΣ 10 ΜΑΐΟΥ 2021
Το GOOGLE ΔΕΛΤΙΖΕΙ ΕΝΗΜΕΡΩΣΕΙΣ ΑΣΦΑΛΕΙΑΣ ΓΙΑ ΤΟ CHROME ΣΤΙΣ 10 ΜΑΐΟΥ 2021
Teachers College, Columbia University, είναι η πρώτη και μεγαλύτερη μεταπτυχιακή σχολή εκπαίδευσης στις Ηνωμένες Πολιτείες, και επίσης κατατάσσεται διαρκώς μεταξύ των καλύτερων της χώρας.
Ριζικές λύσεις για φαλάκρα
Ριζικές λύσεις για φαλάκρα
Η έρευνα της γενετιστικής Angela Christiano όχι μόνο προσφέρει ελπίδα σε όσους πάσχουν από τριχόπτωση, αλλά θα μπορούσε να δείξει το δρόμο για νέες θεραπείες για τον καρκίνο.
Τι θα συνέβαινε εάν η Γη ήταν πραγματικά επίπεδη;
Θα μπορούσατε να αποχαιρετήσετε την ατμόσφαιρα και την πλοήγηση GPS, για να ξεκινήσετε.
Πορτρέτο ενός γάμου στην Ιταλία του Μουσολίνι
Πορτρέτο ενός γάμου στην Ιταλία του Μουσολίνι
Τι μας λέει μια σχέση ανάμεσα σε μια αμερικανική γυναίκα και τον ιταλό στρατιωτικό σύζυγό της για τη διείσδυση του φασισμού υπό τον Μουσολίνι;
Ντοκυμαντέρ
Ντοκυμαντέρ
Μάθετε για το Πρόγραμμα Ντοκιμαντέρ στην Columbia Journalism School. Γίνετε αφηγητής βίντεο με μεταπτυχιακό τίτλο και μαθήματα ντοκιμαντέρ ή εξερευνήστε εκδηλώσεις ντοκιμαντέρ στο J-School και πρόσφατη φοιτητική εργασία.
Κρατήθηκε όμηρος για 444 ημέρες: Μια ιστορία επιβίωσης
Κρατήθηκε όμηρος για 444 ημέρες: Μια ιστορία επιβίωσης
Φράνκι Αλντίνο
Το «Santa Baby» άλλαξε τη ζωή μου
Το «Santa Baby» άλλαξε τη ζωή μου