Κύριος Αλλα Ψευδές ποσοστό ανακάλυψης

Ψευδές ποσοστό ανακάλυψης

ΣΦΑΙΡΙΚΗ ΕΙΚΟΝΑ

Λογισμικό

Περιγραφή

ποια είναι η διαφορά μεταξύ πανδημίας και επιδημίας

Ιστοσελίδες

Αναγνώσεις

ΚΥΚΛΟΣ ΜΑΘΗΜΑΤΩΝ

ΣΦΑΙΡΙΚΗ ΕΙΚΟΝΑ

Αυτή η σελίδα περιγράφει εν συντομία το False Discovery Rate (FDR) και παρέχει μια σχολιασμένη λίστα πόρων.

Περιγραφή

Κατά την ανάλυση των αποτελεσμάτων από μελέτες γονιδιωματικής, συχνά διεξάγονται ταυτόχρονα χιλιάδες τεστ υπόθεσης. Η χρήση της παραδοσιακής μεθόδου Bonferroni για διόρθωση πολλαπλών συγκρίσεων είναι πολύ συντηρητική, καθώς η προστασία από την εμφάνιση ψευδών θετικών θα οδηγήσει σε πολλά χαμένα ευρήματα. Για να μπορέσουμε να αναγνωρίσουμε όσο το δυνατόν περισσότερες σημαντικές συγκρίσεις, διατηρώντας παράλληλα ένα χαμηλό ψευδώς θετικό ποσοστό, χρησιμοποιείται το False Discovery Rate (FDR) και το ανάλογό του η τιμή q.

Καθορισμός του προβλήματος
Κατά τη διεξαγωγή δοκιμών υπόθεσης, για παράδειγμα για να δούμε αν δύο μέσα είναι σημαντικά διαφορετικά, υπολογίζουμε μια τιμή p, η οποία είναι η πιθανότητα λήψης στατιστικής δοκιμής που είναι ως ή πιο ακραία από την παρατηρούμενη, υποθέτοντας ότι η μηδενική υπόθεση είναι αλήθεια. Εάν είχαμε μια τιμή p 0,03, για παράδειγμα, αυτό θα σήμαινε ότι εάν η μηδενική υπόθεσή μας είναι αληθής, θα υπήρχε πιθανότητα 3% να λάβουμε την παρατηρούμενη στατιστική δοκιμής ή μια πιο ακραία. Δεδομένου ότι αυτή είναι μια μικρή πιθανότητα, απορρίπτουμε την μηδενική υπόθεση και λέμε ότι τα μέσα είναι σημαντικά διαφορετικά. Συνήθως μας αρέσει αυτή η πιθανότητα κάτω από 5%. Όταν ορίζουμε το alpha στο 0,05, λέμε ότι θέλουμε η πιθανότητα ότι ένα μηδενικό εύρημα θα κληθεί σημαντικό να είναι μικρότερο από 5%. Με άλλα λόγια, θέλουμε η πιθανότητα σφάλματος τύπου Ι, ή ψευδούς θετικού, να είναι μικρότερη από 5%.

Όταν πραγματοποιούμε πολλαπλές συγκρίσεις (θα ονομάσω κάθε δοκιμή ένα χαρακτηριστικό), έχουμε αυξημένη πιθανότητα ψευδών θετικών. Όσο περισσότερες δυνατότητες έχετε, τόσο υψηλότερες είναι οι πιθανότητες να χαρακτηριστεί ένα μηδενικό χαρακτηριστικό. Το ψευδώς θετικό ποσοστό (FPR), ή ανά ποσοστό σφάλματος σύγκρισης (PCER), είναι ο αναμενόμενος αριθμός ψευδών θετικών από όλες τις δοκιμές υπόθεσης που πραγματοποιήθηκαν. Επομένως, αν ελέγξουμε το FPR με άλφα 0,05, εγγυόμαστε ότι το ποσοστό των ψευδών θετικών (μηδενικές δυνατότητες που ονομάζονται σημαντικές) από όλες τις δοκιμές υπόθεσης είναι 5% ή λιγότερο. Αυτή η μέθοδος δημιουργεί πρόβλημα όταν διεξάγουμε μεγάλο αριθμό δοκιμών υπόθεσης. Για παράδειγμα, εάν κάναμε μια γονιδιωματική μελέτη που εξετάζει τη διαφορική γονιδιακή έκφραση μεταξύ ιστού όγκου και υγιούς ιστού, και δοκιμάσαμε 1000 γονίδια και ελέγξαμε το FPR, κατά μέσο όρο 50 πραγματικά μη γονίδια θα κληθούν σημαντικά. Αυτή η μέθοδος είναι πολύ φιλελεύθερη, καθώς δεν θέλουμε να έχουμε τόσο μεγάλο αριθμό ψευδών θετικών.

Συνήθως, οι διαδικασίες πολλαπλών συγκρίσεων ελέγχουν το ποσοστό σφάλματος για οικογένειες (FWER), το οποίο είναι η πιθανότητα να έχουν ένα ή περισσότερα ψευδώς θετικά από όλες τις δοκιμές υπόθεσης που διεξήχθησαν. Η διόρθωση Bonferroni που χρησιμοποιείται συνήθως ελέγχει το FWER. Εάν δοκιμάσουμε κάθε υπόθεση σε επίπεδο σημασίας (alpha / # of hypothesis testing), εγγυόμαστε ότι η πιθανότητα ύπαρξης ενός ή περισσότερων ψευδών θετικών είναι μικρότερη από το alpha. Έτσι, εάν το άλφα ήταν 0,05 και δοκιμάζαμε τα 1000 γονίδια μας, θα δοκιμάζαμε κάθε τιμή p σε επίπεδο σημασίας 0,00005 για να εγγυηθούμε ότι η πιθανότητα ύπαρξης ενός ή περισσότερων ψευδών θετικών είναι 5% ή μικρότερη. Ωστόσο, η προστασία έναντι οποιουδήποτε ψευδούς θετικού μπορεί να είναι πολύ αυστηρή για μελέτες γονιδιωματικής και μπορεί να οδηγήσει σε πολλά χαμένα ευρήματα, ειδικά εάν αναμένουμε να υπάρχουν πολλά αληθινά θετικά.

Ο έλεγχος του ποσοστού ψευδούς ανακάλυψης (FDR) είναι ένας τρόπος αναγνώρισης όσο το δυνατόν περισσότερων σημαντικών δυνατοτήτων, ενώ προκύπτει σχετικά χαμηλό ποσοστό ψευδών θετικών.

Βήματα για τον έλεγχο της ψευδούς ανακάλυψης:

  • Έλεγχος για FDR στο επίπεδο α * (δηλ. Ελέγχεται το αναμενόμενο επίπεδο ψευδών ανακαλύψεων δια του συνολικού αριθμού ανακαλύψεων)

Ε [V⁄R]

  • Υπολογίστε τις τιμές p για κάθε δοκιμή υπόθεσης και σειρά (μικρότερο έως μεγαλύτερο, P (min) …… .P (max))

  • Για την τιμή p που έχει παραγγελθεί, ελέγξτε εάν πληρούνται τα ακόλουθα:

P (i) ≤ α × i / m

Εάν είναι αλήθεια, τότε σημαντικό

* Περιορισμός: εάν το ποσοστό σφάλματος (α) πολύ μεγάλο μπορεί να οδηγήσει σε αυξημένο αριθμό ψευδών θετικών μεταξύ σημαντικών αποτελεσμάτων

Το False Discovery Rate (FDR)

Το FDR είναι το ποσοστό που τα χαρακτηριστικά που ονομάζονται σημαντικά είναι πραγματικά μηδενικά.
FDR = αναμενόμενο (# ψευδείς προβλέψεις / # συνολικές προβλέψεις)

Το FDR είναι το ποσοστό που τα χαρακτηριστικά που ονομάζονται σημαντικά είναι πραγματικά μηδενικά. Ένα FDR 5% σημαίνει ότι, μεταξύ όλων των χαρακτηριστικών που ονομάζονται σημαντικά, το 5% αυτών είναι πραγματικά μηδενικό. Ακριβώς όπως ορίζουμε το alpha ως κατώφλι για την τιμή p για τον έλεγχο του FPR, μπορούμε επίσης να ορίσουμε ένα όριο για την τιμή q, που είναι το ανάλογο FDR της τιμής p. Ένα όριο τιμής p (άλφα) 0,05 αποδίδει FPR 5% μεταξύ όλων των πραγματικά μηδενικών χαρακτηριστικών. Ένα όριο τιμής q 0,05 αποδίδει FDR 5% μεταξύ όλων των χαρακτηριστικών που ονομάζονται σημαντικές. Η τιμή q είναι το αναμενόμενο ποσοστό ψευδών θετικών μεταξύ όλων των χαρακτηριστικών ως ή πιο ακραίων από το παρατηρούμενο.

Στη μελέτη μας για 1000 γονίδια, ας υποθέσουμε ότι το γονίδιο Y είχε τιμή p 0,00005 και τιμή q 0,03. Η πιθανότητα ότι μια στατιστική δοκιμής ενός μη διαφοροποιημένου γονιδίου θα ήταν τόσο ή περισσότερο ακραία όσο η στατιστική δοκιμής για το γονίδιο Υ είναι 0,00005. Ωστόσο, η στατιστική δοκιμής του γονιδίου Y μπορεί να είναι πολύ ακραία και ίσως αυτό το στατιστικό στοιχείο δοκιμής είναι απίθανο για ένα γονίδιο διαφορετικής έκφρασης. Είναι πολύ πιθανό ότι υπάρχουν πραγματικά διαφορετικά γονίδια που εκφράζονται με στατιστικά στοιχεία δοκιμών λιγότερο ακραία από το γονίδιο Υ. Η χρήση της τιμής q 0,03 μας επιτρέπει να πούμε ότι το 3% των γονιδίων ως ή πιο ακραία (δηλαδή τα γονίδια που έχουν χαμηλότερο p- ως γονίδιο Υ είναι ψευδώς θετικά Η χρήση των τιμών q μας επιτρέπει να αποφασίσουμε πόσα ψευδώς θετικά είμαστε διατεθειμένοι να αποδεχτούμε μεταξύ όλων των δυνατοτήτων που ονομάζουμε σημαντικές. Αυτό είναι ιδιαίτερα χρήσιμο όταν θέλουμε να κάνουμε μεγάλο αριθμό ανακαλύψεων για περαιτέρω επιβεβαίωση αργότερα (δηλ. Πιλοτική μελέτη ή διερευνητικές αναλύσεις, για παράδειγμα εάν κάναμε μια μικροσυστοιχία γονιδιακής έκφρασης για να επιλέξουμε διαφορετικά εκφρασμένα γονίδια για επιβεβαίωση με PCR σε πραγματικό χρόνο). Αυτό είναι επίσης χρήσιμο σε μελέτες γονιδιωματικής όπου αναμένουμε ότι ένα σημαντικό μέρος των χαρακτηριστικών θα είναι πραγματικά εναλλακτικό και δεν θέλουμε να περιορίσουμε την ικανότητα ανακάλυψής μας.

Το FDR έχει μερικές χρήσιμες ιδιότητες. Εάν όλες οι μηδενικές υποθέσεις είναι αληθείς (δεν υπάρχουν πραγματικά εναλλακτικά αποτελέσματα) το FDR = FWER. Όταν υπάρχει ορισμένος αριθμός εναλλακτικών υποθέσεων, ο έλεγχος του FWER ελέγχει αυτόματα το FDR.
Η ισχύς της μεθόδου FDR (θυμηθείτε ότι η ισχύς είναι η πιθανότητα απόρριψης της μηδενικής υπόθεσης όταν ισχύει η εναλλακτική λύση) είναι ομοιόμορφα μεγαλύτερη από τις μεθόδους Bonferroni. Το πλεονέκτημα ισχύος του FDR έναντι των μεθόδων Bonferroni αυξάνεται με έναν αυξανόμενο αριθμό δοκιμών υπόθεσης.

Εκτίμηση του FDR
(Από τους Storey και Tibshirani, 2003)

Ορισμοί: t: κατώφλι V: # ψευδώς θετικά S: # χαρακτηριστικών που ονομάζονται σημαντικόm0: # πραγματικά μηδενικών χαρακτηριστικώνm: σύνολο # δοκιμών υποθέσεων (χαρακτηριστικά)
Πώς εκτιμούμε το E [S (t)];
Πώς εκτιμούμε το E [V (t)];
Πώς εκτιμούμε το m0;
Υποθέτουμε ότι οι τιμές p των μηδενικών χαρακτηριστικών θα κατανέμονται ομοιόμορφα (έχουν μια επίπεδη κατανομή) μεταξύ [0,1]. Το ύψος της επίπεδης κατανομής δίνει μια συντηρητική εκτίμηση της συνολικής αναλογίας των μηδενικών τιμών p, π0. Για παράδειγμα, η παρακάτω εικόνα που λήφθηκε από τους Storey και Tibshirani (2003) είναι ένα ιστόγραμμα πυκνότητας 3000 p-τιμών για 3000 γονίδια από μια μελέτη έκφρασης γονιδίων. Η διακεκομμένη γραμμή αντιπροσωπεύει το ύψος του επίπεδου τμήματος του ιστογράμματος. Περιμένουμε πραγματικά μηδενικά χαρακτηριστικά να σχηματίσουν αυτήν την επίπεδη κατανομή από [0,1], και πραγματικά εναλλακτικά χαρακτηριστικά να είναι πιο κοντά στο 0.

Το π0 ποσοτικοποιείται ως, όπου το λάμδα είναι η παράμετρος συντονισμού (για παράδειγμα στην παραπάνω εικόνα μπορούμε να επιλέξουμε λάμδα = 0,5, αφού μετά από τιμή p 0,5 η κατανομή είναι αρκετά επίπεδη. Η αναλογία των πραγματικά μηδενικών χαρακτηριστικών ισούται με τον αριθμό του p - τιμές μεγαλύτερες από το λάμδα διαιρούμενος με το m (1-λάμδα). Καθώς το λάμδα πλησιάζει το 0 (όταν το μεγαλύτερο μέρος της κατανομής είναι επίπεδο), ο παρονομαστής θα είναι περίπου m, όπως και ο αριθμητής, καθώς η πλειοψηφία των τιμών p θα είναι μεγαλύτερη από το lambda και το π0 θα είναι περίπου 1 (όλα τα χαρακτηριστικά είναι μηδενικά).
Η επιλογή του λάμδα συνήθως αυτοματοποιείται από στατιστικά προγράμματα.

Τώρα που έχουμε εκτιμήσει π0, μπορούμε να εκτιμήσουμε το FDR (t) ως
Η τιμή q για ένα χαρακτηριστικό τότε είναι το ελάχιστο FDR που μπορεί να επιτευχθεί όταν καλείτε αυτό το χαρακτηριστικό σημαντικό.

(Σημείωση: οι παραπάνω ορισμοί υποθέτουν ότι το m είναι πολύ μεγάλο, και έτσι S> 0. Όταν S = 0 το FDR είναι απροσδιόριστο, έτσι στη στατιστική βιβλιογραφία η ποσότητα E [V /? S? | S> 0]? * Pr (S> 0) χρησιμοποιείται ως FDR. Εναλλακτικά, χρησιμοποιείται το θετικό FDR (pFDR), το οποίο είναι E [V / S? | S> 0]. Βλέπε Benjamini and Hochberg (1995) και Storey and Tibshirani (2003) Για περισσότερες πληροφορίες.)

πώς να αποτρέψετε το έγκλημα

Αναγνώσεις

Βιβλία και κεφάλαια

ΠΡΟΣΦΑΤΕΣ ΠΡΟΟΔΟΣ ΣΤΙΣ ΒΙΟΤΑΤΙΣΤΙΚΕΣ (τόμος 4):
Επεξεργασία από τον Manish Bhattacharjee (Ινστιτούτο Τεχνολογίας του Νιου Τζέρσεϋ, ΗΠΑ), τον Sunil K Dhar (Ινστιτούτο Τεχνολογίας του Νιου Τζέρσεϋ, ΗΠΑ), και τον Sundarraman Subramanian (Ινστιτούτο Τεχνολογίας του Νιου Τζέρσεϋ, ΗΠΑ).
http://www.worldscibooks.com/lifesci/8010.html
Το πρώτο κεφάλαιο αυτού του βιβλίου παρέχει μια ανασκόπηση των διαδικασιών ελέγχου FDR που έχουν προταθεί από εξέχοντες στατιστικολόγους στον τομέα και προτείνει μια νέα προσαρμοστική μέθοδο που ελέγχει το FDR όταν οι τιμές p είναι ανεξάρτητες ή θετικά εξαρτημένες.

Διαισθητική βιοστατιστική: Ένας μη μαθηματικός οδηγός για τη στατιστική σκέψη
http://www.amazon.com/Intuitive-Biostatistics-Nonmathematical-Statistic-Thinking/dp/product-description/0199730067
Αυτό είναι ένα βιβλίο στατιστικών γραμμένο για επιστήμονες που δεν διαθέτουν περίπλοκο στατιστικό υπόβαθρο. Το Μέρος Ε, Προκλήσεις στη Στατιστική, εξηγεί με απλούς όρους το πρόβλημα των πολλαπλών συγκρίσεων και τους διαφορετικούς τρόπους αντιμετώπισής του, συμπεριλαμβανομένων βασικών περιγραφών για το οικογενειακό ποσοστό σφαλμάτων και το FDR.

Συμπεράσματα μεγάλης κλίμακας: εμπειρικές μέθοδοι Bayes για εκτίμηση, δοκιμή και πρόβλεψη
http://www.amazon.com/gp/product/0521192498/ref=as_li_ss_tl?ie=UTF8&tag=chrprobboo-20&linkCode=as2&camp=1789&creative=390957&creativeASIN=0521192498
Αυτό είναι ένα βιβλίο που εξετάζει την έννοια του FDR και διερευνά την αξία του όχι μόνο ως διαδικασία εκτίμησης αλλά και ως αντικείμενο δοκιμής σημασίας. Ο συγγραφέας παρέχει επίσης μια εμπειρική αξιολόγηση της ακρίβειας των εκτιμήσεων FDR.

Μεθοδολογικά άρθρα

Benjamini, Y. and Y. Hochberg (1995). Έλεγχος του ψευδούς ρυθμού ανακάλυψης: Μια πρακτική και ισχυρή προσέγγιση σε πολλαπλές δοκιμές. Εφημερίδα της Βασιλικής Στατιστικής Εταιρείας. Σειρά Β (Μεθοδολογική) 57 (1): 289-300.
Αυτό το έγγραφο του 1995 ήταν η πρώτη επίσημη περιγραφή του FDR. Οι συγγραφείς εξηγούν μαθηματικά πώς το FDR σχετίζεται με το οικογενειακό ποσοστό σφάλματος (FWER), παρέχουν ένα απλό παράδειγμα για το πώς να χρησιμοποιήσετε το FDR και διεξάγουν μια μελέτη προσομοίωσης που αποδεικνύει τη δύναμη της διαδικασίας FDR σε σύγκριση με τις διαδικασίες τύπου Bonferroni.

Storey, J. D. και R. Tibshirani (2003). Στατιστική σημασία για μελέτες γονιδιωματικής. Πρακτικά της Εθνικής Ακαδημίας Επιστημών 100 (16): 9440-9445.
Αυτή η εργασία εξηγεί τι είναι το FDR και γιατί είναι σημαντικό για μελέτες γονιδιωματικής και εξηγεί πώς μπορεί να εκτιμηθεί το FDR. Δίνει παραδείγματα καταστάσεων στις οποίες το FDR θα ήταν χρήσιμο και παρέχει ένα διεξοδικό παράδειγμα για το πώς οι συγγραφείς χρησιμοποίησαν το FDR για να αναλύσουν τα δεδομένα διαφορικής γονιδιακής έκφρασης μικροσυστοιχιών.

Όροφος JD. (2010) Λάθος ποσοστά ανακάλυψης. Στην Διεθνή Εγκυκλοπαίδεια της Στατιστικής Επιστήμης, Lovric M (συντάκτης).
Ένα πολύ καλό άρθρο σχετικά με τον έλεγχο FDR, το θετικό FDR (pFDR) και την εξάρτηση. Συνιστάται να λάβετε μια απλοποιημένη επισκόπηση του FDR και σχετικών μεθόδων για πολλαπλές συγκρίσεις.

Reiner A, Yekutieli D, Benjamini Y: Προσδιορισμός γονιδίων που έχουν εκφραστεί με διαφορετικό τρόπο χρησιμοποιώντας διαδικασίες ελέγχου του ποσοστού ψευδούς ανακάλυψης. Βιοπληροφορική 2003, 19 (3): 368-375.
Αυτό το άρθρο χρησιμοποιεί προσομοιωμένα δεδομένα μικροσυστοιχιών για να συγκρίνει τρεις διαδικασίες ελέγχου FDR που βασίζονται στην επαναληπτική δειγματοληψία με τη διαδικασία Benjamini-Hochberg. Η επαναληπτική δειγματοληψία των στατιστικών δοκιμών γίνεται έτσι ώστε να μην υποτίθεται η κατανομή του στατιστικού ελέγχου της διαφορικής έκφρασης κάθε γονιδίου.

Verhoeven KJF, Simonsen KL, McIntyre LM: Εφαρμογή ελέγχου ψευδούς ρυθμού ανακάλυψης: αύξηση της ισχύος σας. Oikos 2005, 108 (3): 643-647.
Αυτό το άρθρο εξηγεί τη διαδικασία Benjamini-Hochberg, παρέχει ένα παράδειγμα προσομοίωσης και συζητά τις πρόσφατες εξελίξεις στο πεδίο FDR που μπορούν να παρέχουν περισσότερη ισχύ από την αρχική μέθοδο FDR.

Stan Pounds και Cheng Cheng (2004) Βελτίωση της εκτίμησης του ποσοστού ψευδούς ανακάλυψης Bioinformatics Vol. 20 αρ. 11 2004, σελίδες 1737–1745.
Αυτό το άρθρο εισάγει μια μέθοδο που ονομάζεται ιστόγραμμα LOESS spacings (SPLOSH). Αυτή η μέθοδος προτείνεται για την εκτίμηση του υπό όρους FDR (cFDR), του αναμενόμενου ποσοστού ψευδών θετικών που εξαρτάται από την ύπαρξη «σημαντικών» ευρημάτων.

Daniel Yekutieli, Yoav Benjamini (1998) Λάθος ανακάλυψης βάσει δειγματοληψίας που ελέγχει πολλαπλές διαδικασίες δοκιμής για συσχετισμένες στατιστικές δοκιμών Journal of Statistics Planning and Inference 82 (1999) 171-196.
Αυτή η εργασία εισάγει μια νέα διαδικασία ελέγχου FDR για την αντιμετώπιση στατιστικών δοκιμών που σχετίζονται μεταξύ τους. Η μέθοδος περιλαμβάνει τον υπολογισμό μιας τιμής p με βάση τη δειγματοληψία. Οι ιδιότητες αυτής της μεθόδου αξιολογούνται χρησιμοποιώντας μια μελέτη προσομοίωσης.

Yoav Benjamini and Daniel Yekutieli (2001) Ο έλεγχος του ποσοστού ψευδούς ανακάλυψης σε πολλαπλές δοκιμές υπό εξάρτηση The Annals of Statistics 2001, Vol. 29, Νο. 4, 1165–1188.
Η μέθοδος FDR που προτάθηκε αρχικά ήταν για χρήση σε δοκιμές πολλαπλών υποθέσεων ανεξάρτητων στατιστικών δοκιμών. Αυτό το άρθρο δείχνει ότι η αρχική μέθοδος FDR ελέγχει επίσης το FDR όταν τα στατιστικά στοιχεία δοκιμής έχουν θετική εξάρτηση παλινδρόμησης από καθένα από τα στατιστικά στοιχεία δοκιμής που αντιστοιχούν στην πραγματική μηδενική υπόθεση. Ένα παράδειγμα εξαρτημένων στατιστικών δοκιμών θα ήταν ο έλεγχος πολλαπλών τελικών σημείων μεταξύ ομάδων θεραπείας και ελέγχου σε μια κλινική δοκιμή.

John D. Storey (2003) Το θετικό ψευδές ποσοστό ανακάλυψης: Μια ερμηνεία Bayesian και η τιμή q The Annals of Statistics 2003, Vol. 31, Νο. 6, 2013–2035.
Αυτό το άρθρο ορίζει το θετικό ποσοστό ψευδούς ανακάλυψης (pFDR), που είναι ο αναμενόμενος αριθμός ψευδών θετικών από όλες τις δοκιμές που ονομάζονται σημαντικές, δεδομένου ότι υπάρχει τουλάχιστον ένα θετικό εύρημα. Η εργασία παρέχει επίσης μια ερμηνεία του Bayesian του pFDR.

Yudi Pawitan, Stefan Michiels, Serge Koscielny, Arief Gusnanto και Alexander Ploner (2005) Λάθος ποσοστό ανακάλυψης, ευαισθησία και μέγεθος δείγματος για μελέτες μικροσυστοιχιών Bioinformatics Vol. 21 αρ. 13 2005, σελίδες 3017–3024.
Αυτή η εργασία περιγράφει μια μέθοδο για τον υπολογισμό του μεγέθους του δείγματος για μια συγκριτική μελέτη δύο δειγμάτων με βάση τον έλεγχο FDR και την ευαισθησία.

Grant GR, Liu J, Stoeckert CJ Jr. (2005) Μια πρακτική προσέγγιση ψευδούς ανακάλυψης για τον προσδιορισμό μοτίβων διαφορικής έκφρασης σε δεδομένα μικροσυστοιχιών. Βιοπληροφορική. 2005, 21 (11): 2684-90.
Οι συγγραφείς περιγράφουν τις μεθόδους εκτίμησης της παραλλαγής και συζητούν θέματα σχετικά με την επιλογή των ερευνητών για στατιστικές και μεθόδους μετασχηματισμού δεδομένων. Εξετάζεται επίσης η βελτιστοποίηση ισχύος που σχετίζεται με τη χρήση δεδομένων μικροσυστοιχιών.

Jianqing Fan, Frederick L. Moore, Xu Han, Weijie Gu, Estimating False Discovery Proportion Under Arbitrary Covariance Dependence. J Am Stat Assoc. 2012; 107 (499): 1019–1035.
Αυτό το άρθρο προτείνει και περιγράφει μια μέθοδο για τον έλεγχο του FDR με βάση έναν βασικό παράγοντα προσέγγιση της μήτρας συνδιακύμανσης των στατιστικών δοκιμών.

Άρθρα εφαρμογής

Han S, Lee K-M, Park SK, Lee JE, Ahn HS, Shin HY, Kang HJ, Koo HH, Seo JJ, Choi JE et al: Μελέτη συσχέτισης σε ολόκληρο το γονιδίωμα της παιδικής οξείας λεμφοβλαστικής λευχαιμίας στην Κορέα. Έρευνα λευχαιμίας 2010, 34 (10): 1271-1274.
Αυτή ήταν μια μελέτη σε ολόκληρο το γονιδίωμα (GWAS) που εξέτασε ένα εκατομμύριο πολυμορφισμούς ενός νουκλεοτιδίου (SNPs) για συσχέτιση με την ενεργή λεμφοβλαστική λευχαιμία στην παιδική ηλικία (ALL). Έλεγξαν το FDR στα 0,2 και διαπίστωσαν ότι 6 SNP σε 4 διαφορετικά γονίδια σχετίζονται στενά με ΟΛΟ τον κίνδυνο.

Pedersen, K. S., Bamlet, W. R., Oberg, A. L., de Andrade, M., Matsumoto, M. E., Tang, H., Thibodeau, S. N., Petersen, G. M. and Wang, L. (2011). Η υπογραφή μεθυλίωσης DNA λευκοκυττάρων διαφοροποιεί τους ασθενείς με καρκίνο του παγκρέατος από τους υγιείς μάρτυρες. PLoS ONE 6, e18223.
Αυτή η μελέτη ελέγχεται για FDR<0.05 when looking for differentially methylated genes between pancreatic adenoma patients and healthy controls to find epigenetic biomarkers of disease.

Daniel W. Lin, Liesel M. FitzGerald, Rong Fu, Erika M. Kwon, Siqun Lilly Zheng, Suzanne et.al. Οι γενετικές παραλλαγές στα γονίδια LEPR, CRY1, RNASEL, IL4 και ARVCF είναι προγνωστικοί δείκτες ειδικού καρκίνου του προστάτη. Mortality (2011), Cancer Epidemiol Biomarkers Prev.2011; 20: 1928-1936. Αυτή η μελέτη εξέτασε τη διακύμανση επιλεγμένων υποψήφιων γονιδίων που σχετίζονται με την εμφάνιση καρκίνου του προστάτη, προκειμένου να ελεγχθεί η προγνωστική του αξία μεταξύ ατόμων υψηλού κινδύνου. Το FDR χρησιμοποιήθηκε για να ταξινομήσει τους πολυμορφισμούς ενός νουκλεοτιδίου (SNPs) και να εντοπίσει κορυφαία snps ενδιαφέροντος.

διαφορά μεταξύ ενδημικού και επιδημικού

Radom-Aizik S, Zaldivar F, Leu S-Y, Adams GR, Oliver S, Cooper DM: Επιδράσεις άσκησης στην έκφραση microRNA σε νεαρά αρσενικά μονοπύρηνα κύτταρα περιφερικού αίματος. Κλινική και Μεταφραστική Επιστήμη 2012, 5 (1): 32-38.
Αυτή η μελέτη εξέτασε την αλλαγή στην έκφραση microRNA πριν και μετά την άσκηση χρησιμοποιώντας μια μικροσυστοιχία. Χρησιμοποίησαν τη διαδικασία Benjamini-Hochberg για τον έλεγχο του FDR στα 0,05, και βρήκαν 34 από τα 236 microRNAs να εκφράζονται διαφορετικά. Στη συνέχεια, οι ερευνητές επέλεξαν microRNA από αυτά τα 34 για επιβεβαίωση με PCR σε πραγματικό χρόνο.

Ιστοσελίδες

R στατιστικό πακέτο
http://genomine.org/qvalue/results.html
Σχολιασμένος κωδικός R που χρησιμοποιείται για την ανάλυση δεδομένων στο χαρτί Storey and Tibshirani (2003), συμπεριλαμβανομένου συνδέσμου προς αρχείο δεδομένων. Αυτός ο κωδικός μπορεί να προσαρμοστεί ώστε να λειτουργεί με οποιαδήποτε δεδομένα πίνακα.

http://www.bioconductor.org/packages/release/bioc/html/qvalue.html
πακέτο qvalue για R.

http://journal.r-project.org/archive/2009-1/RJournal_2009-1.pdf

Το Journal R Project είναι μια δημοσίευση ανοιχτής πρόσβασης από το ομότιμο κριτήριο του R Foundation for Statistics Computing. Αυτός ο τόμος παρέχει ένα άρθρο με τίτλο «Εκτίμηση μεγέθους δείγματος κατά τον έλεγχο των εσφαλμένων τιμών ανακάλυψης για πειράματα μικροσυστοιχιών» των Megan Orr και Peng Liu. Παρέχονται συγκεκριμένες λειτουργίες και λεπτομερή παραδείγματα.

http://strimmerlab.org/notes/fdr.html
Αυτός ο ιστότοπος παρέχει μια λίστα λογισμικού R για ανάλυση FDR, με συνδέσμους προς τις αρχικές σελίδες τους για περιγραφή των δυνατοτήτων του πακέτου.

SAS
http://support.sas.com/documentation/cdl/en/statug/63347/HTML/default/viewer.htm#statug_multtest_sect001.htm
Περιγραφή του PROC MULTTEST στο SAS, το οποίο παρέχει επιλογές για τον έλεγχο του FDR χρησιμοποιώντας διαφορετικές μεθόδους.

ΚΑΤΑΣΤΑΣΗ
http://www.stata-journal.com/article.html?article=st0209
Παρέχει εντολές STATA για τον υπολογισμό των τιμών q για διαδικασίες πολλαπλών δοκιμών (υπολογισμός FDR προσαρμοσμένων τιμών q).

FDR_Γενικοί πόροι ιστού
http://www.math.tau.ac.il/~ybenja/fdr/index.htm
Ιστοσελίδα που διαχειρίζονται οι στατιστικολόγοι στο Πανεπιστήμιο του Τελ Αβίβ, οι οποίοι παρουσίασαν για πρώτη φορά το FDR.

http://www.math.tau.ac.il/~ybenja/
Αυτός ο ιστότοπος FDR έχει πολλές διαθέσιμες αναφορές. Η διάλεξη στο FDR είναι διαθέσιμη για αναθεώρηση.

http://www.cbil.upenn.edu/PaGE/fdr.html
Ωραία, συνοπτική εξήγηση του FDR. Παρέχεται μια χρήσιμη περίληψη με μια ματιά με παράδειγμα.

http://www.rowett.ac.uk/~gwh/False-positives-and-the-qvalue.pdf
Μια σύντομη επισκόπηση των ψευδών θετικών και q-τιμών.

ΚΥΚΛΟΣ ΜΑΘΗΜΑΤΩΝ

Ένα σεμινάριο για τον ψεύτικο έλεγχο της ανακάλυψης από τον Christopher R. Genovese Τμήμα Στατιστικής Πανεπιστήμιο Carnegie Mellon.
Αυτό το powerpoint είναι ένα πολύ λεπτομερές σεμινάριο για κάποιον που ενδιαφέρεται να μάθει τα μαθηματικά θεμέλια του FDR και τις παραλλαγές του FDR.

Πολλαπλές δοκιμές από τον Joshua Akey, Τμήμα Επιστημών Γονιδιώματος, Πανεπιστήμιο της Ουάσιγκτον.
Αυτό το powerpoint παρέχει μια πολύ διαισθητική κατανόηση πολλαπλών συγκρίσεων και του FDR. Αυτή η διάλεξη είναι καλή για όσους αναζητούν μια απλή κατανόηση του FDR χωρίς πολλά μαθηματικά.

Εκτίμηση του τοπικού ψευδούς ποσοστού ανακάλυψης στην ανίχνευση της διαφορικής έκφρασης μεταξύ δύο τάξεων.
www.youtube.com/watch?v=J4wn9_LGPcY
Αυτή η τηλεοπτική διάλεξη ήταν χρήσιμη για την εκμάθηση του τοπικού FDR, που είναι η πιθανότητα μιας συγκεκριμένης υπόθεσης να είναι αληθινή, δεδομένης της συγκεκριμένης στατιστικής δοκιμής ή της τιμής p.

Διαδικασίες ελέγχου ψευδούς ρυθμού ανακάλυψης για διακριτές δοκιμές
http://www.youtube.com/watch?v=IGjElkd4eS8
Αυτή η τηλεοπτική διάλεξη ήταν χρήσιμη για την εκμάθηση σχετικά με την εφαρμογή ελέγχου FDR σε διακριτά δεδομένα. Συζητούνται πολλές διαδικασίες αναβάθμισης και αναβάθμισης για έλεγχο FDR κατά την εξέταση διακριτών δεδομένων. Εξετάζονται εναλλακτικές λύσεις που τελικά βοηθούν στην αύξηση της ισχύος.

Ενδιαφέροντα Άρθρα

Επιλογή Συντάκτη

Φίλιπ Μ. Γκέντι
Φίλιπ Μ. Γκέντι
Ένας βραβευμένος δάσκαλος, ο Philip Genty είναι πρωτοπόρος στην παιδαγωγική κλινικής εκπαίδευσης. Συν-ίδρυσε και ηγήθηκε της Κλινικής Αιχμαλώτων και Οικογενειών της Νομικής Σχολής, η οποία αργότερα μετονομάστηκε στην Κηδεμόνα και στην Οικογενειακή Κλινική. Υπηρέτησε ως επί μακρόν διευθυντής του διακεκριμένου διαγωνισμού Harlan Fiske Stone Moot Court του Law School, στον οποίο οι τέσσερις φιναλίστ μαθητές παρουσιάζουν προφορικά επιχειρήματα σε μια φανταστική υπόθεση ενώπιον μιας επιτροπής ομοσπονδιακών δικαστών, συμπεριλαμβανομένων, περιστασιακά, δικαστών του Ανώτατου Δικαστηρίου. Ο Genty γράφει για το οικογενειακό δίκαιο, τη νομική ηθική, την κλινική εκπαίδευση και τα δικαιώματα των κρατουμένων. Έχει αναπτύξει νομικό υλικό για τους φυλακισμένους γονείς και συνεργάζεται με διάφορους μη κερδοσκοπικούς οργανισμούς που βοηθούν τις γυναίκες στη φυλακή. Έχει διδάξει και συμβουλευτεί νομική ηθική και κλινική νομική εκπαίδευση στο Ισραήλ και την Κεντρική και Ανατολική Ευρώπη. Πριν από την ένταξή του στη σχολή Νομικής Σχολής της Κολούμπια το 1989, ο Genty δίδαξε στη Νομική Σχολή του Μπρούκλιν και εργάστηκε ως δικηγόρος στις Νομικές Υπηρεσίες των Φυλακισμένων της Νέας Υόρκης, στο Τμήμα Διατήρησης και Ανάπτυξης Στέγασης της Νέας Υόρκης και στις Νομικές Υπηρεσίες της Bedford-Stuyvesant.
Η μηχανή που μπορεί να διαβάσει το μυαλό σας
Η μηχανή που μπορεί να διαβάσει το μυαλό σας
Στο Κέντρο Έρευνας Μαγνητικού Συντονισμού της Κολούμπια, οι επιστήμονες αποκαλύπτουν τη νευρική βάση των ανθρώπινων σκέψεων, αναμνήσεων και συναισθημάτων - και μοιράζονται την υπόσχεση της τεχνολογίας αιχμής σάρωσης εγκεφάλου με τον κόσμο.
PCORE
PCORE
Γλώσσα προγραμματισμού Fortran, ορισμός, εκδόσεις, χαρακτήρες, σύμβολα
Γλώσσα προγραμματισμού Fortran, ορισμός, εκδόσεις, χαρακτήρες, σύμβολα
Η γλώσσα προγραμματισμού Fortran ανακαλύφθηκε το 1950-1957. Η ιδέα αυτής της γλώσσας δόθηκε από τον John Warner Backus. Ήταν το πρώτο ευρέως χρησιμοποιούμενο, Υψηλού επιπέδου
Προεγκεκριμένα προσωπικά έγγραφα δανείου SBI, Επιλεξιμότητα, Επιτόκιο, EMI, Αίτηση Online
Προεγκεκριμένα προσωπικά έγγραφα δανείου SBI, Επιλεξιμότητα, Επιτόκιο, EMI, Αίτηση Online
Προεγκεκριμένα προσωπικά έγγραφα δανείου SBI, επιλεξιμότητα, επιτόκιο, EMI, ηλεκτρονική αίτηση, ηλεκτρονική φόρμα αίτησης, λεπτομέρειες, πώς να λάβετε
15 ταινίες που βραβεύτηκαν με Όσκαρ από τους αποφοίτους της Κολούμπια
15 ταινίες που βραβεύτηκαν με Όσκαρ από τους αποφοίτους της Κολούμπια
Τιμή Lg V40 ThinQ, ημερομηνία κυκλοφορίας, προδιαγραφές, χαρακτηριστικά, τριπλή κάμερα
Τιμή Lg V40 ThinQ, ημερομηνία κυκλοφορίας, προδιαγραφές, χαρακτηριστικά, τριπλή κάμερα
Λεπτομέρειες τιμής Lg V40 ThinQ lg mobile. Προδιαγραφές κινητού Lg V40 ThinQ lg, χαρακτηριστικά, μπαταρία, Τριπλή κάμερα, χρώματα, μέγεθος οθόνης, επεξεργαστής, Αδιάβροχο, Γρήγορη φόρτιση