• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • Possiamo fidarci delle scoperte scientifiche fatte usando l'apprendimento automatico?

    Lo statistico della Rice University Genevera Allen discuterà della ricerca per migliorare l'accuratezza e la riproducibilità delle scoperte scientifiche fatte dall'apprendimento automatico sia in una conferenza stampa che in una sessione generale durante l'incontro annuale AAAS 2019. Attestazione:Tommy LaVergne/Rice University

    Genevera Allen, statistica della Rice University, afferma che gli scienziati devono continuare a mettere in discussione l'accuratezza e la riproducibilità delle scoperte scientifiche fatte dalle tecniche di apprendimento automatico fino a quando i ricercatori non svilupperanno nuovi sistemi computazionali in grado di autocriticarsi.

    Allen, professore associato di statistica, informatica e ingegneria elettrica e informatica alla Rice e di pediatria-neurologia al Baylor College of Medicine, affronterà l'argomento sia in una conferenza stampa che in una sessione generale oggi all'incontro annuale 2019 dell'American Association for the Advancement of Science (AAAS).

    "La domanda è, "Possiamo davvero fidarci delle scoperte che vengono attualmente fatte utilizzando tecniche di apprendimento automatico applicate a grandi insiemi di dati?", ha detto Allen. "La risposta in molte situazioni è probabilmente:'Non senza controllare, ' ma sono in corso lavori sui sistemi di apprendimento automatico di prossima generazione che valuteranno l'incertezza e la riproducibilità delle loro previsioni".

    Il machine learning (ML) è una branca della statistica e dell'informatica che si occupa della creazione di sistemi computazionali che apprendono dai dati anziché seguire istruzioni esplicite. Allen ha affermato che molta attenzione nel campo del ML si è concentrata sullo sviluppo di modelli predittivi che consentono al ML di fare previsioni sui dati futuri in base alla sua comprensione dei dati che ha studiato.

    "Molte di queste tecniche sono progettate per fare sempre una previsione, " ha detto. "Non tornano mai con 'non lo so, ' o 'non ho scoperto niente, ' perché non sono fatti per."

    Ha detto che le scoperte guidate dai dati non confermate da studi ML recentemente pubblicati sui dati sul cancro sono un buon esempio.

    "Nella medicina di precisione, è importante trovare gruppi di pazienti che hanno profili genomicamente simili in modo da poter sviluppare terapie farmacologiche mirate al genoma specifico per la loro malattia, " ha detto Allen. "Le persone hanno applicato l'apprendimento automatico ai dati genomici da coorti cliniche per trovare gruppi, o grappoli, di pazienti con profili genomici simili.

    "Ma ci sono casi in cui le scoperte non sono riproducibili; i cluster scoperti in uno studio sono completamente diversi dai cluster trovati in un altro, " ha detto. "Perché? Perché la maggior parte delle tecniche di apprendimento automatico oggi dicono sempre, "Ho trovato un gruppo." Qualche volta, sarebbe molto più utile se dicessero, "Penso che alcuni di questi siano davvero raggruppati insieme, ma sono incerto su questi altri.'"

    Allen discuterà l'incertezza e la riproducibilità delle tecniche di machine learning per le scoperte guidate dai dati in una conferenza stampa alle 10 di oggi, e discuterà casi studio e ricerche volte ad affrontare l'incertezza e la riproducibilità nelle 15:30. sessione generale, "Apprendimento automatico e statistica:applicazioni in genomica e visione artificiale". Entrambe le sessioni sono al Marriott Wardman Park Hotel.


    © Scienza https://it.scienceaq.com