Visualizzazione post con etichetta math. Mostra tutti i post
Visualizzazione post con etichetta math. Mostra tutti i post

lunedì 21 aprile 2025

I CONTI CHE NON TORNAVANO IERI E CHE NON TORNANO OGGI (DA COVID AGLI INCENDI DI LOS ANGELES)

Qualche tempo fa, in calce a questo post, precisavo che CS era venuto fuori al tempo e che da subito raccolse i contributi di persone con lauree "pesanti", di quelle antiche, a cui i conti non tornavano. Sono passati otto anni e quella memoria della rete di cui tanto si parlava si sta dimostrando una memoria a breve termine, la pagina fb CS non esiste più e quindi chi allora non c'era può essersi chiesto di cosa si parlasse (o può aver pensato "Questo lo dice lui!"). Si parlava, per esempio di dispense di statistica per un esame a medicina che esibivano gaussiane non normalizzate, di ostentate correlazioni lineari tra tassi di vaccinazione MPR pediatrici e casi di morbillo nella popolazione intera, oppure di questo:

Questa roba avrebbe dovuto dimostrare che il vaccino antiinfluenzale proteggeva da COVID, pensate un po', e la mia risposta a chi in quel caso per ridere si era rifatto i conti, dichiarando con uno sghignazzo "E' una cubica!", fu: quante volte s'è detto "levategli dalle zampette il software statistico"?

In pratica era l'ennesima dimostrazione che xkcd non doveva inventarsi niente per la sua satira:

 

 

E il punto, quando un articolo veniva molto citato sui media, social o no che fossero, era il più delle volte quello di xkcd: la solidità della statistica non importava, bastava fare un po' di scena, con buona pace del peer reviewing. In che senso? Nel senso che immaginate che si tratti di un articolo che va a finire su una rivista di malattie infettive, pure con buon Impact Factor: i revisori saranno infettivologi o biologi o medici, cioè soggetti senza gli strumenti per valutare la solidità del trattamento statistico (si limiteranno a dare un'occhiata al p-value, con la famosa regoletta farlocca che se è maggiore di 0,05 allora la correlazione è falsa). 

Nota con i dettagli: 

p-value è la probabilità dell'ipotesi nulla, quindi p-value 0,05 vuol dire "vero al 95%". Considerarlo un valore discriminante tra vero e falso significa, per fare un esempio, che "vero al 93,5%" viene tradotto con "falso". In più un p-value basso non implica un R2 alto, cioè in soldoni un buon intervallo di confidenza. Con un p-value basso la significatività del modello è alta ma l'affidabilità delle sue predizioni può essere bassa o nulla - tipo che il modello dice 2, ma poi il valore rilevato sperimentalmente può essere 4 o 0, con un errore che è uguale al valore della predizione.

La statistica può fare acqua ad un'analisi appena più attenta, dicevamo, perché quello che conta è il messaggio. Passano gli anni, cambiano i temi, ma il metodo continua ad essere lo stesso. Per esempio riguardo gli incendi di Los Angeles di gennaio: colpa del cambiamento climatico! Uhm, non proprio, andando a vedere gli intervalli di confidenza:


E qui ci sono le relative precisazioni:

Facile immaginare che ci sarà chi legge saltando i video, quindi ecco il riassunto breve: gli intervalli di confidenza riportati nello studio dicono che i risultati non sono statisticamente significativi, quindi non si dimostra alcuna correlazione tra cambiamento climatico e incendi di Los Angeles a gennaio di questo anno. La comunità dei climatologi lo sapeva perfettamente e non ha detto mezza parola al riguardo. Certo, perché altrimenti certe trenodie di membri di tale comunità sarebbero apparse episodi di infondato, teatrale e stucchevole moralismo.

Dopodichè, a freddo, cioè tre mesi dopo, in Italia chi è che ha rilanciato "Incendi a Los Angeles, è il climate change" senza far seguire un errata corrige? La lista è lunga. Tralasciamo la stampa generalista, che ha rilanciato senza pensare come fa di solito, per guardare alla comunicazione scientifica che ha fatto esattamente lo stesso: Università degli Studi Milano-Bicocca, Le Scienze e via dicendo. Ma non c'è problema, il messaggio era quello giusto. E' colpa mia, Dio mi strafulmini, che non riesco a farmi entrare in testa questa cosa.


giovedì 9 marzo 2023

LOGARITMICAMENTE

Non cominciate male, magari ricordando qualcuno che parlava di "crescite logaritmiche". Il logaritmo (log o ln) è una cosa seria. Per esempio qua: ΔG° = -RTlnK

Oppure per trattare linearmente dati attribuibili ad un andamento esponenziale o che è utile trattare come tali. Tipo qua https://ilchimicoscettico.blogspot.com/2019/07/cinetiche-di-ordine-apparente-modelli-e.html .  Per tacere dell'importanza storica nell'ambito del calcolo, dalle tavole logaritmiche al regolo calcolatore.


Come si sia potuti arrivare ad un uso improprio dei logaritmi per me è un mistero.

Uso improprio, per esempio nella comunicazione. Quanto segue è del tutto ovvio, in fondo basta pensare ai  grafici sovrapposti di y=x e y=logx. Comunque...

Avete presente cosa comunica una funzione  esponenziale con esponente positivo? "Oh, no, cresce in modo incontrollabile".  Con le trasformazioni logaritmiche le cose sono un po' più complicate. Ma chiunque, anche se è un disastro in aritmetica (per non parlare di matematica) sa valutare istintivamente quantità e rapporto tra quantità. Per esempio quando si parla di soldi.

Se qualcosa vale 10 e qualcosaltro vale 2 di prima vi viene di dire che qualcosa vale molto più di qualcosaltro. La differenza tra 2000 euro al mese e 10.000 euro al mese è enorme.

Ma la differenza tra 3,3 euro e 4 euro è inferiore  (log 2000= 3.3, log 10.000= 4).  Non solo in termini assoluti, ma anche in termini di rapporto tra i valori. Chi guadagna 10.000 euro al mese ha entrate cinque volte più grandi di chi guadagna 2000 euro al mese. Ma chi ha nel borsellino 4 euro ha 1,2  volte le monete di chi ha in tasca 3 euro e 30 centesimi (tutto questo potrebbe essere riassunto dai grafici sovraposti di y=x e y=logx ma quelli che troverebbero l'immagine chiara e immediata sarebbero pochi).

Che il logaritmo abbia come base 10 o e le cose non cambiano: il logaritmo smorza le differenze tra valori grandi e valori piccoli, ed esalta quelle tra i valori piccoli e 0. Usare una scala logaritmica  seguendo questo principio ha l'effetto di aumentare graficamente i valori piccoli e ridurre, sempre graficamente, quelli più grandi. E a seconda di quello che si intende comunicare questo può essere molto utile. E infatti negli ultimi anni si è verificato un uso improprio dei grafici logaritmici, passato per scienza come al solito (un tempo dire "la matematica dei biologi" bastava a provocare sghignazzi, oggi vabbe'...). Tra fine 2020 e 2021 l'epidemia secondaria fu quella dei grafici logaritmici perché, come ormai avrete capito, usato in questo modo il logaritmo è una specie di specchio deformante. Così un'oscillazione nella base del numero dei casi di COVID riportati diventava l'inizio della nuova apocalisse etc etc. Una retta, in un grafico logaritmico, rappresenta una funzione esponenziale e quindi in quei grafici un segmento piccolo a piacere poteva servire a dire: ricomincia un'ondata - e se poi l'ondata arrivava due mesi dopo era irrilevante, perché si trattava di previsioni scientifiche, mica di attrezzi per la sezione del legno...

Che vuol dire tutto ciò? Che come sempre il diavolo è nei dettagli. E che se qualcuno sui social ha detto o dice "Scienza perché la rappresenazione logaritmica dice che"  beh, sapete come disporne, se già non lo sapevate prima.


ΔG°=RTlnK

ΔG°=RTlnK

ΔG°=RTlnKΔG°=RTlnK

mercoledì 24 agosto 2022

PIU' LE COSE CAMBIANO...




A costo di annoiarvi ribadirò ancora una volta l'importanza che per me ha avuto Douglas Hofstadter.
Prima che con Goedel, Erschel, Bach con i suoi Temi Metamagici, apparsi per anni su Scientific American e in Italia su Le Scienze - potete pure evocare parabole discendenti, e non è che con New Scientist le cose siano andate diversamente. Ai tempi, tra fine anni settanta e primi ottanta trattò spesso il Dilemma del Prigioniero.
Chi non lo conosce capirà più avanti perché al tempo Hofstadter lo trovasse un argomento non solo affascinante, ma di capitale importanza.
Il Dilemma del Prigioniero (https://it.wikipedia.org/wiki/Dilemma_del_prigioniero) è un problema della teoria dei giochi in cui la soluzione
più vantaggiosa per entrambi i giocatori è la cooperazione (tace, tace) che però non costituisce un punto di equilibrio.
Si prevede che la soluzione finale sia sempre quella in cui uno dei due tradisce l'altro.
E ora veniamo a un brano di Hofstadter del 1983:
Sulla piccola scala siamo costantemente davanti a dilemmi come quello del Prigioniero,
dove l'interesse personale è in conflitto con il bene collettivo. Per una qualsiasi coppia di persone il dilemma è virtualmente identico. Quale sarebbe un comportamento sano in tali situazioni?
Perché sia veramente sano l'elemento chiave è ognuno dei due individui sia capace di riconoscere che il dilemma è simmetrico
e che gli altri soggeti che lo affrontano hanno le sue stesse capacità di farlo.
Tali coppie di individui che coopereranno tra loro superando le tentazioni del puro egoismo non sono semplicemente razionali:
sono super-razionali, o in breve sani di mente.
Ma ci sono dilemmi e "ego" anche a un livello sovraindividuale.
Viviamo in un mondo riempito di opposti sistemi di credenze così simili da essere interscambiabili, eppure chi vi aderisce è incapace di vedere tale simmetria.
Questa descrizione non applica solo alla miriade di piccoli conflitti nel mondo, ma anche alla colossale oppisizione di blocchi tra Stati Uniti e Unione Sovietica. Eppure il riconoscimento della simmetria - in breve la sanità mentale - non è ancora arrivato.
Che ha fatto una specie intelligente come la nostra per infilarsi in questo orribile dilemma? Cosa può fare per uscirne?
Siamo tutti impotenti mentre guardiamo il dispiegarsi di questo spettacolo o la risposta è, per ognuno di noi, nel riconoscimento della nostra propria specificità e in piccoli passi a livello individuale verso l'equilibrio mentale?

 

giovedì 28 aprile 2022

ETERNE GHIRLANDE BRILLANTI - SALTARE FUORI DAL SISTEMA

Se nei primi anni di università ho dovuto macinare quella che mi pareva una inumana quantità di analisi matematica ("Che non serve a un chimico!" pensavo), poi vista applicare in scala ridotta negli esami di chimica fisica, un qualche senso a tutto ciò lo trovai leggendo "Goedel, Escher, Bach" di Douglas Hofstadter.
Per certi versi parte del libro è diventata abbastanza datata, ma le sue "fondamenta" neanche un po'. Il senso di tutto quel che avevo dovuto trangugiare sugli spazi hilbertiani al secondo anno lo trovai nei primi capitoli di questa opera. Che continua a possedere una incredibile quantità di virtù e di spunti, per esempio quando parla di procedure, e specialmente di procedure ricorsive (teoremi, frattali, Escher).
Di questi tempi si parla molto di intelligenza artificiale e machine learning (temi tra i tanti trattati da Hofstadter). E questo passo mi pare oggi ancora di estrema attualità
"Una proprietà intrinseca dell'intelligenza è che può saltar fuori dal task che sta effettuando ed esaminare quello che è stato prodotto. Cerca continuamente pattern e spesso li trova. Ho detto che un'intelligenza può saltare fuori dal task, ma questo non significa che lo farà sempre. Comunque un piccolo suggerimento spesso basterà. Per esempio un essere umano che legge un libro può diventare insonnolito. Invece che continuare a leggere il libro fino alla fine probabilmente lo metterà da parte e spengerà la luce. E' "uscito dal sistema", eppure ci sembra la cosa più naturale del mondo. O supponete che l'individuo A stia guardando la televisione quando l'individuo B entra nella stanza e mostra evidente disappunto per la situazione. L'individuo A può pensare di aver capito il problema e tentar di rimediare uscendo dal presente sistema (il programma televisivo) e cambiare canale per cercare uno show migliore. L'individuo B può avere una concezione più radicale di cosa sia "uscire dal sistema", per esempio spengere la TV. Certo ci sono casi dove soltanto un raro individuo avrà una percezione del sistema che governa le vite di molti altri, un sistema che non è nemmeno stato riconosciuto come sistema. Tali persone spesso dedicano la propria vita a convincere gli altri che il sistema esiste e che bisogna uscirne."
(Qualche pazzo ha scansionato pagina per pagina "Goedel, Escher, Bach" e lo ha passato all'OCR - ma non ha effettuato una correzione ortografica accurata, ad occhio e croce. Il risultato lo trovate qua https://www.physixfan.com/wp-content/files/GEBen.pdf)

 

venerdì 28 gennaio 2022

IL NUOVO INQUILINO DI LAGRANGE 2

Il telescopio Webb è arrivato a destinazione. Per quanto riguarda il telescopio in sé rimando a Luca Signorelli (
https://www.facebook.com/luca.signorelli.33/posts/10226308309834653), ma vorrei soffermarmi appunto sulla meta di Webb, il Punto di Lagrange 2 (https://it.wikipedia.org/wiki/Punti_di_Lagrange).
I Punti di Lagrange vengono fuori dal problema dei tre corpi (https://ilchimicoscettico.blogspot.com/.../le-nuvole-del...), che ricordo non è risolvibile nella sua forma generalizzata. Ma in forme semplificate lo è, eccome. E una possibile semplificazione è postulare che uno dei tre corpi abbia una massa molto piccola rispetto agli altri.
Joseph-Louis Lagrange (1736-1813, che in realtà di cognome faceva Lagrangia ed era italiano) fu quello che li scoprì, nel 1772, calcolandone la posizione. Li scoprì sulla carta, ovviamente: cinque punti dello spazio in cui l'oggetto piccolo è in equilibrio gravitazionale con i due oggetti grandi.
Due secoli dopo lo sviluppo dell'astronautica ha verificato l'esistenza dei Punti di Lagrange per il sistema Sole-Terra. Lagrange 2, in particolare, è situato ben oltre l'orbita lunare, una posizione eccellente per "guardare fuori".
Inutile dire che i punti lagrangiani sono diventati un topos della fantascienza: sono i punti in cui vengono collocati futuribili habitat spaziali.
E qua non posso non ricordare Gundam Universal Century: attorno a Lagrange 2 orbita Side 3, il Principato di Zeon ( e A Baoa Qu, e Solomon http://www.japananimerobot.com/gundam/colonie/colonie.html).
A proposito di Principato di Zeon, e poi Repubblica etc, ai più viene in mente il primo, indimenticato Gundam, altresì noto come Gundam 0079 (https://it.wikipedia.org/wiki/Mobile_Suit_Gundam ). Io invece vorrei ricordare Gundam 0083 (https://it.wikipedia.org/wiki/Mobile_Suit_Gundam_0083:_Stardust_Memory), noto anche come Stardust Memory.
E lo ricorderei con due video.

 

 L'altro (senza molesti pop up) pare si trovi solo so facebook: https://www.facebook.com/watch/?v=372261789811739

mercoledì 5 gennaio 2022

FORME DIFFERENZIALI E TERMODINAMICA

https://www.youtube.com/watch?v=S8exyRjtatE

Qualcuno forse si era perso il discorso sui "tricicli" di Carnot (https://www.facebook.com/chimicoscettico.blogspot/posts/3055393858012814), ed altri si erano chiesti che senso avesse integrare una funzione in un intervallo uguale a zero...
Eh beh, il fatto è che funzioni di stato e percorsi chiusi (cioè che ritornano nel punto da cui si è partiti) hanno una lunga storia.
U (energia interna), H (entalpia), S (entropia) sono funzioni di stato, cioè dipendono solo dal punto in cui il sistema si trova. Quindi se facciamo fare al sistema un lungo giro per riportarlo alla fine al suo punto di partenza la variazione di una sua qualsiasi funzione di stato è 0. Ma perché?
Un modo per metter giù la questione è questo: le funzioni proprie di un sistema sono appunto funzioni, e se una funzione f è differenziabile il suo differenziale si scriverà df (per un tentativo di spiegazione delle basi e del significato di questi temi https://ilchimicoscettico.blogspot.com/.../dinamiche...). Per cui per esempio per G (energia libera di Gibbs)

dG=dH-TdS

e questa, anche se i più non ci pensano, è una forma differenziale. E si dà il caso che sia una forma differenziale esatta, cioè il suo integrale lungo un percorso chiuso è uguale a 0 (la cosa lunga la trovate qua https://www.youmath.it/.../672-forme-differenziali-chiuse...).
Il video spiega tutto questo molto meglio di quanto non riesca a fare io: "Le funzioni di stato come differenziali esatti"



mercoledì 14 ottobre 2020

MONNEZZA STATISTICA OGGI

 


Della serie: famo a falla tornare.
Quante volte s'è detto, qua sopra "Levategli dalle zampette il software statistico"?
Hanno fatto più danni i package di R, Orazio, di quanti tu ne possa sognare sulle tue dispense di biostatistica...

Ho bruciato preziosi minuti di vita, negli ultimi mesi, per rispondere a negazionisti e no-vax che venivano a dirmi "questo articolo DIMOSTRA che la vaccinazione antiinfluenzale aumenta il rischio COVID!".
Solo che la correlazione aveva un Intervallo di Confidenza (CI) largo come un'autostrada, e gli stessi autori poi hanno precisato che non sostenevano assolutamente questa correlazione, nell'articolo. Ma certe fedi non si lasciano mettere in dubbio da piccolezze del genere.
"Eh, ma quelli vanno avanti a pseudoscienza", si dirà. Sì, e invece gli altri?
Invece gli altri pure.
"Per esempio?" si dirà.
Per esempio "Relationship between Influenza Vaccination Coverage Rate and COVID-19 Outbreak: An Italian Ecological Study"  (Vaccines 2020, 8, 535 https://www.mdpi.com/2076-393X/8/3/535).
Una di quelle cose che di prima ti viene da dire "ma come, ma non era correlation is not causation, fino all'altroieri?", perché il razionale della cosa boh, e quantomeno sarebbe richiesta una prova sperimentale prima di spararla (tipo verificare che gli anticorpi contro i virus influenzali neutralizzino SARS-CoV-2, per esempio, o cose più sofisticate che includano l'immunità cellulare).
L'articolo era giusto roba buona per un titolo di giornale e tutto finisce lì.
Ma invece periodicamente mi chiedono di questa roba, magari perché "il scienziato" di turno la condivide. Io mi sono limitato a citare Joe Di Baggio, che aveva fatto vedere che manco i cani... A questo giro, una volta per tutte, lo linko, in modo che non se ne parlì più, perché di monnezza in giro ce n'è anche troppa:

"Vorrei far notare che il miglior modello, per esempio, che lega tassi vaccinali e ospedalizzati con sintomi (il riferimento è sempre all'articolo ecologico, quindi dove non sappiamo se l'ospedalizzato fosse vaccinato o no) è una polinomiale di terzo grado. Dopo il 65% di copertura si prevede rialzo dei tassi standardizzati di ospedalizzazione :-) E' una cagata? Sì, le analisi non si fanno così, ma solo per mostrare che quella circolata ieri era una supercagata dove, come già ricordato, non si considera che un OLS è fondato sull'ipotesi di esogeneità pura dei regressori e se le correlazioni coi confounders sono alte, si ha endogeneità ovverosia correlazione con l'errore e il modello è teoricamente inficiato (che poi è la realtà). Stimando i parametri di una multiregressione, non ci fanno vedere come progredisce la varianza spiegata, se ci sono segni di collinearità. Insomma, siamo a Corrado e ai dilettanti allo sbaraglio."

(https://www.facebook.com/jdbaggio/posts/10217763373171891)

(Ma li vedete i punti? Ma cosa caspita vuoi correlare con quella roba?)

(quante se ne è viste negli anni... chi si ricorda tre anni fa quelli che volevano trovare una correlazione LINEARE tra copertura vaccinale e casi di morbillo, in Italia, lasciando elegantemente fuori il Lazio come outlier?)

venerdì 17 luglio 2020

LA MATEMATICA LOGORA (CHI NON LA SA)


Se non lo sapete, chi gestisce una pagina fb ha un quadro delle reazioni negative a un post; vengono contate le seguenti azioni: nascondi post, nascondi tutti i post, segnala come spam.
Di solito queste azioni sono poche (segnala come spam è rarissima), massimo due o tre per i post che trattano i temi più divisivi (mascherine, rischio COVID, vaccini, politiche governative antipandemiche).
Mi ha stupito che siano apparse sotto al post "A che serve la matematica?" (https://ilchimicoscettico.blogspot.com/2020/07/a-che-serve-la-matematica.html)
Come è che un post del genere abbia avuto reazioni negative così viscerali?

C'è da mettere in conto il classico comportamento da social, cioè leggo il titolo, non leggo il post né i link, lo interpreto secondo il mio pregiudizio (domanda retorica, la risposta è "la matematica non serve"), reagisco.
 
Ma ho la netta impressione che ci sia altro.
Inutile dirlo, perlopiù i post con trattazione matematica qua sopra sono stati in genere tra quelli meno letti di sempre. Ma... le reazioni a certa matematica riguardo due temi (omeopatia, dinamica delle malattie infettive) sono state forti. Il tipico medico/biologo/qualsosainscienzedellavita matematicamente analfabeta (e spesso militante nel frontismo proscienza) reagiva malissimo, perché la trattazione analitica urtava violentemente contro la sua concezione (ideologica) di questo o quel tema, finendo per esempio per giustificare errori di un ordine grandezza nei conti della sua bibbia (noto bestseller di noto virologo).
La matematica logora chi non la sa, specie se non sapendola ne cita a sproposito i risultati. E quando i risultati hanno a che fare con le dinamiche di questo o quel fenomeno (https://ilchimicoscettico.blogspot.com/2019/01/dinamiche-equazioni-differenziali.html) o con i modelli continui (e funzionanti) che hanno costruito le basi della chimica (https://onlinelibrary.wiley.com/doi/book/10.1002/9781118698723) la reazione avversa può essere viscerale.

lunedì 13 luglio 2020

A CHE SERVE LA MATEMATICA?




Gran bel post di Margerita Carletti, questo:



Me lo ricordo distintamente, in un secondo anno di università dove matematica per i primi mesi significò spazi hilbertiani, misura di Riemann, teorema di Banach Caccioppoli: ce lo chiedevamo tutti, a che serve questa roba a dei chimici? Che ci facciamo?
Ci sembravano inutili forche caudine sotto cui dover passare, e con immensa fatica
La mia personale folgorazione arrivò al terzo anno. Per qualche ragione tra i vari argomenti di Analisi II quelli che mi avevano ispirato di più erano stati le equazioni differenziali e le forme differenziali. E da chimica fisica senza equazioni differenziali non ne uscivi, ma soprattutto le forme differenziali trovarono significato: i differenziali di diverse funzioni di stato erano differenziali esatti (il loro integrale lungo percorsi chiusi è 0), e la termodinamica classica è costruita sulle funzioni di stato.

A parte il discorso galileiano dell'universo come libro scritto in caratteri matematici per quel che riguarda le scienze della vita qua sopra sono state citate e ricitate ecologia delle popolazioni (https://ilchimicoscettico.blogspot.com/2018/04/quando-due-piu-due-non-fa-quattro.html), dinamica delle malattie infettive (https://ilchimicoscettico.blogspot.com/2019/06/chimica-e-morbillo.html), ritmi circadiani (https://ilchimicoscettico.blogspot.com/2019/03/jeffrey-c-hall-e-gli-altri-il-nobel-per.html).  E sono tutte questioni di feedback o retroazione che dir si voglia (https://ilchimicoscettico.blogspot.com/2019/05/feedback-caos.html).
Al di là della statistica (e sappiamo bene che la statistica continua ad essere un punto dolente, quando si parla di scienze della vita), la matematica serve a comprendere la dinamica di svariati sistemi biologici.

lunedì 17 febbraio 2020

UNA CONFESSIONE




La recente scomparsa di Louis Nirenberg, il mago delle PDE (equazioni differenziali alle derivate parziali, https://www.nature.com/articles/d41586-020-00449-y?utm_source=twt_nnc&utm_medium=social&utm_campaign=naturenews&sf230255996=1) mi ha fatto tornare indietro di 3 anni.
Quando la pagina è partita, nel maggio del 2017, non ricordavo di aver mai sentito nominare l'immunità di gregge o R°. Provando ad applicare il mio bagaglio professionale, di base l'approccio di massima non toccava i modelli dinamici delle malattie infettive (beh, se cascavano gli occhi su qualcosa che modello non era ma per tale veniva spacciato la reazione c'era, ma era prevalentemente istintiva).
Fu solo quando qualcuno della frangia sciroccati arrivò qua sopra a sragionare di scientismo e determinismo che andai a ripescare il caos deterministico. E andando a cercare nella mia biblioteca ne estrassi "Gli ordini del Caos" prima, e "La fine delle certezze" poi. Letture della mia gioventù, quando nei primi anni 90 trovavo il Caos un tema estremamente affascinante. Fu rileggendo il primo dei due libri che ritrovai un passo che avevo rimosso: Robert May e il morbillo a New York. Chiara la ragione della rimozione: a un chimico industriale in tesi del morbillo e delle linci canadesi importava poco o niente, era più interessato a cose che avessero a che fare con i transienti oscillanti in reattori chimici e storie del genere. Comunque, ritrovando quel passo ho fatto la cosa che si dovrebbe essere abituati a fare: la ricerca bibliografica - e rifamiliarizzando con questi temi era chiaro che i modelli non lineari alle derivate parziali delle malattie infettive erano isomorfi alle cinetiche delle reazioni autocatalitiche.
Quello che mi ha lasciato perplesso è che mi è parso di essere l'unico a fare la cosa che a me sembrava più ovvia. Per quale motivo è andata così? 
L'immancabile conclusione era che la letteratura (scientifica, ovviamente) era in netto contrasto con quel che veniva detto a gran voce sui giornali, in TV, in rete. Chi l'avrebbe mai detto, come i diagrammi di stato anche le PDE erano diventate eversive.

lunedì 14 ottobre 2019

SOMARISTI, ECONOMISTI ANACOLUTISTI MA "COMPETENTI" ETC

Mi hanno fatto ricordare che un annetto fa mi beccai del "somarista pentastellato" da un certo economista di Farsi Per Agevolare il Declino, che non doveva vederci bene, se non altro quanto a coloritura politica. Il motivo? Avevo fatto presente una banale evidenza: un gruppetto di soliti noti (un giornalista ostrogoto, un gestionalista ingegnerizzato, un coso arabizzante e starnazzante) stava definendo un certo amico loro "scienziato di livello mondiale", e il loro amico aveva qualche migliaio di citazioni mentre i vertici della classifica del suo settore viaggiavano oltre le centomila citazioni. Ordini di grandezza di differenza (due), non bruscolini.
E mi hanno fatto chiedere di nuovo: una funzione f(x,x) in che razza di spazio è definita? Quante dimensioni ha questo spazio?
Mi spiego.
f(x) è definita su uno spazio monodimensionale. E rende una "curva" di un qualche genere sul piano cartesiano. Tutti avete fatto a scuola le equazioni di secondo grado e le parabole. la parabola è una f(x): y=f(x)=a+bx+x^2.

Image result for parabola

f(x,y) invece è una funzione definita su uno spazio bidimensionale, un piano i cui assi sono x e y.
I suoi valori individueranno una superficie. Per esempio un piano inclinato è funzione di x e y:
f(x,y)=z=ax+by



Dopo di che le funzioni di tre variabili o più definiranno ipersuperfici etc etc etc .

Fin qua ci siamo? Ora, chi mi dava del somarista ha sul suo sito un paper bello concettoso (nel senso di pieno di analisi matematica - apparente): http://www.micheleboldrin.com/Papers/acyclicity_jet.pdf. L'impressione è che i reviewer di International Economical Review abbiano visto funzioni, differenziali e serie di funzioni e abbiano detto "ok, ci fidiamo, pubblichiamo". Il revisore che si fida o che sonnecchia non è roba rara, di questi tempi.
Io di modelli economici so 0, ma qualche elemento di analisi matematica addosso mi è rimasto.
Scorrendo l'articolo ho visto questo

Immagine

Un errore tipografico, sicuramente. Questo è quello che ho pensato. u(x,x) stava in realtà per u(x,y).
Ma andando avanti nell'articolo l'uso di funzioni f(x,x) era costante, con roba di questo genere:



Un anacoluto matematico non da poco.
E poi, al di là della forma, qual è il senso, che vuol dire f(x,x)?
La risposta più calzante alla domanda è stata questa:


Ma l'anacolutismo matematico è diventato per molti una virtù, a quanto pare...

P.S. E' una questione di notazione (se la cosa fin qua era oscura).  Mi dicono: restrizione di f(x,y) con x=y o y=costante (univoco da morire).  La più gettonata è la restrizione di f(x,y) alla bisettrice dei quadranti uno e tre del piano cartesiano. Ottimo. Peccato che per sottoporre f(x,x) ad un'operazione banale come la derivazione ci si debba produrre in una serie di rigiri. Infatti da generica funzione f(a,b) vengono ∂f(a,b)/∂a e ∂f(a,b)/∂b. Se si applica a f(x,x) vengono fuori notazioni senza senso, quindi servono una serie di convuluzioni. Quando si dice notazione compatta e funzionale.

venerdì 12 luglio 2019

MITOLOGEMI (E EQUAZIONI DIFFERENZIALI)


https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5530967/
La narrazione sulla pertosse ha negli anni recentissimi assunto connotazioni mitologiche, di quelle fondative (di associazioni).
La pertosse circola perché laggenteignorante non vaccina i figli, e l'esavalente (che contiene il vaccino antipertosse acellulare, aP) non raggiunge il 95% richiesto per l'immunità di gregge.
Parrebbe non fare una grinza, giusto?
Come al solito, parlando della "narrazione" 2015-2018, there's always a catch. E dove è l'inghippo? Che le più recenti rilevazioni in Europa danno per la pertosse un basic reproduction number (il famoso R°) di 5.5 (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2889930/). Da cui viene fuori una soglia di immunità di gregge di 82%. 82, non 95. Quindi guardando le coperture per l'esavalente, sempre rimaste sopra il 90%, il problema non si porebbe.
Non si porrebbe ma si pone, invece, perché a differenza del vecchio vaccino a cellule intere (wP) aP è di fatto quasi inefficace nel limitare la circolazione del batterio. Ottima protezione individuale, scarsissimo effetto nel limitare la diffusione.

Quindi, ritornando alla "narrazione" stiamo parlando di un mitologema in piena regola, senza alcun contatto con la realtà delle cose. E a mitologemi non si dovrebbe mandare avanti un dibattito sulle politiche sanitarie. Ma fortunamente qualcuna delle voci che andavano avanti a mitologemi si è ridotta a un volume flebilissimo. Meglio così.

La pertosse aveva un R° più alto, in passato, e viene in mente il Regno Unito. E il problema finì per produrre uno dei più begli interventi in materia di dibattiti sulle vaccinazioni mai pubblicati, che potete ritrovare qua: https://ilchimicoscettico.blogspot.com/2018/04/la-logica-della-vaccinazione-1982-uk.html . Non è l'unica cosa interessante, riguardo alla pertosse, che è molto più complicata del morbillo da molti punti di vista. Per esempio l'infezione non provoca un'immunità perenne, ma i contatti non sono tutti efficaci nella trasmissione perché i reinfettati hanno una trasmissività più bassa. Da un punto di vista endemico quindi una dinamica molto complessa. Ma anche per un outbreak singolo. Per un outbreak di pertosse il modello più adatto è il SEIR. Rispetto al SIR (Susceptibles, Infectives, Recovered) aggiunge gli Exposed (il gruppo con infezione latente).
Esaminiamo la sua versione più scarnificata, senza mortalità. Ricordo che β velocità di propagazione dell'infezione, γ velocità di guarigione dall'infezione, a cui si aggiunge ɛ , costante cinetica... ops, coefficiente di velocità per il passaggio da infetto con infezione latente a infetto.




Al colpo d'occhio dovreste notare che rispetto a SIR abbiamo aumentato il livello di complessità e non di poco. In SIR dS/dt è funzione di S e dI/dt è funzione di I. Qua aggiungiamo dE/dt funzione di E.

Il tutto finisce per dare in questa classe di modelli spazi delle fasi tridimensionali con il loro fascino visuale.

https://www.researchgate.net/figure/Phase-space-representation-of-the-evolution-of-the-system-toward-a-stable-focus-type_fig21_239061421



giovedì 27 settembre 2018

LEVATEGLI DI MANO IL SOFTWARE STATISTICO

Alla fine tutta la questione la riassume una vignetta di xkcd, tra le migliori di sempre:



Ormai il data mining per tirare fuori correlazioni tra pinco e pallino sono anni che va di moda in campo pubblicazioni di materia medica. E da anni ne vengono fuori di tutti i colori.
Ho visto rimbalzare questa in giro: https://academicjournals.org/journal/JPHE/article-full-text-pdf/C98151247042 .
"Impact of environmental factors on the prevalence of autistic disorder after 1979": "Fattori ambientali", giusto per fare un po' di fumo, perché poi si va a cascare sempre lì: vaccini e autismo.
Pare che il metodo vero (non dichiarato) sia stato: vediamo se troviamo qualcosa che fitta bene. E lo trovano, grazie all'oculato uso di sw statistico. Ma hanno la disinvoltura di mettere accanto anche le due curve, cosa che evidentemente, per gli autori, è ininfluente per la validità della tesi.
E lì, letteralmente, casca l'asino.
Osservate l'immagine. Le diagnosi di ASD nel tempo sono di fatto una retta. La copertura dell'antivaricella è invece una curva evidentemente asintotica (non può essere diversamente, la copertura non può andare oltre il 100%).





Nei primissimi anni della campagna di immunizzazione era legittimo avere dubbi: andamento all'incirca lineare delle coperture, andamento all'incirca lineare delle diagnosi. Qualcuno li ebbe, in California, mi pare, e rilevò che comunque i conti non tornavano, perché le diagnosi crescevano più velocemente delle coperture. In questo specifico caso è l'esatto contrario, ma la cosa non ci interessa perché qua abbiamo il quadro completo. Guardare la seconda metà del grafico: coperture piatte, diagnosi crescenti - non stanno assieme neanche a prenderle a calci. In breve, è come voler forzare un cubo in un foro a forma di trangolo (equilatero e con lato uguale o minore allo spigolo del cubo, per essere precisi).
Ovviamente, se non si ha occhio per questi dettagli va bene tutto, e poi ci si ritrova in discussioni del genere "negate l'evidenza" vs "film con Nicolas Cage e morti annegati in piscina".
La cosa fa il paio con quest'altro articolo, apparso su Science nel 2015, non su un open access qualsiasi, quindi ben diverso impact factor.
Si tratta di "Long-term measles-induced immunomodulation increases overall childhood infectious disease mortality", http://science.sciencemag.org/content/348/6235/694 .
Wow! Perché si sa che il morbillo lascia il sistema immunitario provato per qualche tempo dopo la malattia, ma tre anni... chi l'avrebbe detto.
E infatti venne rilanciato da Focus e chissà quanti altri ne seguirono l'esempio. Poi lo leggi e ti cadono le braccia. Anche qua data mining:
 "Applichiamo una funzione gamma". Come?
Non è dato saperlo, ma viene da sospettare in modo da pesare di più i punti che giocano a favore della tesi, che sarebbe: le morti infantili avvenute entro 3 anni dal morbillo sono da collegare al morbillo (grazie, JDB).
E poi ti ritrovi dei grafici in cui la metà dei punti sta fuori dal Confidence Interval.

E questa roba ovviamente è stata usata da qualcuno che voleva ribadire l'esageratamente alta pericolosità del morbillo a qualsiasi età. Felicitazioni a costoro per il background statistico. Ma qui non è neanche questione di cultura statistica: qui si tratta di avere un minimo di occhio per i dati. Anzi, non di occhio: di rispetto.


martedì 17 aprile 2018

DURO O MORBIDO? DOVE NON SI PARLA DI TORRONE, MA DI MODELLI


(Post ostico e con trattazione matematica, che piacerà ai soliti e molto meno a tutti gli altri, ma contiene elementi concettuali importanti)

Prendiamo una classica reazione con cinetica del primo ordine:

N2O5(g) ⇄ N2O4(g) + ½ O2(g)

Per praticità chiamiamo A la concentrazione (in realtà una pressione parziale) di N2O5(g) . La velocità di reazione (la velocità di scomparsa di A) può essere scritta come -dA/dt, dove t è il tempo, e sarà:

-dA/dt=kA

Dove k è la costante cinetica per questa reazione. k incorpora la dipendenza della velocità di reazione dalla temperatura. E' una costante  a temperatura costante, ma della temperatura è funzione: k=Ae^(-Ea/RT), e notare bene che qui A è il fattore preesponenziale, e non ha a che fare con la concentrazione A che abbiamo usato nell'equazione cinetica. Ea è l'energia di attivazione, R la costante dei gas, T la temperatura. Ma noi lavoriamo sull'equazione cinetica a temperatura costante, quindi esplicitare k non serve.
Integrando l'equazione differenziale avrò A=A°e^(-kt), dove A° è la concentrazione iniziale di N2O5(g). Se andrò a misurare la concentrazione di N2O5 nel tempo, troverò valori che staranno sul grafico di questa curva esponenziale negativa.
Quindi, se per una qualche reazione chimica ipotizzo correttamente una cinetica di primo ordine (o pseudo primo ordine) potrò "fittare" i miei dati con un'esponenziale, anzi, per farla più facile posso passare ai logaritmi naturali e fittarli con una retta, ovvero trovare un valore di k per cui la distanza tra i punti sperimentali e la retta è minima (perché i punti non stanno esattamente sulla retta? A causa dell'errore sperimentale).
 In generale se prendiamo i nostri punti sperimentali possiamo verificare secondo alcuni criteri l'ordine della cinetica di reazione, e quindi con quale tipo di funzione fittare i punti.
E questo è un modello "hard", ovvero io "impongo" questo modello sui dati sulla base delle mie conoscenze sul fenomeno.

Nella sintesi chimica i modelli hard hanno una caratteristica: funzionano bene per sistemi relativamente semplici, ma possono essere una perdita di tempo per sistemi molto complicati. E ci sono moltissimi casi in cui sappiamo quali possano essere le variabili che giocano nel comportamento del processo, ma non abbiamo nessuna idea di quale sia il loro peso, di come e quanto contribuiscano. E allora che si fa? Si passa ai modelli soft. Visto che non ho un modello funzionale da "imporre" ai miei dati, lascio che sia l'analisi dei dati stessi a suggerire un qualsiasi modello.
Facciamo un esempio abbastanza standard. A+B danno C+D, la reazione è catalizzata da un acido ed essendo la reazione esotermica (ovvero sviluppa calore), viene effettuata in semicontinuo, cioè aggiungendo ad una certa velocità B ad A. Non ci interessa individuare con esattezza quali sono i meccanismi coinvolti, ci interessa massimizzare la resa in C. Che si fa? L'approccio classico è cominciare a variare una grandezza alla volta per ricavare quale influenza ha sui risultati. Abbastanza lungo, macchinoso, assolutamente non pratico, dato che le variabili sono quantità totali di A e B, quantità del solvente, dell'acido, temperatura, velocità di aggiunta di B.
Ma d'altra parte è ragionevole pensare che la mia resa in C, che chiamerò y, sia una funzione di un qualche tipo di tutte le variabili elencate (che chiameremo xi con i che va da 1 a n):

y=f(x1, x2, .... xn) + e             (dove e è un parametro).

Questa funzione può essere espressa da una serie di Taylor (https://it.wikipedia.org/wiki/Serie_di_Taylor), e verrà fuori:

y= β°+ β1 x1+ β2 x2+...+ β1,2 x1x2+...+  β1,1 x1^2+... + βn,n xn^2+...+ R(x)+e

(i termini β corrispondono a derivate)

Visto che per la maggior parte delle applicazioni chimiche basta arrivare ai termini quadratici della serie, si può eliminare R(x) in quanto trascurabile e senza avere nessun tipo di idea su come i vari meccanismi del processo contribuiscono a y abbiamo comunque un "attrezzo generico" da utilizzare per trattare i nostri dati sperimentali. Vi risparmio l'algebra matriciale, ma in questo modo è possibile un approccio multivariato: invece che cambiare il valore di una variabile alla volta, posso cambiare più variabili contemporaneamente in una sequenza di combinazioni che mi rende possibile con un numero limitato di esperimenti ottenere i valori di βn.  Verrà fuori che di tutti i termini della serie alcuni avranno  β trascurabile, e quindi saranno ininfluenti, mentre altri costituiranno contributi più o meno importanti a y (ovviamente otterrò valori di β validi entro gli estremi dei dati sperimentali, non estendibili al di fuori di questo spazio). In questo modo posso capire quali sono le variabili che veramente giocano nel processo, perché quelle xn sono quantità iniziali, velocità di aggunta, etc.
Non ho "proiettato" nessuna teoria sui dati, mi sono limitato a osservarne e ad analizzarne il comportamento. Questo è l'approccio del Design Of Experiments, e se dovessimo applicarlo alla prima reazione di questo post, otterremmo risultati coerenti con una cinetica del primo ordine.

CHI SONO? UNO COME TANTI (O POCHI)

Con una laurea in Chimica Industriale (ordinamento ANTICO, come sottolineava un mio collega più giovane) mi sono ritrovato a lavorare in ...