Cosa fa un data scientist e come lo si diventa? In attesa del corso Avanced Analytics e Decisioni, abbiamo cercato di rispondere a questi quesiti. Una professionalità nuova e molto richiesta dal mercato per cui però non è ancora codificato alcun curriculum formativo. Tra statistica, informatica, business e comunicazione, le indicazioni che provengono dagli scienziati dei dati più affermati.

4737175298_ecf385f2c5_zDJ Patil, oggi Chief Data Scientist della Casa Bianca, mentre illustra una visualizzazione delle reti sociali ai tempi in cui ricopriva il ruolo di Head of Data Products and Chief Scientist in LinkedIn. Fonte Flickr.

L’Harvard Business Review lo definì già tre anni fa ‘la professione più sexy del XXI secolo’. Sexy perché rara e molto ambita, “come un unicorno” secondo un’altra celebre definizione in voga tra gli executives anglosassoni. Ed effettivamente la figura del data-scientist, definizione che tecnicamente fino al 2008 non esisteva nemmeno, negli ultimi 3 anni ha conosciuto una fortuna notevole. Gli ‘scienziati dei dati’ sono richiesti trasversalmente dal mercato del lavoro, sia da start-up nate e cresciute all’ombra della web economy, sia da colossi dell’industria e dei servizi il cui core business ha poco a che fare col digitale. Da Booking.com a British Airways al New York Times.

Ma non solo, la capacità di sussurrare ai dati, o meglio di mettersi in ascolto delle verità che si celano sotto la straordinaria quantità di big data, è apprezzata anche dal mondo dello sport – con quella che oltreoceano è una vera e propria mania per la statistica degli incontri sportivi e che da poco è sbarcata anche nel vecchio continente – e dalle istituzioni pubbliche e private più illuminate, che stanno rispolverando le teorie Comtiane della fisica sociale alla luce della grande disponibilità di dati e di tecnologie per analizzarli.

Fisica sociale, l’ultimo libro pubblicato dal direttore del MIT Media Lab, Alex Pentland.

Chi è il data scientist?

La professione del data scientist però è tanto richiesta quanto sfuggente e dai contorni ancora poco definiti. A comporre il bouquet di abilità concorrono sicuramente la statistica e la programmazione, ma nessuna delle due competenze definisce completamente il profilo di questo nuovo scienziato. Non si tratta infatti semplicemente di analizzare data set o di ottimizzare gli algoritmi per l’elaborazione, il lavoro del data scientist inizia quasi sempre prima che ci sia un data set strutturato e sviluppa codice per programmi che fanno dei dati quello che nessuno in azienda aveva ancora pensato si potesse fare. Per questo a leggere le interviste ai più affermati professionisti del settore ci sono ameno altre due caratteristiche ricorrenti: l’affinità col business, non tanto del settore merceologico o di servizi di cui si occupa l’azienda, ma con una visione business-oriented, e una buona dose di creatività. Saper pensare in modo nuovo sulle informazioni già a disposizione è infatti imprescindibile, dato che quel che fa un data scientist è “scoprire qualcosa mentre nuota in un mare di dati”. Creatività che nasce dalla curiosità, come spiega in un’intervista Vanessa Sabino, data scientist brasiliana, trasferitasi in Canada a dirigere il team di data analysis di Shopify, secondo cui “la cosa più importante in questo processo è il domandarsi costantemente ‘perché?’”. Jeff Jonas, responsabile analytics di IBM per descrivere quel che fa , in un recente keynote ha utilizzato la metafora del puzzle.

Paideia

Dalla descrizione delle caratteristiche distintive di un data scientist si capisce che non esistono curricula studiorum consolidati, nonostante le Università – chi con più solerzia, chi con meno – stiano cercando di attrezzarsi. Uno scienziato dei dati deve quindi farsi il proprio corso di formazione mescolando un po’ le carte dell’offerta esistente. Quello che gli verrà chiesto a un colloquio di lavoro può variare tra una gamma disparata di competenze. Un’importante azienda di sviluppo software ad esempio tra i formulari per selezionare i nuovi scienziati dei dati ne utilizza uno per valutare le capacità di comunicazione del candidato. Mike Gualtieri, analista di Forrester specializzato nel mercato della data science, inoltre traccia anche una distinzione curricolare tra vecchi (?) e nuovi scienziati dei dati.

Tradizionalmente avevano una formazione spiccatamente matematico-statistica per sviluppare algoritmi di machine-leaning […]. In futuro il progresso degli strumenti utilizzati li libererà da questa incombenza e gli verrà chiesto di essere più creativi riguardo i modelli di analisi – Mike Gualtieri 

Scuola pubblica

Tra i tanti e più o meno ignoti data scientist in circolazione, quello che può essere considerato uno dei più affermati è sicuramente DJ Patil, dallo scorso febbraio chief data scientist dell’amministrazione Obama – da sempre molto attenta alle possibilità offerte da tecnologia e big data.

È stato chiamato a presiedere alle attività sui big data del gabinetto high-tech governativo dopo essersi fatto una carriera nella aziende più rilevanti della internet economy: Salesforce, LinkedIn, Skype, PayPal ed eBay e adesso sta cercando di migliorare la vita dei cittadini americani trovando il difficile equilibrio tra quello che dai dati si può imparare e l’esigenza di difenderne la riservatezza. Sarà lui, o qualcuno dei suo team, a trovare le soluzioni che permetteranno alla sanità di fare notevoli passi in avanti senza mettere a repentaglio la privacy dei pazienti. In un post pubblicato sul blog ufficiale della Casa Bianca racconta le tappe salienti della propria formazione. Abbastanza sorprendentemente Patil non attribuisce la chiave del suo successo al dottorato in matematica applicata o all’esperienza maturata nelle aziende in cui ha lavorato ma al community college, la scuola pubblica dove – insieme a altri studenti non abbastanza facoltosi da potersi permettere scuole private – si è preparato prima di entrare alla University of California, San Diego e prendere il Ph.D in quella del Maryland:

Il community college mi ha insegnato tre capacità di cui sarà eternamente grato: l’amore per la matematica […]; saper scrivere, e leggere narrativa e poesia; e infine la confidenza necessaria per relazionarsi con altri e migliorarsi – DJ Patil

Vuoi approfondire il tema dei Big Data per decisioni migliori? Consulta le nostre proposte formative su statistica, dati e analisi nella sezione corsi di Better Decisions o contatta l’indirizzo info@betterdecisions.it per ulteriori informazioni.