
DATA SCIENCE
V Edizione




Durata
60 CFU
12 MESI
INIZIO
AUTUNNO 2022
TIPOLOGIA
EXECUTIVE
Formula WEEKEND
presenza e online
STAGE IN AZIENDA
300 ore

MASTER II LIVELLO DATA SCIENCE - V EDIZIONE
Il Master è attivato congiuntamente dal Dipartimento di Informatica dell'Università degli Studi di Bari Aldo Moro e dal Dipartimento di Ingegneria Elettrica e dell'Informazione del Politecnico di Bari al fine di mettere a disposizione il massimo dell’eccellenza formativa dei due Atenei. È proposto un percorso formativo finalizzato alla formazione del Data Scientist. Tale figura professionale costituisce il trait d'union tra l’analista e l’esperto di statistica; è fornita una preparazione trasversale ed integrata di natura economica, giuridica e organizzazione aziendale oltre che di natura informatica. Al termine dei corsi, a fronte del superamento di un esame finale, è rilasciato il titolo di Master Universitario di II livello.
Periodo di svolgimento: OTTOBRE 2022 – OTTOBRE 2023
OBIETTIVI DEL MASTER
VALORIZZAZIONE DEL DATO GREZZO
Studio di tecniche, strumenti e soluzioni innovative per la gestione e la valorizzazione di dati di nuova generazione. Utilizzo di tecniche di machine learning per predire e classificare nuovi dati osservati
APPRENDIMENTO DI NUOVI PARADIGMI PER L'ANALISI DEI BIG DATA
Studio di tecniche e strumenti per l’elaborazione di grandi quantità di dati, sia di tipo strutturato che di tipo non strutturato
ADEGUATA COMUNICAZIONE DELL'INFORMAZIONE
Studio di tecniche di data extraction e visualization per la interpretazione e valorizzazione del dato, in accordo a politiche etiche e legali opportune
REALIZZAZIONE DI SERVIZI DI SOCIAL DATA SCIENCE
Studio di tecniche innovative per la realizzazione di servizi avanzati di analisi dei social media, opinion mining e sentiment analysis e natural language processing
PRESENTAZIONE
La figura del Data Scientist si rivela sempre più decisiva per lo sviluppo di azioni competitive da parte delle imprese nei mercati globali. Costituisce una delle figure più ricercate nel mercato del lavoro, essendo trasversale a manager, analisti, informatici, e, più in generale, a quelle figure che possiedono un importante know how aziendale. La professionalità del Data Scientist coniuga competenze multidisciplinari in grado di gestire grandi quantità di dati, estrarre conoscenza e presentarla in forma organizzata, leggibile ed efficace, applicando policy etiche e legali a stato dell’arte, garantendo un efficace sistema di supporto alle decisioni. La sfida nella formazione del Data Scientist consiste nel fornire una conoscenza integrata di discipline e competenze diversificate: statistica, data mining, machine learning, analisi dei dati e loro visualizzazione, gestione di dati non strutturati, compresi gli effetti di natura legale che il loro utilizzo comporta. Al termine della formazione, il Data Scientist, essendo il raccordo tra diverse funzioni aziendali, rappresenterà quindi una figura manageriale che avrà conoscenza delle dinamiche dell’impresa e ne potrà quindi indicare e favorire la crescita.

LE OPINIONI DEI NOSTRI STUDENTI
DIDATTICA E CORSI
Il master prevede 1500 ore complessive di apprendimento in 12 mesi di studio
Non sono richieste specifiche o approfondite competenze di settore
È prevista l’erogazione di un corso preliminare di allineamento
Ha la funzione di omogeneizzare il background di base dei partecipanti, necessario alla fruizione dei moduli del corso.
Le tematiche saranno affrontate teoricamente, in Java ed in Python:
- Le basi della programmazione
- Concetto di linguaggio di programmazione
- Approcci Object Oriented ed Imperativi
- Approcci al problem solving
- Definizione di Flowcharts
- Variabili, cicli e condizioni
- Algoritmi
- Operazioni logiche e aritmetiche
- Array e Dizionari
- Funzioni
- Files e librerie
- Chiamate ad API
- Java, Python IDE
"Big data" e "data science" possono essere alcune delle parole d'ordine più importanti di questo decennio, ma non sono necessariamente concetti nuovi. L'idea di data science abbraccia molti campi diversi, e si è lentamente fatta strada nel mainstream per oltre cinquant'anni. In questo modulo si svolgerà una overview sulla figura del data scientist con maggiore attenzione a:
- Definizione Di Dato
- Ciclo di vita del dato
- Big Data
- Open Data
- Dati Geografici
- Sistemi GIS
La Business Intelligence è l’insieme dei processi, delle tecniche e degli strumenti basati sulla tecnologia dell’informazione e che supportano i processi decisionali di carattere economico. Ha l'obiettivo di avere sufficienti informazioni e conoscenze in modo tempestivo e fruibile cosicché da poter avere un impatto positivo sulle strategie, le tattiche e le operazioni aziendali.
- DBMS e modello relazionale
- SQL – ETL
- Data Warehouse e Business Intelligence
- Architetture distribuite
- Analisi OLAP
- Paradigma MapReduce
- Database NoSQL
- Esercitazioni su database NoSQL
A partire dal XXI secolo, si assiste ad un evidente cambio di paradigma: la nascita delle tecniche di Data Science (e più in generale tutto il corpus teorico della disciplina nota come Machine Learning) si interseca in modo indivisibile con lo sviluppo teorico della Statistica. il programma coprirà i concetti di:
- Variabili e correlazioni
- Campioni e popolazioni
- Intervalli di confidenza e test delle ipotesi
- Test statistici parametrici e non parametrici
- Regressione
- Uso di tool e linguaggi per l'analisi statistica (R)
- Nel contesto della Business Intelligence (BI), la visualizzazione dei dati viene applicata in due modi. In primo luogo, la visualizzazione dei dati è una disciplina che copre una teoria completa di come rappresentare visivamente i dati. I concetti e i sistemi possono essere applicati nella progettazione di interfacce visive per la comunicazione delle informazioni. In secondo luogo, i concetti e le linee guida per la visualizzazione dei dati sono realizzati attraverso le funzionalità del software di BI, il che rende facile l'applicazione dei concetti.
- Rappresentazioni Grafiche
- Analisi Grafica Univariata, Bivariata e Multivaria
- Strumenti per la Rappresentazione Grafica dei Dati
- Uso di Strumenti di Visual Analytics (Tableau/R/Qlik Sense)
L'apprendimento automatico è un'applicazione di intelligenza artificiale (AI) che fornisce ai sistemi la capacità di apprendere e migliorare automaticamente dall'esperienza senza essere esplicitamente programmato. L'apprendimento automatico si concentra sullo sviluppo di programmi per computer che possono accedere ai dati e utilizzarlo per se stessi. Il processo di apprendimento inizia con osservazioni o dati, come esempi, esperienze dirette o istruzioni, per cercare modelli nei dati e prendere decisioni migliori in futuro sulla base degli esempi che forniamo. L'obiettivo principale è quello di permettere ai computer di apprendere automaticamente senza l'intervento umano o l'assistenza e di adattare le azioni di conseguenza.
- Approcci Supervisionati e Non Supervisionati
- Classificazione
- Regressione
- Clustering
- Analisi Serie Temporali
- Valutazione delle Performance
- Esercitazioni (Weka, Scikit-Learn, Liblinear)
- Deep Learning
- CNN, RNN, Autoencoder, Reinforcement Learning
- Keras, Tensorflow
La Text Analytics, nota anche come text mining, consiste nell’esaminare ampie raccolte di risorse testuali per generare nuove informazioni e trasformare il testo non strutturato in dati strutturati da utilizzare per ulteriori analisi. Il Text mining identifica fatti, relazioni e affermazioni che altrimenti rimarrebbero sepolti nella massa di grandi dati testuali. Questi fatti vengono estratti e trasformati in dati strutturati, per l'analisi, la visualizzazione (ad es. tramite tabelle html, mappe mentali, grafici), l'integrazione con dati strutturati in database o magazzini, e un ulteriore affinamento tramite sistemi di machine learning (ML).
- Natural Language Processing
- Elementi di Linguistica Computazionale
- Modelli di Ritrovamento delle Informazioni
- Question Answering
- Information Filtering e Recommender Systems
- Esercitazioni con Lucene/Elastic search
- Esercitazioni con tool per la Definizione di Recommender Systems
- Semantica distribuzionale
- Chatbots
Il regolamento generale dell'UE sulla protezione dei dati (GDPR) sostituisce la direttiva 95/46/CE sulla protezione dei dati ed è stato concepito per: Armonizzare le leggi sulla privacy in tutta Europa, Proteggere e responsabilizzare tutti i cittadini dell'UE in materia di riservatezza dei dati, Ridisegnare il modo in cui le organizzazioni di tutta la regione si avvicinano alla riservatezza dei dati. GDPR rimodella il modo in cui i settori gestiscono i dati e ridefinisce i ruoli dei leader chiave nelle aziende, dai CIO ai CMO. I CIO devono assicurarsi di avere processi di gestione del consenso a tenuta stagna, mentre i CMO richiedono sistemi di gestione dei diritti di dati efficaci per garantire che non perdano il loro bene più prezioso: i dati.
- Diritto d’autore
- Licensing e Tutela Giuridica
- Marchi e Brevetti
- General Data Protection Regulation (GDPR)
I dati sociali generati digitalmente (ad esempio, dai social media, dalle piattaforme di comunicazione, dai dispositivi dell'Internet degli oggetti, dai sensori/indumenti e dai telefoni cellulari) offrono la possibilità di accumulare nuovi dati su larga scala, oltre ai dati esistenti che sono stati convertiti in formati digitali. Questi dati possono essere utilizzati per aiutarci a comprendere i grandi temi di interesse cruciale per le scienze sociali, l'industria e i responsabili politici, tra cui il comportamento sociale, economico e politico, le relazioni interpersonali, la progettazione del mercato, la formazione di gruppi, l'identità, il movimento internazionale, l'etica e i modi responsabili per accrescere il valore sociale dei dati e molti altri argomenti.
- Opinion Mining
- Sentiment Analysis
- Social Network Analysis
- Twitter as a data provider
- Aspect-based social contents analysis
- Topic Monitoring
- Architetture distribuite per Data Science
- Deep Learning per la Social Data Science
- Applicazioni per la Bioinformatica
- Natural Language Processing
- Question Answering
- Semantic Web e Knowledge Graphs
I dati non sono mai stati così importanti come oggi. Si parla sempre di come sia al centro di ciò che rende preziosa un'azienda. Un'organizzazione tipica pone costantemente domande. "Come si fa a crescere? La risposta a tutte queste domande è sempre nei dati, più si può correlare, più si può analizzare e più si sfruttano questi numeri, più successo si avrà nel proprio business, soprattutto se si è un'azienda online (ad esempio, la vendita al dettaglio online).
- Il Valore dei Dati
- I Dati nella Visione di Impresa
- Costruire un progetto d'impresa
- Stage di 300 ore in una delle nostre aziende partner
- Seminari integrativi riguardanti le ultime novità sulla gestione dei dati direttamente dal mondo della ricerca
- Prova finale con presentazione dell'elaborato finale e titolo accademico
REQUISITI
Possesso di una LAUREA di II livello (magistrale) o vecchio ordinamento conseguita entro la data di scadenza delle immatricolazioni. L’ammissione al master è subordinata all’esito positivo di una <br />
FASE DI SELEZIONE
FORMAT
Formula weekend
VENERDI’ POMERIGGIO
SABATO INTERA GIORNATA
Inizio Corsi Autunno 2022
Lingua ITALIANO
Durata 60 CFU – 12 mesi
Percentuale minima di frequenza obbligatoria
75%
Modalità ibrida: presenza e online
COSTO E AGEVOLAZIONI
Possibilità di iscrizione alla frequenza di singoli moduli
ISCRIZIONE ALLA SELEZIONE
COORDINATORI
COMITATO TECNICO SCIENTIFICO
DOCENTI
WALTER
ANELLI
RICERCATORE
POLITECNICO DI BARI
ANNALISA APPICE
PROFESSORE ASSOCIATO
UNIVERSITÀ DI BARI
PIERPAOLO BASILE
PROFESSORE ASSOCIATO
UNIVERSITÀ DI BARI
GIOVANNI M. BIANCOFIORE
RESEARCH ASSISTANT
POLITECNICO DI BARI
MASSIMO BILANCIA
PROFESSORE ASSOCIATO
UNIVERSITÀ DI BARI
MICHELANGELO CECI
PROFESSORE ORDINARIO
UNIVERSITÀ DI BARI
MARCO
DE GEMMIS
PROFESSORE ASSOCIATO
UNIVERSITÀ DI BARI
TOMMASO
DI NOIA
PROFESSORE ORDINARIO
POLITECNICO DI BARI
ANTONIO FERRARA
POST-DOC RESEARCHER
POLITECNICO DI BARI
PASQUALE
LOPS
PROFESSORE ASSOCIATO
UNIVERSITÀ DI BARI
CATALDO
MUSTO
RICERCATORE
UNIVERSITÀ DI BARI
FEDELUCIO NARDUCCI
RICERCATORE
POLITECNICO DI BARI
VINCENZO PATRUNO
PROJECT AND DATA MANAGER AT ISTAT
MORENA RAGONE
ESPERTO GIURIDICO
REGIONE PUGLIA
ANTONIO RIZZELLI
CO-FOUNDER AND R&D
AT ETHICA SYSTEM SRL
CLAUDIO
POMO
RESEARCH ASSISTANT
POLITECNICO DI BARI
GIOVANNI SEMERARO
PROFESSORE ORDINARIO
UNIVERSITÀ DI BARI
PROGRAMMI DI FORMAZIONE AZIENDALI
Qlik Academic Program
- Software Qlik
- Piattaforma di apprendimento Qlik Continuous Classroom
- Qualifications for Qlik Sense
- Data Literacy Certification
- Data Analytics Certification
- Curriculum di analisi dei dati con appunti didattici, video on-demand, dispense, attività e casi di utilizzo aziendali interattivi del mondo reale
- Qlik Community Academic Program Space, un forum per docenti e studenti per accedere alle risorse, collaborare con gli altri e condividere esperienze
Qlik Academic Program
- Software Tableau
- Tableau Prep Builder
- Tableau Certification (Discounted)
- Students dedicate resources
- Free learning resources
- The community forums are a wonderful source of information to answer Tableau related questions.
PARTNERS EDIZIONE 2022/2023
Consulta il bando per tutte le informazioni https://www.poliba.it/it/didattica/master
No, non è consentita l’iscrizione contemporanea a più corsi di studio universitari
No. Superata la fase di selezione, deciderai se formalizzare o meno l’iscrizione con l’immatricolazione
Per iscriverti al master, devi aver conseguito una laurea di II livello entro la data di scadenza delle immatricolazioni
Sì, al termine di ogni corso è previsto un esame di profitto a cui corrispondono CFU. Al termine di tutti i corsi è previsto un esame finale
Sì, come tassa universitaria
Il master si svolgerà in modalità ibrida. Pertanto le lezioni saranno tenute sia in presenza che online.