METODI DI ANALISI DI DATA-SET | Università degli studi di Bergamo

METODI DI ANALISI DI DATA-SET

Modulo Generico
Codice dell'attività formativa: 
156005-M2

Scheda dell'insegnamento

Per studenti immatricolati al 1° anno a.a.: 
2020/2021
Insegnamento (nome in italiano): 
METODI DI ANALISI DI DATA-SET
Tipo di attività formativa: 
Attività formativa Affine/Integrativa
Tipo di attività formativa dell'interclasse: 
Attività formativa Affine/Integrativa
Tipo di insegnamento: 
Obbligatoria
Settore disciplinare: 
STATISTICA (SECS-S/01)
Anno di corso: 
1
Anno accademico di offerta: 
2020/2021
Crediti: 
6
Responsabile della didattica: 

Altre informazioni sull'insegnamento

Ciclo: 
Secondo Semestre
Obbligo di frequenza: 
No
Ore di attività frontale: 
30
Ore di studio individuale: 
95
Ambito: 
Attività formative affini o integrative
Prerequisiti

Non è previsto nessun prerequisito tuttavia, per garantire che gli studenti possano raggiungere gli obiettivi formativi del corso, si consiglia di partecipare ai “percorsi di allineamento” in particolare a quello che riguarda l’analisi e la rappresentazione territoriale.

Obiettivi formativi

L’insegnamento offre le basi metodologiche per comprendere come rappresentare e analizzare i diversi tipi di dati che vengono utilizzati da un geografo e da un urbanista. I metodi statistici trattati nel corso permetteranno di affrontare un'analisi di dati reali geostatistici. Questo tipo di dati sono caratterizzati da una grande complesità dovuta sia alle dimensioni sia alla forma dei dati. Per rendere fruibili i contenuti di questi grandi data set, gli studenti e le studentesse saranno in grado di fornire rappresentazioni grafiche con i software più attuali per gestire i dati geografici. Saranno in grado di calcolare e rappresentare i principali indici geostatistici come il variogramme e il coorelogramma. Infine saranno in grado di applicare alcune tecniche di geostatistica ai data set disponibili.

Contenuti dell'insegnamento

Dati geometrici e dati spaziali. Definizione di data set e data frame. Matrici di dati. Dati geografici vettoriali e dati geografici raster. La distribuzione normale e uso delle tavole. Rappresentazione grafica partendo dai dati vettoriali. Analisi dei dati esploratoria (Exploratory data Analysis): box plot istogramma q-q plot density plot.
Distribuzione spaziale dei dati. Analisi di vicinanza. Misure di similarità e di dissimilarità. Covarianza, semivarianza e correlazione. Covariogramma, correlogramma e semivariogramma. Analisi di regressione interpolazione e kriging. Tutti gli argomenti saranno presentati utilizzando il software R fruttando le sue funzionalità per le analisi dei dati spaziali e le funzioni di geostatistica.

Metodi didattici

La didattica si svolgerà, per una parte pari a n. 20 ore, mediante lezioni frontali. Una particolare attenzione sarà data all'attività di analisi di dati geografici con un software adatto, dove ci sarà ampio spazio per discutere e approfondire i temi trattati a lezione. Le restanti 10 ore dell’insegnamento sono svolte all’interno del project work, ossia l’attività interdisciplinare costruita attorno a progetti applicativi territoriali che prevedono la co-docenza e la partecipazione attiva degli studenti.

Modalità verifica profitto e valutazione

La prova d’esame del corso si svolge in forma orale, mediante un colloquio relativo ai due moduli che compongono l’area didattica. Essa accerta l’acquisizione da parte dello studente delle nozioni impartite all’interno dei moduli. Nello specifico, l’esame verifica:
- la conoscenza teorica dei concetti di analisi dei dati presentati nel corso;
- la capacità critica dello studente di applicarli a casi specifici.
Inoltre, valuta il portfolio realizzato all’interno del project work, costituito dall’insieme di elaborati realizzati in modalità individuale e collettiva (mapping, infografiche, dossier, piani progettuali e video-clip) per misurare la progressiva maturazione dello studente nonché la capacità applicativa acquisita nel processo formativo.
Il voto relativo all’area didattica viene calcolato con la media aritmetica delle votazioni riportate nei due moduli, a cui si aggiunge la valutazione del portfolio che deve corrispondere a un terzo della valutazione complessiva. Tale voto, espresso in trentesimi, è comunicato allo studente e registrato mediante il libretto elettronico.

Altre informazioni

Qualora l'insegnamento venisse impartito in modalità mista o a distanza potranno essere introdotte modifiche rispetto a quanto dichiarato nel syllabus per rendere il corso e gli esami fruibili anche secondo queste modalità. Il programma del modulo di metodi di analisi di data set è lo stesso per studenti frequentanti e studenti non frequentanti.

Prerequisites

There is no prerequisite, however, to ensure that students can achieve the educational objectives of the course, it is advisable to participate to the "alignment paths" in particular to the one concerning the territorial analysis and representation.

Educational goals

The course provides the methodological basis for understanding how to represent and analyze the different types of data that are used by a geographer and an urban planner. The statistical methods covered in the course will allow to face an analysis of real geostatistical data. This type of data are characterized by a great complexity due both to the size and to the form of the data. To make the contents of these large data sets available, students will be able to provide graphical representations with the most up-to-date software to manage geographical data. They will be able to calculate and represent the main geostatistical indices such as the variogramme and the coorelogram. Finally they will be able to apply some geostatistical techniques to the available data sets.

Course content

Geometric data and spatial data. Definition of data set and data frame. Data matrices. Geographical vector data and geographic raster data. The normal distribution and use of the tables. Graphic representation starting from vectorial data. Exploratory data analysis: box plot, histogram, q-q plot, density plot. Spatial point patterns, nearest-neighbor analysis. Measure of similarity and dissimilarity, .Covariance, semivariance and correlation. Covariograms, correlograms, and semivariograms. Regression analysis, interpolation and kriging. All the topics will be presented using the R software and its functionalities for spatial data analysis and geostatistical functions.

Teaching methods

20 hours of the course are classical frontal lectures. In this part of the course, particular attention will be given to the analysis of geographical data set with a suitable software, where there will be ample space to discuss and deepen the topics covered in class. The remaining 10 hours of teaching are carried out within the project work, ie the interdisciplinary activity built around territorial application projects that involve co-teaching and the active participation of students.

Assessment and Evaluation

The exam is in oral form, through an interview relating to the two modules that composes the teaching area. It verifies the acquisition by the student of the concepts taught within the modules. Specifically, the exam verifies:
- the theoretical knowledge of the data analysis concepts presented in the course;
- the critical ability of the student to apply them to specific cases.
In addition, it evaluates the portfolio created within the project work, consisting of the set of documents produced in individual and collective mode (mapping, infographics, dossiers, project plans and video clips) to measure the gradual maturation of the student as well as the application capacity acquired in the training process.
The grade relative to the didactic area is calculated with the arithmetic average of the grades reported in the two modules, to which is added the evaluation of the portfolio which must correspond to one third of the overall evaluation. This vote, expressed in thirtieths, is communicated to the student and recorded using the electronic booklet.

Further information

If the course will be done remotely or blended, changes will be possibly made compared to what is stated in the syllabus to make the course and exams accessible also in these forms. The program of the Methods of data set's analysis module is the same for attending students and non-attending students.