INFORMATICA E DATI LINGUISTICI | Università degli studi di Bergamo

INFORMATICA E DATI LINGUISTICI

Attività formativa monodisciplinare
Sede: 
BERGAMO
Codice dell'attività formativa: 
28057

Scheda dell'insegnamento

Per studenti immatricolati al 1° anno a.a.: 
2020/2021
Insegnamento (nome in italiano): 
INFORMATICA E DATI LINGUISTICI
Tipo di attività formativa: 
Altra attività formativa
Tipo di insegnamento: 
Obbligatoria
Settore disciplinare: 
INFORMATICA (INF/01)
Anno di corso: 
1
Anno accademico di offerta: 
2020/2021
Crediti: 
5
Responsabile della didattica: 

Altre informazioni sull'insegnamento

Modalità di erogazione: 
Didattica Convenzionale
Lingua: 
Italiano
Ciclo: 
Primo Semestre
Obbligo di frequenza: 
No
Ore di attività frontale: 
30
Ore di studio individuale: 
95
Ambito: 
Abilità informatiche e telematiche
Prerequisiti

Nessuno

Obiettivi formativi

Al termine del corso lo studente è in grado di utilizzare i principali strumenti informatici di trascrizione, organizzazione, rappresentazione grafica e analisi statistica di dati linguistici. In particolare, lo studente avrà familiarità con le principali operazioni necessarie per la stesura di una tesi di laurea basata su dati empirici (es. interviste, test linguistici, dati estratti da corpora online).
Partendo da un campione di dati linguistici orali (es. la registrazione di un’intervista in una lingua straniera), lo studente sarà in grado di svolgere le seguenti operazioni:
- Trascrizione dei dati;
- Manipolazione automatica dei dati trascritti (es. trascrizione fonetica);
- Organizzazione dei dati nel foglio di calcolo (es. conteggio e classificazione degli errori);
- Elaborazione di statistiche descrittive (es. media, deviazione standard, dati mancanti etc.)
- Elaborazione di grafici (istogrammi, scatole e baffi);
- Programmazione di semplici codici nel linguaggio R per la personalizzazione e l’automatizzazione delle operazioni precedenti.

Contenuti dell'insegnamento

1. Trascrizione di dati audio e video: interazioni dialogiche, acquisizione di lingue straniere.
2. Elaborazione di stringhe di testo: caratteri non stampabili, espressioni regolari.
3. Organizzazione di dati linguistici e statistica descrittiva nel foglio di calcolo (es. Excel): tabelle pivot, creazione di grafici.
4. Elementi di programmazione nel linguaggio R: personalizzazione e automatizzazione di operazioni.

Metodi didattici

Lezioni e esercitazioni online, realizzazione di elaborati individuali.

Modalità verifica profitto e valutazione

Soluzione di alcuni esercizi proposti dal docente

Altre informazioni

Non frequentanti
Alla luce della natura pratica dell’insegnamento e della disponibilità online delle lezioni registrate, il programma è unico per frequentanti e non frequentanti. Eventuali domande e richieste di chiarimenti (specie da parte di chi non ha potuto prendere parte alle lezioni) potranno essere affrontate durante gli orari di ricevimento.

Letture consigliate e materiali di consultazione
- Goyvaerts, Jan. 2007. Regular Expressions: the complete tutorial. http://www.regular-expressions.info/print.html (pagg. 3-86).
- Gries, Stefan. 2013. Statistics for Linguistics with R: A Practical Introduction. Berlin, De Gruyter (capitoli 2 e 3).
- MacWhinney, Brian. 2000. The CHILDES Project: Tools for analyzing talk. III. Mahwah, NJ: Lawrence Erlbaum (capitolo 3).
- Rühlemann, Christoph. 2020. Visual Linguistics with R: A Practical Introduction to Quantitative Interactional Linguistics. Amsterdam: John Benjamins (capitoli 1,2,3).
- Saturno, Jacopo. 2020. Utterance structure in the initial stages of Polish L2 acquisition: from semantics to case morphology. Berlin: Language Science press (capitolo 5). https://langsci-press.org/catalog/book/265