The European Parliament Interpreting Corpus (EPIC): implementation and developments

IRIS

The European Parliament Interpreting Corpus (EPIC) is one of the first machine-readable corpora to be openly accessible in the field of Interpreting Studies. The present paper describes the steps undertaken to create and develo the corpus, including data collection, transcription part-of-speech (POS) tagging and lemmatisation are described; then, the web-interface developed to carry out simple and advanced queries on-line is illustrated. Special emphasis is placed on the potential of EPIC as a pedagogical and research tool. Finally, ongoing developments are discussed: text-to-sound and source text-to-target text alignment procedures are currently being tested, so as to make EPIC a more powerful resource for interpreting research.

Il corpus EPIC è uno dei primi disponibili su supporto elettronico ad essere liberamente accessibili nell'ambito degli studi sull'interpretazione. Il contributo descrive le fasi di creazione e sviluppo del corpus, tra cui la raccolta dei dati, la trascrizione, il tagging per parte del discorso, la lemmatizzazione; è illustrata l'interfaccia web creata per poter effettuare ricerche semplici e complesse online e particolare enfasi è posta sulle potenzialità di EPIC come strumento pedagogico e di ricerca. Infine, sono discussi gli sviluppi attuali, come l'allineamento testo-suono e testo di partenza-testo di arrivo, che hanno l'obiettivo di rendere EPIC una risorsa più potente per la ricerca sull'interpretazione.

The European Parliament Interpreting Corpus (EPIC): implementation and developments

RUSSO M;BENDAZZOLI C;SANDRELLI A;SPINOLO N

2012-01-01

Abstract

The European Parliament Interpreting Corpus (EPIC) is one of the first machine-readable corpora to be openly accessible in the field of Interpreting Studies. The present paper describes the steps undertaken to create and develo the corpus, including data collection, transcription part-of-speech (POS) tagging and lemmatisation are described; then, the web-interface developed to carry out simple and advanced queries on-line is illustrated. Special emphasis is placed on the potential of EPIC as a pedagogical and research tool. Finally, ongoing developments are discussed: text-to-sound and source text-to-target text alignment procedures are currently being tested, so as to make EPIC a more powerful resource for interpreting research.

Scheda breve

Scheda completa

Scheda completa (DC)

	Anno
	
				2012
			
	Codice ISBN
	
				978-3-0343-1071-0
			
	Breve descrizione dei contenuti (Abstract)
	
				Il corpus EPIC è uno dei primi disponibili su supporto elettronico ad essere liberamente accessibili nell'ambito degli studi sull'interpretazione. Il contributo descrive le fasi di creazione e sviluppo del corpus, tra cui la raccolta dei dati, la trascrizione, il tagging per parte del discorso, la lemmatizzazione; è illustrata l'interfaccia web creata per poter effettuare ricerche semplici e complesse online e particolare enfasi è posta sulle potenzialità di EPIC come strumento pedagogico e di ricerca. Infine, sono discussi gli sviluppi attuali, come l'allineamento testo-suono e testo di partenza-testo di arrivo, che hanno l'obiettivo di rendere EPIC una risorsa più potente per la ricerca sull'interpretazione.
			
	Parole chiave
	
				corpus orale
interpretazione simultanea
direzionalità
spoken corpus
simultaneous interpreting
directionality
			
	Appare nelle tipologie:
	
				2.1 Contributo in volume (Capitolo o Saggio)

File in questo prodotto:

Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14090/1932

Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo

Citazioni

ND

social impact