The European Parliament Interpreting Corpus (EPIC) is one of the first machine-readable corpora to be openly accessible in the field of Interpreting Studies. The present paper describes the steps undertaken to create and develo the corpus, including data collection, transcription part-of-speech (POS) tagging and lemmatisation are described; then, the web-interface developed to carry out simple and advanced queries on-line is illustrated. Special emphasis is placed on the potential of EPIC as a pedagogical and research tool. Finally, ongoing developments are discussed: text-to-sound and source text-to-target text alignment procedures are currently being tested, so as to make EPIC a more powerful resource for interpreting research.

Il corpus EPIC è uno dei primi disponibili su supporto elettronico ad essere liberamente accessibili nell'ambito degli studi sull'interpretazione. Il contributo descrive le fasi di creazione e sviluppo del corpus, tra cui la raccolta dei dati, la trascrizione, il tagging per parte del discorso, la lemmatizzazione; è illustrata l'interfaccia web creata per poter effettuare ricerche semplici e complesse online e particolare enfasi è posta sulle potenzialità di EPIC come strumento pedagogico e di ricerca. Infine, sono discussi gli sviluppi attuali, come l'allineamento testo-suono e testo di partenza-testo di arrivo, che hanno l'obiettivo di rendere EPIC una risorsa più potente per la ricerca sull'interpretazione.

The European Parliament Interpreting Corpus (EPIC): implementation and developments

SANDRELLI A;
2012-01-01

Abstract

The European Parliament Interpreting Corpus (EPIC) is one of the first machine-readable corpora to be openly accessible in the field of Interpreting Studies. The present paper describes the steps undertaken to create and develo the corpus, including data collection, transcription part-of-speech (POS) tagging and lemmatisation are described; then, the web-interface developed to carry out simple and advanced queries on-line is illustrated. Special emphasis is placed on the potential of EPIC as a pedagogical and research tool. Finally, ongoing developments are discussed: text-to-sound and source text-to-target text alignment procedures are currently being tested, so as to make EPIC a more powerful resource for interpreting research.
2012
978-3-0343-1071-0
Il corpus EPIC è uno dei primi disponibili su supporto elettronico ad essere liberamente accessibili nell'ambito degli studi sull'interpretazione. Il contributo descrive le fasi di creazione e sviluppo del corpus, tra cui la raccolta dei dati, la trascrizione, il tagging per parte del discorso, la lemmatizzazione; è illustrata l'interfaccia web creata per poter effettuare ricerche semplici e complesse online e particolare enfasi è posta sulle potenzialità di EPIC come strumento pedagogico e di ricerca. Infine, sono discussi gli sviluppi attuali, come l'allineamento testo-suono e testo di partenza-testo di arrivo, che hanno l'obiettivo di rendere EPIC una risorsa più potente per la ricerca sull'interpretazione.
corpus orale
interpretazione simultanea
direzionalità
spoken corpus
simultaneous interpreting
directionality
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14090/1932
 Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo

Citazioni
  • ???jsp.display-item.citation.pmc??? ND
social impact