The European Parliament Interpreting Corpus (EPIC) is one of the first machine-readable corpora to be openly accessible in the field of Interpreting Studies. The present paper describes the steps undertaken to create and develo the corpus, including data collection, transcription part-of-speech (POS) tagging and lemmatisation are described; then, the web-interface developed to carry out simple and advanced queries on-line is illustrated. Special emphasis is placed on the potential of EPIC as a pedagogical and research tool. Finally, ongoing developments are discussed: text-to-sound and source text-to-target text alignment procedures are currently being tested, so as to make EPIC a more powerful resource for interpreting research.

Il corpus EPIC è uno dei primi disponibili su supporto elettronico ad essere liberamente accessibili nell'ambito degli studi sull'interpretazione. Il contributo descrive le fasi di creazione e sviluppo del corpus, tra cui la raccolta dei dati, la trascrizione, il tagging per parte del discorso, la lemmatizzazione; è illustrata l'interfaccia web creata per poter effettuare ricerche semplici e complesse online e particolare enfasi è posta sulle potenzialità di EPIC come strumento pedagogico e di ricerca. Infine, sono discussi gli sviluppi attuali, come l'allineamento testo-suono e testo di partenza-testo di arrivo, che hanno l'obiettivo di rendere EPIC una risorsa più potente per la ricerca sull'interpretazione.

The European Parliament Interpreting Corpus (EPIC): implementation and developments

SANDRELLI A;
2012-01-01

Abstract

Il corpus EPIC è uno dei primi disponibili su supporto elettronico ad essere liberamente accessibili nell'ambito degli studi sull'interpretazione. Il contributo descrive le fasi di creazione e sviluppo del corpus, tra cui la raccolta dei dati, la trascrizione, il tagging per parte del discorso, la lemmatizzazione; è illustrata l'interfaccia web creata per poter effettuare ricerche semplici e complesse online e particolare enfasi è posta sulle potenzialità di EPIC come strumento pedagogico e di ricerca. Infine, sono discussi gli sviluppi attuali, come l'allineamento testo-suono e testo di partenza-testo di arrivo, che hanno l'obiettivo di rendere EPIC una risorsa più potente per la ricerca sull'interpretazione.
2012
978-3-0343-1071-0
The European Parliament Interpreting Corpus (EPIC) is one of the first machine-readable corpora to be openly accessible in the field of Interpreting Studies. The present paper describes the steps undertaken to create and develo the corpus, including data collection, transcription part-of-speech (POS) tagging and lemmatisation are described; then, the web-interface developed to carry out simple and advanced queries on-line is illustrated. Special emphasis is placed on the potential of EPIC as a pedagogical and research tool. Finally, ongoing developments are discussed: text-to-sound and source text-to-target text alignment procedures are currently being tested, so as to make EPIC a more powerful resource for interpreting research.
corpus orale
interpretazione simultanea
direzionalità
spoken corpus
simultaneous interpreting
directionality
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14090/1932
 Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo

Citazioni
  • ???jsp.display-item.citation.pmc??? ND
social impact