The European Parliament Interpreting Corpus (EPIC) is one of the first machine-readable corpora to be openly accessible in the field of Interpreting Studies. The present paper describes the steps undertaken to create and develo the corpus, including data collection, transcription part-of-speech (POS) tagging and lemmatisation are described; then, the web-interface developed to carry out simple and advanced queries on-line is illustrated. Special emphasis is placed on the potential of EPIC as a pedagogical and research tool. Finally, ongoing developments are discussed: text-to-sound and source text-to-target text alignment procedures are currently being tested, so as to make EPIC a more powerful resource for interpreting research.
Il corpus EPIC è uno dei primi disponibili su supporto elettronico ad essere liberamente accessibili nell'ambito degli studi sull'interpretazione. Il contributo descrive le fasi di creazione e sviluppo del corpus, tra cui la raccolta dei dati, la trascrizione, il tagging per parte del discorso, la lemmatizzazione; è illustrata l'interfaccia web creata per poter effettuare ricerche semplici e complesse online e particolare enfasi è posta sulle potenzialità di EPIC come strumento pedagogico e di ricerca. Infine, sono discussi gli sviluppi attuali, come l'allineamento testo-suono e testo di partenza-testo di arrivo, che hanno l'obiettivo di rendere EPIC una risorsa più potente per la ricerca sull'interpretazione.
The European Parliament Interpreting Corpus (EPIC): implementation and developments
SANDRELLI A;
2012-01-01
Abstract
The European Parliament Interpreting Corpus (EPIC) is one of the first machine-readable corpora to be openly accessible in the field of Interpreting Studies. The present paper describes the steps undertaken to create and develo the corpus, including data collection, transcription part-of-speech (POS) tagging and lemmatisation are described; then, the web-interface developed to carry out simple and advanced queries on-line is illustrated. Special emphasis is placed on the potential of EPIC as a pedagogical and research tool. Finally, ongoing developments are discussed: text-to-sound and source text-to-target text alignment procedures are currently being tested, so as to make EPIC a more powerful resource for interpreting research.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.