Skip to content
/ ELAN-T Public

O ELAN-T (Eudico Linguistic Annotator - Tagger) é uma ferramenta para a etiquetagem POS (POS Tagging) de arquivos .txt exportados do software ELAN.

Notifications You must be signed in to change notification settings

tuliosg/ELAN-T

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 

Repository files navigation

ELAN-T

O ELAN-T (EUDICO Linguistic Annotator - Tagger) é uma ferramenta que permite a etiquetagem (Part-Of-Speech Tagging) de arquivos .txt exportados do software ELAN. A etiquetagem é realizada através do modelo pré-treinado para Português Brasileiro da biblioteca spaCy, o pt_core_news_lg.

Como utilizar?

Instalando as dependências

Inicialmente, é necessária a instalação das dependências do projeto:

pip install -r requirements.txt

Nessa etapa serão instalados os componentes necessários para a execução correta do código. Observação: O procedimento pode demorar um pouco pois o modelo utilizado possui um tamanho considerável.

Organizando o diretório

O uso do script depende da organização dos arquivos em uma pasta única. Assim, armazene todos os arquivos .txt que foram exportados do ELAN em uma pasta que contenha apenas isso.

Um exemplo de caminho organizado:

C:\User\Desktop\Arquivos_ELAN

A nomenclatura acima é apenas um exemplo. Uma dica que pode evitar transtornos é criar a pasta em um caminho que não possua acentos, caracteres especiais ou espaços em branco nos nomes das pastas.

Executando o código

A ferramenta permite a etiquetagem de uma ou mais entrevistas presentes em uma pasta. Para a execução do código:

py elan-t.py caminho\pasta_dos_arquivos

About

O ELAN-T (Eudico Linguistic Annotator - Tagger) é uma ferramenta para a etiquetagem POS (POS Tagging) de arquivos .txt exportados do software ELAN.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages