DSL Task Repository

This is the official repository for the Disciminating between Similar Language (DSL) Shared Task 2015. Discriminating between similar languages and language varieties is one of the bottlenecks of language identification systems.

The results of the DSL-2015 Shared Task can be found on https://goo.gl/dCaxAV

This repo contains the following:

DSL Corpus Collection (DSLCC) version 2.0 (training, dev, test and gold data included)
DSL Shared Task submissions from participating teams
The script to blind Named Entities (NEs) for the Test Set B in DSL-2015 (blindNE.py)
The evaluation script to evaluate your outputs (evaluate.py)
The evaluation script to evaluate all submitted systems (evaluate_submissions.py)

To Evalute Your Output

Here's an example to evaluate your system output:

$ git clone https://github.com/Simdiva/DSL-Task.git
$ cd DSL-Task
$ python3 evaluate.py submissions/mms/mms-tfidf-close-run1.txt data/DSLCC-v2.0/gold/test-gold.txt

To blind Named Entities in the training data

$ python3 blindNE.py data/DSLCC-v2.0/train-dev/train.txt
$ python3 blindNE.py data/DSLCC-v2.0/train-dev/train.txt > train-noNE.txt

Previous Workshops

VarDial 2014 - First DSL Shared Task was held @ COLING 2014 (https://bitbucket.org/alvations/dslsharedtask2014)
LT4VarDial 2015 - 2nd Edition DSL Shared Task is going to be held @ RANLP 2015 (https://github.com/Simdiva/DSL-Task)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

DSL Task Repository

To Evalute Your Output

To blind Named Entities in the training data

Previous Workshops

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 41 Commits
data/DSLCC-v2.0		data/DSLCC-v2.0
submissions		submissions
DSL2015-results.md		DSL2015-results.md
LICENSE		LICENSE
README.md		README.md
blindNE.py		blindNE.py
evaluate.py		evaluate.py
evaluate_submissions.py		evaluate_submissions.py

License

Simdiva/DSL-Task

Folders and files

Latest commit

History

Repository files navigation

DSL Task Repository

To Evalute Your Output

To blind Named Entities in the training data

Previous Workshops

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages