Adds the pretrained module from allennlp-hub. (#42)

* Adds the `pretrained` module from allennlp-hub. * Formatting * Ignore long lines * Bumping CI * Make PyTest find tests * add self-hosted workflow * use custom mark * add missing import * revert Co-authored-by: epwalsh <[email protected]>
allenai · May 8, 2020 · 96d623c · 96d623c
1 parent 36020d5
commit 96d623c
Show file tree

Hide file tree

Showing 8 changed files with 605 additions and 3 deletions.
diff --git a/.dockerignore b/.dockerignore
@@ -0,0 +1,7 @@
+.dockerignore
+**.pyc
+**/__pycache__
+.gitignore
+.git
+build
+dist
diff --git a/.github/workflows/main.yml b/.github/workflows/main.yml
@@ -62,3 +62,21 @@ jobs:
         codecov || echo "codecov upload failed"
       env:
         CODECOV_TOKEN: ${{ secrets.CODECOV_TOKEN }}
+
+  pretrained:
+    runs-on: [self-hosted]
+
+    steps:
+    - uses: actions/checkout@v2
+
+    - name: Set Docker tag
+      run: |
+        echo "::set-env name=DOCKER_TAG::$GITHUB_SHA";
+
+    - name: Build test image
+      run: |
+        make docker-test-image
+
+    - name: Run pretrained tests
+      run: |
+        make docker-test-run ARGS='test-pretrained'
diff --git a/.github/workflows/release.yml b/.github/workflows/release.yml
@@ -114,9 +114,27 @@ jobs:
       run: |
         ./scripts/ensure_versions_match.py
 
+  pretrained:
+    runs-on: [self-hosted]
+
+    steps:
+    - uses: actions/checkout@v2
+
+    - name: Set Docker tag
+      run: |
+        echo "::set-env name=DOCKER_TAG::${GITHUB_REF#refs/tags/}";
+
+    - name: Build test image
+      run: |
+        make docker-test-image
+
+    - name: Run pretrained tests
+      run: |
+        make docker-test-run ARGS='test-pretrained'
+
   publish:
     name: PyPI
-    needs: [build, test]
+    needs: [build, test, pretrained]
     runs-on: ubuntu-latest
 
     steps:

diff --git a/Dockerfile.test b/Dockerfile.test
@@ -0,0 +1,27 @@
+# Used to build an image for running tests.
+FROM python:3.7
+
+ENV LC_ALL=C.UTF-8
+ENV LANG=C.UTF-8
+
+ENV PATH /usr/local/nvidia/bin/:$PATH
+ENV LD_LIBRARY_PATH /usr/local/nvidia/lib:/usr/local/nvidia/lib64
+
+# Tell nvidia-docker the driver spec that we need as well as to
+# use all available devices, which are mounted at /usr/local/nvidia.
+# The LABEL supports an older version of nvidia-docker, the env
+# variables a newer one.
+ENV NVIDIA_VISIBLE_DEVICES all
+ENV NVIDIA_DRIVER_CAPABILITIES compute,utility
+LABEL com.nvidia.volumes.needed="nvidia_driver"
+
+WORKDIR /stage/allennlp-models
+
+COPY requirements.txt requirements.txt
+COPY dev-requirements.txt dev-requirements.txt
+RUN pip install --no-cache-dir -r requirements.txt && \
+    pip install --no-cache-dir -r dev-requirements.txt
+
+COPY . .
+
+ENTRYPOINT ["make"]
diff --git a/Makefile b/Makefile
@@ -1,3 +1,6 @@
+DOCKER_TAG = latest
+DOCKER_RUN_CMD = docker run --rm -v $$HOME/.allennlp:/root/.allennlp
+
 .PHONY : version
 version :
 	@python -c 'from allennlp_models.version import VERSION; print(f"AllenNLP Models v{VERSION}")'
@@ -13,8 +16,20 @@ typecheck :
 
 .PHONY : test
 test :
-	pytest --color=yes -rf --durations=40
+	pytest --color=yes -rf --durations=40 -m "not pretrained_model_test"
 
 .PHONY : test-with-cov
 test-with-cov :
-	pytest --color=yes -rf --cov-config=.coveragerc --cov=allennlp_models/ --durations=40
+	pytest --color=yes -rf --cov-config=.coveragerc --cov=allennlp_models/ --durations=40 -m "not pretrained_model_test"
+
+.PHONY : test-pretrained
+test-pretrained :
+	pytest -v --color=yes -m "pretrained_model_test"
+
+.PHONY : docker-test-image
+docker-test-image :
+	docker build --pull -f Dockerfile.test -t allennlp-models/test:$(DOCKER_TAG) .
+
+.PHONY : docker-test-run
+docker-test-run :
+	$(DOCKER_RUN_CMD) --gpus 2 allennlp-models/test:$(DOCKER_TAG) $(ARGS)
diff --git a/allennlp_models/pretrained.py b/allennlp_models/pretrained.py
@@ -0,0 +1,146 @@
+from allennlp.models import load_archive
+from allennlp.predictors import Predictor, SentenceTaggerPredictor
+
+from allennlp_models.coref import CorefPredictor
+from allennlp_models.nli import DecomposableAttentionPredictor
+from allennlp_models.rc.bidaf import ReadingComprehensionPredictor
+from allennlp_models.syntax import (
+    SemanticRoleLabelerPredictor,
+    OpenIePredictor,
+    ConstituencyParserPredictor,
+    BiaffineDependencyParserPredictor,
+)
+
+# flake8: noqa: E501
+
+
+def _load_predictor(archive_file: str, predictor_name: str) -> Predictor:
+    """
+    Helper to load the desired predictor from the given archive.
+    """
+    archive = load_archive(archive_file)
+    return Predictor.from_archive(archive, predictor_name)
+
+
+def bert_srl_shi_2019() -> SemanticRoleLabelerPredictor:
+    predictor = _load_predictor(
+        "https://storage.googleapis.com/allennlp-public-models/bert-base-srl-2020.03.24.tar.gz",
+        "semantic-role-labeling",
+    )
+    return predictor
+
+
+def bidirectional_attention_flow_seo_2017() -> ReadingComprehensionPredictor:
+    """
+    Reading Comprehension
+
+    Based on `BiDAF (Seo et al, 2017) <https://www.semanticscholar.org/paper/Bidirectional-Attention-Flow-for-Machine-Comprehen-Seo-Kembhavi/007ab5528b3bd310a80d553cccad4b78dc496b02>`_
+    """
+    predictor = _load_predictor(
+        "https://storage.googleapis.com/allennlp-public-models/bidaf-model-2020.03.19.tar.gz",
+        "reading-comprehension",
+    )
+    return predictor
+
+
+def naqanet_dua_2019() -> ReadingComprehensionPredictor:
+    predictor = _load_predictor(
+        "https://storage.googleapis.com/allennlp-public-models/naqanet-2020.02.19.tar.gz",
+        "reading-comprehension",
+    )
+    return predictor
+
+
+def open_information_extraction_stanovsky_2018() -> OpenIePredictor:
+    predictor = _load_predictor(
+        "https://storage.googleapis.com/allennlp-public-models/openie-model.2020.03.26.tar.gz",
+        "open-information-extraction",
+    )
+    return predictor
+
+
+def decomposable_attention_with_elmo_parikh_2017() -> DecomposableAttentionPredictor:
+    """
+    Textual Entailment
+
+    Based on `Parikh et al, 2017 <https://www.semanticscholar.org/paper/A-Decomposable-Attention-Model-for-Natural-Languag-Parikh-T%C3%A4ckstr%C3%B6m/07a9478e87a8304fc3267fa16e83e9f3bbd98b27>`_
+    """
+    predictor = _load_predictor(
+        "https://storage.googleapis.com/allennlp-public-models/decomposable-attention-elmo-2020.04.09.tar.gz",
+        "textual-entailment",
+    )
+    return predictor
+
+
+def neural_coreference_resolution() -> CorefPredictor:
+    """
+    Coreference Resolution
+    """
+    predictor = _load_predictor(
+        "https://storage.googleapis.com/allennlp-public-models/coref-spanbert-large-2020.02.27.tar.gz",
+        "coreference-resolution",
+    )
+    return predictor
+
+
+def named_entity_recognition_with_elmo_peters_2018() -> SentenceTaggerPredictor:
+    """
+    Named Entity Recognition
+
+    Based on `Deep contextualized word representations <https://arxiv.org/abs/1802.05365>`_
+    """
+    predictor = _load_predictor(
+        "https://storage.googleapis.com/allennlp-public-models/ner-model-2020.02.10.tar.gz",
+        "sentence-tagger",
+    )
+    return predictor
+
+
+def fine_grained_named_entity_recognition_with_elmo_peters_2018() -> SentenceTaggerPredictor:
+    """
+    Fine Grained Named Entity Recognition
+    """
+    predictor = _load_predictor(
+        "https://storage.googleapis.com/allennlp-public-models/fine-grained-ner-model-elmo-2018.12.21.tar.gz",
+        "sentence-tagger",
+    )
+    return predictor
+
+
+def span_based_constituency_parsing_with_elmo_joshi_2018() -> ConstituencyParserPredictor:
+    """
+    Constituency Parsing
+
+    Based on `Minimal Span Based Constituency Parser (Stern et al, 2017) <https://www.semanticscholar.org/paper/A-Minimal-Span-Based-Neural-Constituency-Parser-Stern-Andreas/593e4e749bd2dbcaf8dc25298d830b41d435e435>`_ but with ELMo embeddings
+    """
+    predictor = _load_predictor(
+        "https://storage.googleapis.com/allennlp-public-models/elmo-constituency-parser-2020.02.10.tar.gz",
+        "constituency-parser",
+    )
+    return predictor
+
+
+def biaffine_parser_universal_dependencies_todzat_2017() -> BiaffineDependencyParserPredictor:
+    """
+    Biaffine Dependency Parser (Stanford Dependencies)
+
+    Based on `Dozat and Manning, 2017 <https://arxiv.org/pdf/1611.01734.pdf>`_
+    """
+    predictor = _load_predictor(
+        "https://storage.googleapis.com/allennlp-public-models/biaffine-dependency-parser-ptb-2020.04.06.tar.gz",
+        "biaffine-dependency-parser",
+    )
+    return predictor
+
+
+def esim_nli_with_elmo_chen_2017() -> DecomposableAttentionPredictor:
+    """
+    ESIM
+
+    Based on `Enhanced LSTM for Natural Language Inference <https://arxiv.org/pdf/1609.06038.pdf>`_ and uses ELMo
+    """
+    predictor = _load_predictor(
+        "https://storage.googleapis.com/allennlp-public-models/decomposable-attention-elmo-2020.04.09.tar.gz",
+        "textual-entailment",
+    )
+    return predictor
diff --git a/pytest.ini b/pytest.ini
@@ -3,6 +3,7 @@ testpaths = tests/
 log_format = %(asctime)s - %(levelname)s - %(name)s - %(message)s
 log_level = DEBUG
 markers =
+    pretrained_model_test
     java
 filterwarnings =
 # Note: When a warning matches more than one option in the list,