gen_summary_metadata.py

"""
A Benchmark Summary Metadata tool to extract and generate metadata from models at runtime.
"""
import argparse
from copy import deepcopy
import os
import yaml
from typing import Any, Dict, List, Tuple

import torch
from torchbenchmark import list_models, load_model_by_name, _list_model_paths, ModelTask, ModelDetails, str_to_bool

TIMEOUT = 300  # seconds
torchbench_dir = 'torchbenchmark'
model_dir = 'models'

_DEFAULT_METADATA_ = {
    'train_benchmark': True,
    'train_deterministic': False,
    'eval_benchmark': True,
    'eval_deterministic': False,
    'eval_nograd': True,
    # 'origin': None,
    # 'train_dtype': 'float32',
    # 'eval_dtype': 'float32',
}


def _parser_helper(input):
    return None if input is None else str_to_bool(str(input))


def _process_model_details_to_metadata(train_detail: ModelDetails, eval_detail: ModelDetails) -> Dict[str, Any]:
    metadata = {}
    for k, v in _DEFAULT_METADATA_.items():
        if hasattr(train_detail, k):
            metadata[k] = getattr(train_detail, k)
        elif train_detail and k in train_detail.metadata:
            metadata[k] = train_detail.metadata[k]
        elif eval_detail and k in eval_detail.metadata:
            metadata[k] = eval_detail.metadata[k]
        else:
            metadata[k] = v
    return metadata


def _extract_detail(path: str) -> Dict[str, Any]:
    name = os.path.basename(path)
    device = "cuda"
    t_detail = None
    e_detail = None
    # Separate train and eval to isolated processes.
    task_t = ModelTask(path, timeout=TIMEOUT)
    try:
        task_t.make_model_instance(device=device, jit=False)
        task_t.set_train()
        task_t.train()
        task_t.extract_details_train()
        task_t.del_model_instance()
        t_detail = deepcopy(task_t._details)
    except NotImplementedError:
        print(f'Model {name} train is not fully implemented. skipping...')
    del task_t

    task_e = ModelTask(path, timeout=TIMEOUT)
    try:
        task_e.make_model_instance(device=device, jit=False)
        task_e.set_eval()
        task_e.eval()
        task_e.extract_details_eval()
        task_e.del_model_instance()
        e_detail = deepcopy(task_e._details)
    except NotImplementedError:
        print(f'Model {name} eval is not fully implemented. skipping...')
    del task_e
    return _process_model_details_to_metadata(t_detail, e_detail)


def _extract_all_details(model_names: List[str]) -> List[Tuple[str, Dict[str, Any]]]:
    details = []
    for model_path in _list_model_paths():
        model_name = os.path.basename(model_path)
        if model_name not in model_names:
            continue
        ed = _extract_detail(model_path)
        details.append((model_path, ed))
    return details


def _print_extracted_details(extracted_details: List[Tuple[str, Dict[str, Any]]]):
    for path, ex_detail in extracted_details:
        name = os.path.basename(path)
        print(f'Model: {name} , Details: {ex_detail}')


def _maybe_override_extracted_details(args, extracted_details: List[Tuple[str, Dict[str, Any]]]):
    for _path, ex_detail in extracted_details:
        if args.train_benchmark is not None:
            ex_detail['train_benchmark'] = args.train_benchmark
        elif args.train_deterministic is not None:
            ex_detail['train_deterministic'] = args.train_deterministic
        elif args.eval_benchmark is not None:
            ex_detail['eval_benchmark'] = args.eval_benchmark
        elif args.eval_deterministic is not None:
            ex_detail['eval_deterministic'] = args.eval_deterministic
        elif args.eval_nograd is not None:
            ex_detail['eval_nograd'] = args.eval_nograd


def _write_metadata_yaml_files(extracted_details: List[Tuple[str, Dict[str, Any]]]):
    for path, ex_detail in extracted_details:
        metadata_path = path + "/metadata.yaml"
        with open(metadata_path, 'w') as file:
            yaml.dump(ex_detail, file)
            print(f"Processed file: {metadata_path}")

if __name__ == "__main__":
    parser = argparse.ArgumentParser(__doc__)
    parser.add_argument("--model", default=None,
                        help="Full name of a model to update. If absent, applies to all models.")
    parser.add_argument("--extract-only", default=False, action="store_true",
                        help="Only extract model details.")
    parser.add_argument("--train-benchmark", default=None, type=_parser_helper,
                        help="Whether to enable PyTorch benchmark mode during train.")
    parser.add_argument("--train-deterministic", default=None, type=_parser_helper,
                        help="Whether to enable deterministic during train.")
    parser.add_argument("--eval-benchmark", default=None, type=_parser_helper,
                        help="Whether to enable PyTorch benchmark mode during eval.")
    parser.add_argument("--eval-deterministic", default=None, type=_parser_helper,
                        help="Whether to enable deterministic during eval.")
    parser.add_argument("--eval-nograd", default=None, type=_parser_helper,
                        help="Whether to enable no_grad during eval.")
    # parser.add_argument("--origin", default=None,
    #                     help="Location of benchmark's origin. Such as torchtext or torchvision.")
    # parser.add_argument("--train-dtype", default=None,
    #                     choices=['float32', 'float16', 'bfloat16', 'amp'], help="Which fp type to perform training.")
    # parser.add_argument("--eval-dtype", default=None,
    #                     choices=['float32', 'float16', 'bfloat16', 'amp'], help="Which fp type to perform eval.")
    args = parser.parse_args()

    # Only allow this script for cuda for now.
    if not torch.cuda.is_available():
        print("This tool is currently only supported when the system has a cuda device.")
        exit(1)

    # Find the matching model, or use all models.
    models = []
    model_names = []
    if args.model is not None:
        Model = load_model_by_name(args.model)
        if not Model:
            print(f"Unable to find model matching: {args.model}.")
            exit(-1)
        models.append(Model)
        model_names.append(Model.name)
        print(f"Generating metadata to select model: {model_names}.")
    else:
        models.extend(list_models(model_match=args.model))
        model_names.extend([m.name for m in models])
        print("Generating metadata to all models.")

    # Extract all model details from models.
    extracted_details = _extract_all_details(model_names)
    print("Printing extracted metadata.")
    _print_extracted_details(extracted_details)

    # Stop here for extract-only.
    if args.extract_only:
        print("--extract-only is set. Stop here.")
        exit(0)

    # Apply details passed in by flags.
    _maybe_override_extracted_details(args, extracted_details)
    print("Printing metadata after applying any modifications.")
    _print_extracted_details(extracted_details)

    # TODO: Modify and update the model to apply metadata changes by the user.

    # Generate metadata files for each matching models.
    _write_metadata_yaml_files(extracted_details)