DeepClimb/args.py at master · ColasGael/DeepClimb · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
"""Command-line arguments for setup.py, train.py, test.py.

Authors:
    Chris Chute (CS224n teaching staff)
        starter code from: https://github.com/chrischute/squad
    Gael Colas
"""

import argparse

# filenames of the files describing the data
DATA_FILENAMES = ["X", "X_type", "y", "y_user"]

def add_common_args(parser):
    """Add arguments common to all 3 scripts: setup.py, train.py, test.py"""
    # directory where the binary datasets are stored
    parser.add_argument('--binary_data_dir',
                        type=str,
                        default="./data/binary")
    # directory where the image datasets are stored
    parser.add_argument('--image_data_dir',
                        type=str,
                        default="./data/image")
    # versions of the MoonBoard handled
    parser.add_argument('--MB_versions',
                        type=list,
                        default=["2016", "2017"],
                        help="if you want to handle different versions of the MoonBoard, you need to adapt the scraping script and run > python scraper.py")
    # problems' grades considered
    parser.add_argument('--grades',
                        type=tuple,
                        default=('6A+','6B','6B+','6C','6C+','7A','7A+','7B','7B+','7C','7C+','8A','8A+','8B','8B+'),
                        help="if you want to handle other grades of the MoonBoard, you need to adapt the scraping script and run > python scraper.py")


def get_setup_args():
    """Get arguments needed in setup.py."""
    parser = argparse.ArgumentParser('Build the datasets and download the model weights')

    add_common_args(parser)

    # directory where the scraped data is stored
    parser.add_argument('--scraped_data_dir',
                        type=str,
                        default="./data/raw",
                        help="If ./data/raw is empty, run > python scraper.py")
    parser.add_argument('--data_filenames',
                        type=list,
                        default=DATA_FILENAMES,
                        help="Filenames of the useful datafiles")
    parser.add_argument('--train_split',
                        type=float,
                        default=0.8,
                        help="Fraction of the dataset to put in the train-set")
    parser.add_argument('--val_split',
                        type=float,
                        default=0.1,
                        help="Fraction of the dataset to put in the val-set")
    parser.add_argument('--test_split',
                        type=float,
                        default=0.1,
                        help="Fraction of the dataset to put in the test-set")
    parser.add_argument('--compute_img_stats',
                        type=bool,
                        default=False,
                        help="Whether to compute the train images statistics per version: mean and std images")
    # TODO: add url of pretrained models' weights

    args = parser.parse_args()

    return args


def add_train_test_args(parser):
    """Add arguments common to train.py and test.py"""
    parser.add_argument('--name',
                        '-n',
                        type=str,
                        required=True,
                        help='Name of the model to use for train/test.')
    parser.add_argument('--num_workers',
                        type=int,
                        default=4,
                        help='Number of sub-processes to use per data loader.')
    parser.add_argument('--save_dir',
                        type=str,
                        default='./save/',
                        help='Base directory for saving information.')
    parser.add_argument('--batch_size',
                        type=int,
                        default=64,
                        help='Batch size per GPU. Scales automatically when \
                              multiple GPUs are available.')
    parser.add_argument('--train_split',
                        type=str,
                        default='train',
                        choices=('train', 'dev'),
                        help='You can use the development set, small fraction of the train set, for debugging.')
    parser.add_argument('--val_split',
                        type=str,
                        default='val',
                        choices=('val', 'dev'),
                        help='You can use the development set, small fraction of the train set, for debugging.')
    parser.add_argument('--num_visuals',
                        type=int,
                        default=10,
                        help='Number of examples to visualize in TensorBoard.')
    parser.add_argument('--load_path',
                        type=str,
                        default=None,
                        help='Path to load as a model checkpoint.')
    parser.add_argument('--use_image',
                    type=bool,
                    default=True,
                    help='Whether to use the image or the binary representation of examples.')


def get_train_args():
    """Get arguments needed in train.py."""
    parser = argparse.ArgumentParser('Train a model')

    add_common_args(parser)
    add_train_test_args(parser)

    parser.add_argument('--eval_epochs',
                        type=int,
                        default=1,
                        help='Number of epochs between successive evaluations.')
    parser.add_argument('--lr',
                        type=float,
                        default=0.01,
                        help='Learning rate.')
    parser.add_argument('--l2_wd',
                        type=float,
                        default=0,
                        help='L2 weight decay.')
    parser.add_argument('--num_epochs',
                        type=int,
                        default=30,
                        help='Number of epochs for which to train. Negative means forever.')
    parser.add_argument('--metric_name',
                        type=str,
                        default='Acc',
                        choices=('Acc', 'MAE', 'F1'),
                        help='Name of dev metric to determine best checkpoint.')
    parser.add_argument('--max_checkpoints',
                        type=int,
                        default=5,
                        help='Maximum number of checkpoints to keep on disk.')
    parser.add_argument('--seed',
                        type=int,
                        default=231,
                        help='Random seed for reproducibility.')

    # unused
    parser.add_argument('--max_grad_norm',
                        type=float,
                        default=5.0,
                        help='Maximum gradient norm for gradient clipping.')
    parser.add_argument('--drop_prob',
                        type=float,
                        default=0.2,
                        help='Probability of zeroing an activation in dropout layers.')
    parser.add_argument('--ema_decay',
                        type=float,
                        default=0.999,
                        help='Decay rate for exponential moving average of parameters.')

    # Check which dataset to use: image or binary representation of examples
    args = parser.parse_args()
    args.use_image = args.use_image or ("image" in args.name.lower())

    # Check best metric evolution direction
    if args.metric_name in ('Acc', 'F1'):
        # Best checkpoint is the one that maximizes Accuracy or F1-score
        args.maximize_metric = True
    elif args.metric_name in ('MAE'):
        # Best checkpoint is the one that minimizes the MAE
        args.maximize_metric = False
    else:
        raise ValueError('Unrecognized metric name: "{}"'.format(args.metric_name))

    return args


def get_test_args():
    """Get arguments needed in test.py."""
    parser = argparse.ArgumentParser('Test a trained model')

    add_common_args(parser)
    add_train_test_args(parser)

    parser.add_argument('--test_split',
                        type=str,
                        default='val',
                        choices=('train', 'dev', 'val', 'test'),
                        help='Split to use for testing.')
    parser.add_argument('--pred_file',
                        type=str,
                        default='predictions',
                        help='Name for prediction file.')

    # Check which dataset to use: image or binary representation of examples
    args = parser.parse_args()
    args.use_image = args.use_image or ("image" in args.name.lower())

    # Require load_path for test.py
    if not args.load_path:
        raise argparse.ArgumentError('Missing required argument --load_path')

    return args