open-mmlab
diff --git a/‎projects/yolox-pose/configs/yolox-pose_s-poseota_8xb32-300e_coco.py‎
Lines changed: 11 additions & 0 deletions b/‎projects/yolox-pose/configs/yolox-pose_s-poseota_8xb32-300e_coco.py‎
Lines changed: 11 additions & 0 deletions
diff --git a/‎projects/yolox-pose/configs/yolox-pose_s_8xb32-300e_coco-960.py‎
Lines changed: 125 additions & 0 deletions b/‎projects/yolox-pose/configs/yolox-pose_s_8xb32-300e_coco-960.py‎
Lines changed: 125 additions & 0 deletions
diff --git a/‎projects/yolox-pose/configs/yolox-pose_s_8xb8-300e_coco.py‎ renamed to ‎projects/yolox-pose/configs/yolox-pose_s_8xb32-300e_coco.py‎
Lines changed: 24 additions & 15 deletions b/‎projects/yolox-pose/configs/yolox-pose_s_8xb8-300e_coco.py‎ renamed to ‎projects/yolox-pose/configs/yolox-pose_s_8xb32-300e_coco.py‎
Lines changed: 24 additions & 15 deletions
diff --git a/‎projects/yolox-pose/datasets/transforms.py‎
Lines changed: 2 additions & 1 deletion b/‎projects/yolox-pose/datasets/transforms.py‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎projects/yolox-pose/models/__init__.py‎
Lines changed: 1 addition & 0 deletions b/‎projects/yolox-pose/models/__init__.py‎
Lines changed: 1 addition & 0 deletions
@@ -0,0 +1,11 @@
+_base_ = './yolox-pose_s_8xb32-300e_coco.py'
+
+# model
+model = dict(
+    train_cfg=dict(
+        assigner=dict(
+            type='PoseSimOTAAssigner',
+            oks_weight=20.0,
+            vis_weight=1.0,
+            pose_ratio=0.0,
+        )))
@@ -0,0 +1,125 @@
+_base_ = 'mmyolo::yolox/yolox_s_fast_8xb32-300e-rtmdet-hyp_coco.py'
+
+img_scale = (960, 960)
+custom_imports = dict(imports=['models', 'datasets'])
+
+# visualizer
+visualizer = dict(
+    type='mmpose.PoseLocalVisualizer',
+    vis_backends=_base_.vis_backends,
+    name='visualizer')
+
+# model
+model = dict(
+    init_cfg=dict(
+        _delete_=True,
+        type='Pretrained',
+        checkpoint='https://download.openmmlab.com/mmyolo/v0/yolox/'
+        'yolox_s_fast_8xb32-300e-rtmdet-hyp_coco/yolox_s_fast_'
+        '8xb32-300e-rtmdet-hyp_coco_20230210_134645-3a8dfbd7.pth'),
+    data_preprocessor=dict(
+        type='mmdet.DetDataPreprocessor',
+        batch_augments=[
+            dict(
+                type='PoseBatchSyncRandomResize',
+                random_size_range=(720, 1200),
+                size_divisor=32,
+                interval=1)
+        ]),
+    bbox_head=dict(
+        type='YOLOXPoseHead',
+        head_module=dict(
+            type='YOLOXPoseHeadModule',
+            num_classes=1,
+            num_keypoints=17,
+        ),
+        loss_pose=dict(
+            type='OksLoss',
+            metainfo='configs/_base_/datasets/coco.py',
+            loss_weight=10),
+    ),
+    test_cfg=dict(score_thr=0.1, multi_label=False))
+
+# pipelines
+pre_transform = [
+    dict(type='LoadImageFromFile', file_client_args=_base_.file_client_args),
+    dict(type='PoseToDetConverter')
+]
+
+train_pipeline_stage1 = [
+    *pre_transform, *_base_.train_pipeline_stage1[2:-2],
+    dict(type='FilterDetPoseAnnotations', keep_empty=False),
+    dict(
+        type='PackDetPoseInputs',
+        meta_keys=('img_id', 'img_path', 'ori_shape', 'img_shape'))
+]
+
+for transform in train_pipeline_stage1:
+    if 'pre_transform' in transform:
+        transform['pre_transform'] = pre_transform
+    if 'img_scale' in transform:
+        transform['img_scale'] = img_scale
+    # if 'MixUp' in transform['type']:
+    #     transform['prob'] = 0.1
+    if transform['type'] == 'mmdet.RandomAffine':
+        transform['scaling_ratio_range'] = (0.7, 1.1)
+        transform['border'] = (-img_scale[0] // 2, -img_scale[1] // 2)
+        # transform['max_translate_ratio'] = 0.1
+
+train_pipeline_stage2 = [
+    *pre_transform, *_base_.train_pipeline_stage2[2:-2],
+    dict(type='FilterDetPoseAnnotations', keep_empty=False),
+    dict(type='PackDetPoseInputs')
+]
+
+for transform in train_pipeline_stage2:
+    if 'scale' in transform:
+        transform['scale'] = img_scale
+
+for hook in _base_.custom_hooks:
+    if hook['type'] == 'YOLOXModeSwitchHook':
+        hook['new_train_pipeline'] = train_pipeline_stage2
+
+test_pipeline = [
+    *pre_transform, *_base_.test_pipeline[1:-2],
+    dict(
+        type='PackDetPoseInputs',
+        meta_keys=('id', 'img_id', 'img_path', 'ori_shape', 'img_shape',
+                   'scale_factor', 'flip_indices'))
+]
+for transform in test_pipeline:
+    if 'scale' in transform:
+        transform['scale'] = img_scale
+
+# dataset settings
+dataset_type = 'CocoDataset'
+data_mode = 'bottomup'
+data_root = 'data/coco/'
+
+train_dataloader = dict(
+    dataset=dict(
+        type=dataset_type,
+        data_root=data_root,
+        data_mode=data_mode,
+        ann_file='annotations/person_keypoints_train2017.json',
+        pipeline=train_pipeline_stage1))
+_base_.train_dataloader.pop('collate_fn')
+
+val_dataloader = dict(
+    dataset=dict(
+        type=dataset_type,
+        data_root=data_root,
+        data_mode=data_mode,
+        test_mode=True,
+        ann_file='annotations/person_keypoints_val2017.json',
+        pipeline=test_pipeline))
+test_dataloader = val_dataloader
+
+# evaluators
+val_evaluator = dict(
+    _delete_=True,
+    type='mmpose.CocoMetric',
+    ann_file=data_root + 'annotations/person_keypoints_val2017.json',
+)
+test_evaluator = val_evaluator
+default_hooks = dict(checkpoint=dict(save_best='coco/AP', rule='greater'))
@@ -1,25 +1,29 @@
-# Directly inherit the entire recipe you want to use.
-_base_ = 'mmyolo::yolox/yolox_s_fast_8xb8-300e_coco.py'
+_base_ = 'mmyolo::yolox/yolox_s_fast_8xb32-300e-rtmdet-hyp_coco.py'
 
-# This line is to import your own modules.
 custom_imports = dict(imports=['models', 'datasets'])
 
-# Modify the model to use your own head and loss.
+# visualizer
+visualizer = dict(
+    type='mmpose.PoseLocalVisualizer',
+    vis_backends=_base_.vis_backends,
+    name='visualizer')
+
+# model
 model = dict(
     init_cfg=dict(
         _delete_=True,
         type='Pretrained',
-        checkpoint='https://download.openmmlab.com/mmyolo/'
-        'v0/yolox/yolox_s_8xb8-300e_coco/'
-        'yolox_s_8xb8-300e_coco_20220917_030738-d7e60cb2.pth'),
+        checkpoint='https://download.openmmlab.com/mmyolo/v0/yolox/'
+        'yolox_s_fast_8xb32-300e-rtmdet-hyp_coco/yolox_s_fast_'
+        '8xb32-300e-rtmdet-hyp_coco_20230210_134645-3a8dfbd7.pth'),
     data_preprocessor=dict(
         type='mmdet.DetDataPreprocessor',
         batch_augments=[
             dict(
                 type='PoseBatchSyncRandomResize',
                 random_size_range=(480, 800),
                 size_divisor=32,
-                interval=10)
+                interval=1)
         ]),
     bbox_head=dict(
         type='YOLOXPoseHead',
@@ -31,10 +35,11 @@
         loss_pose=dict(
             type='OksLoss',
             metainfo='configs/_base_/datasets/coco.py',
-            loss_weight=50),
+            loss_weight=10),
     ),
-    test_cfg=dict(multi_label=False))
+    test_cfg=dict(score_thr=0.1, multi_label=False))
 
+# pipelines
 pre_transform = [
     dict(type='LoadImageFromFile', file_client_args=_base_.file_client_args),
     dict(type='PoseToDetConverter')
@@ -51,13 +56,21 @@
 for transform in train_pipeline_stage1:
     if 'pre_transform' in transform:
         transform['pre_transform'] = pre_transform
+    # if 'MixUp' in transform['type']:
+    #     transform['prob'] = 0.1
+    if transform['type'] == 'mmdet.RandomAffine':
+        transform['scaling_ratio_range'] = (0.75, 1)
 
 train_pipeline_stage2 = [
     *pre_transform, *_base_.train_pipeline_stage2[2:-2],
     dict(type='FilterDetPoseAnnotations', keep_empty=False),
     dict(type='PackDetPoseInputs')
 ]
 
+for hook in _base_.custom_hooks:
+    if hook['type'] == 'YOLOXModeSwitchHook':
+        hook['new_train_pipeline'] = train_pipeline_stage2
+
 test_pipeline = [
     *pre_transform, *_base_.test_pipeline[1:-2],
     dict(
@@ -66,7 +79,7 @@
                    'scale_factor', 'flip_indices'))
 ]
 
-# base dataset settings
+# dataset settings
 dataset_type = 'CocoDataset'
 data_mode = 'bottomup'
 data_root = 'data/coco/'
@@ -95,10 +108,6 @@
     _delete_=True,
     type='mmpose.CocoMetric',
     ann_file=data_root + 'annotations/person_keypoints_val2017.json',
-    nms_mode='none',
-    # score_mode='keypoint',
 )
 test_evaluator = val_evaluator
-
-# hooks
 default_hooks = dict(checkpoint=dict(save_best='coco/AP', rule='greater'))
@@ -58,7 +58,8 @@ class PackDetPoseInputs(PackDetInputs):
     def __init__(self,
                  meta_keys=('id', 'img_id', 'img_path', 'ori_shape',
                             'img_shape', 'scale_factor', 'flip',
-                            'flip_direction', 'flip_indices', 'raw_ann_info')):
+                            'flip_direction', 'flip_indices', 'raw_ann_info'),
+                 pack_transformed=False):
         self.meta_keys = meta_keys
 
     def transform(self, results: dict) -> dict:
 
@@ -1,3 +1,4 @@
+from .assigner import *  # noqa
 from .data_preprocessor import *  # noqa
 from .oks_loss import *  # noqa
 from .utils import *  # noqa
Original file line number	Diff line number	Diff line change
`@@ -1,3 +1,4 @@`
	`1`	`+from .assigner import * # noqa`
`1`	`2`	`from .data_preprocessor import * # noqa`
`2`	`3`	`from .oks_loss import * # noqa`
`3`	`4`	`from .utils import * # noqa`