Add TransCheX Tutorial

ahatamiz · ahatamiz · commit b1310a5fb62e · 2021-12-19T18:48:15.000-08:00
Signed-off-by: ahatamizadeh &lt;ahatamizadeh@nvidia.com&gt;
diff --git a/multimodal/openi_multilabel_classification_transchex/Transchex_OpenI_multilabel_classification.ipynb b/multimodal/openi_multilabel_classification_transchex/Transchex_OpenI_multilabel_classification.ipynb
@@ -69,9 +69,10 @@
    "outputs": [],
    "source": [
     "import os\n",
+    "\n",
     "datadir = \"./monai_data\"\n",
     "if not os.path.exists(datadir):\n",
-    "    os.makedirs(datadir)\n"
+    "    os.makedirs(datadir)"
    ]
   },
   {
@@ -133,6 +134,7 @@
     "from monai.networks.nets import Transchex\n",
     "from monai.config import print_config\n",
     "from monai.utils import set_determinism\n",
+    "\n",
     "torch.backends.cudnn.benchmark = True\n",
     "\n",
     "print_config()"
@@ -176,11 +178,13 @@
     "        self.img_name = self.data.id\n",
     "        self.targets = self.data.list\n",
     "\n",
-    "        self.preprocess = transforms.Compose([\n",
-    "            transforms.Resize(256),\n",
-    "            transforms.ToTensor(),\n",
-    "            transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])\n",
-    "        ])\n",
+    "        self.preprocess = transforms.Compose(\n",
+    "            [\n",
+    "                transforms.Resize(256),\n",
+    "                transforms.ToTensor(),\n",
+    "                transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5]),\n",
+    "            ]\n",
+    "        )\n",
     "        self.parent_dir = parent_dir\n",
     "\n",
     "    def __len__(self):\n",
@@ -189,8 +193,8 @@
     "    def encode_features(self, sent, max_seq_length, tokenizer):\n",
     "        tokens = tokenizer.tokenize(sent.strip())\n",
     "        if len(tokens) > max_seq_length - 2:\n",
-    "            tokens = tokens[:(max_seq_length - 2)]\n",
-    "        tokens = ['[CLS]'] + tokens + ['[SEP]']\n",
+    "            tokens = tokens[: (max_seq_length - 2)]\n",
+    "        tokens = [\"[CLS]\"] + tokens + [\"[SEP]\"]\n",
     "        input_ids = tokenizer.convert_tokens_to_ids(tokens)\n",
     "        segment_ids = [0] * len(input_ids)\n",
     "        while len(input_ids) < max_seq_length:\n",
@@ -201,22 +205,24 @@
     "        return input_ids, segment_ids\n",
     "\n",
     "    def __getitem__(self, index):\n",
-    "        name = self.img_name[index].split('.')[0]\n",
+    "        name = self.img_name[index].split(\".\")[0]\n",
     "        img_address = os.path.join(self.parent_dir, self.img_name[index])\n",
     "        image = Image.open(img_address)\n",
     "        images = self.preprocess(image)\n",
     "        report = str(self.report_summary[index])\n",
     "        report = \" \".join(report.split())\n",
-    "        input_ids, segment_ids = self.encode_features(report, self.max_seq_length, self.tokenizer)\n",
+    "        input_ids, segment_ids = self.encode_features(\n",
+    "            report, self.max_seq_length, self.tokenizer\n",
+    "        )\n",
     "        input_ids = torch.tensor(input_ids, dtype=torch.long)\n",
     "        segment_ids = torch.tensor(segment_ids, dtype=torch.long)\n",
     "        targets = torch.tensor(self.targets[index], dtype=torch.float)\n",
     "        return {\n",
-    "            'ids': input_ids,\n",
-    "            'segment_ids': segment_ids,\n",
-    "            'name': name,\n",
-    "            'targets': targets,\n",
-    "            'images': images,\n",
+    "            \"ids\": input_ids,\n",
+    "            \"segment_ids\": segment_ids,\n",
+    "            \"name\": name,\n",
+    "            \"targets\": targets,\n",
+    "            \"images\": images,\n",
     "        }"
    ]
   },
@@ -320,6 +326,7 @@
     "def save_ckp(state, checkpoint_dir):\n",
     "    torch.save(state, checkpoint_dir)\n",
     "\n",
+    "\n",
     "def compute_AUCs(gt, pred, num_classes=14):\n",
     "    with torch.no_grad():\n",
     "        AUROCs = []\n",
@@ -329,19 +336,23 @@
     "            AUROCs.append(roc_auc_score(gt_np[:, i].tolist(), pred_np[:, i].tolist()))\n",
     "    return AUROCs\n",
     "\n",
+    "\n",
     "def train(epoch):\n",
     "    model.train()\n",
     "    for i, data in enumerate(training_loader, 0):\n",
-    "        input_ids = data['ids'].cuda()\n",
-    "        segment_ids = data['segment_ids'].cuda()\n",
-    "        img = data['images'].cuda()\n",
-    "        targets = data['targets'].cuda()\n",
-    "        logits_lang = model(input_ids=input_ids,vision_feats=img,token_type_ids=segment_ids)\n",
+    "        input_ids = data[\"ids\"].cuda()\n",
+    "        segment_ids = data[\"segment_ids\"].cuda()\n",
+    "        img = data[\"images\"].cuda()\n",
+    "        targets = data[\"targets\"].cuda()\n",
+    "        logits_lang = model(\n",
+    "            input_ids=input_ids, vision_feats=img, token_type_ids=segment_ids\n",
+    "        )\n",
     "        loss = loss_bce(torch.sigmoid(logits_lang), targets)\n",
     "        optimizer.zero_grad()\n",
     "        loss.backward()\n",
     "        optimizer.step()\n",
-    "        print(f'Epoch: {epoch}, Iteration: {i}, Loss_Tot: {loss}')\n",
+    "        print(f\"Epoch: {epoch}, Iteration: {i}, Loss_Tot: {loss}\")\n",
+    "\n",
     "\n",
     "def validation(testing_loader):\n",
     "    model.eval()\n",
@@ -350,11 +361,13 @@
     "    val_loss = []\n",
     "    with torch.no_grad():\n",
     "        for _, data in enumerate(testing_loader, 0):\n",
-    "            input_ids = data['ids'].cuda()\n",
-    "            segment_ids = data['segment_ids'].cuda()\n",
-    "            img = data['images'].cuda()\n",
-    "            targets = data['targets'].cuda()\n",
-    "            logits_lang = model(input_ids=input_ids, vision_feats=img, token_type_ids=segment_ids)\n",
+    "            input_ids = data[\"ids\"].cuda()\n",
+    "            segment_ids = data[\"segment_ids\"].cuda()\n",
+    "            img = data[\"images\"].cuda()\n",
+    "            targets = data[\"targets\"].cuda()\n",
+    "            logits_lang = model(\n",
+    "                input_ids=input_ids, vision_feats=img, token_type_ids=segment_ids\n",
+    "            )\n",
     "            prob = torch.sigmoid(logits_lang)\n",
     "            loss = loss_bce(prob, targets).item()\n",
     "            targets_in[_, :] = targets.detach().cpu().numpy()\n",
@@ -363,9 +376,14 @@
     "        auc = compute_AUCs(targets_in, preds_cls, 14)\n",
     "        mean_auc = np.mean(auc)\n",
     "        mean_loss = np.mean(val_loss)\n",
-    "        print('Evaluation Statistics: Mean AUC : {}, Mean Loss : {}'.format(mean_auc, mean_loss))\n",
+    "        print(\n",
+    "            \"Evaluation Statistics: Mean AUC : {}, Mean Loss : {}\".format(\n",
+    "                mean_auc, mean_loss\n",
+    "            )\n",
+    "        )\n",
     "    return mean_auc, mean_loss, auc\n",
     "\n",
+    "\n",
     "auc_val_best = 0.0\n",
     "epoch_loss_values = []\n",
     "metric_values = []\n",
@@ -375,14 +393,24 @@
     "    epoch_loss_values.append(loss_val)\n",
     "    metric_values.append(auc_val)\n",
     "    if auc_val > auc_val_best:\n",
-    "        checkpoint = {'epoch': epoch,\n",
-    "                      'state_dict': model.state_dict(),\n",
-    "                      'optimizer': optimizer.state_dict()}\n",
-    "        save_ckp(checkpoint, logdir+'/transchex.pt')\n",
+    "        checkpoint = {\n",
+    "            \"epoch\": epoch,\n",
+    "            \"state_dict\": model.state_dict(),\n",
+    "            \"optimizer\": optimizer.state_dict(),\n",
+    "        }\n",
+    "        save_ckp(checkpoint, logdir + \"/transchex.pt\")\n",
     "        auc_val_best = auc_val\n",
-    "        print('Model Was Saved ! Current Best Validation AUC: {}    Current AUC: {}'.format(auc_val_best, auc_val))\n",
+    "        print(\n",
+    "            \"Model Was Saved ! Current Best Validation AUC: {}    Current AUC: {}\".format(\n",
+    "                auc_val_best, auc_val\n",
+    "            )\n",
+    "        )\n",
     "    else:\n",
-    "        print('Model Was NOT Saved ! Current Best Validation AUC: {}    Current AUC: {}'.format(auc_val_best, auc_val))\n",
+    "        print(\n",
+    "            \"Model Was NOT Saved ! Current Best Validation AUC: {}    Current AUC: {}\".format(\n",
+    "                auc_val_best, auc_val\n",
+    "            )\n",
+    "        )\n",
     "    scheduler.step()"
    ]
   },
@@ -400,9 +428,7 @@
     }
    ],
    "source": [
-    "print(\n",
-    "    f\"Training Finished ! Best Validation AUC: {auc_val_best:.4f} \"\n",
-    ")"
+    "print(f\"Training Finished ! Best Validation AUC: {auc_val_best:.4f} \")"
    ]
   },
   {
@@ -503,7 +529,20 @@
     "\n",
     "print(\n",
     "    \"\\nMean test AUC for each class in 14 disease categories:\\n\\nAtelectasis: {}\\nCardiomegaly: {}\\nConsolidation: {}\\nEdema: {}\\nEnlarged-Cardiomediastinum: {}\\nFracture: {}\\nLung-Lesion: {}\\nLung-Opacity: {}\\nNo-Finding: {}\\nPleural-Effusion: {}\\nPleural_Other: {}\\nPneumonia: {}\\nPneumothorax: {}\\nSupport-Devices: {}\".format(\n",
-    "        auc[0], auc[1], auc[2], auc[3], auc[4], auc[5], auc[6], auc[7], auc[8], auc[9], auc[10], auc[11], auc[12], auc[13]\n",
+    "        auc[0],\n",
+    "        auc[1],\n",
+    "        auc[2],\n",
+    "        auc[3],\n",
+    "        auc[4],\n",
+    "        auc[5],\n",
+    "        auc[6],\n",
+    "        auc[7],\n",
+    "        auc[8],\n",
+    "        auc[9],\n",
+    "        auc[10],\n",
+    "        auc[11],\n",
+    "        auc[12],\n",
+    "        auc[13],\n",
     "    )\n",
     ")"
    ]