Added ggml_tensor_printf() to debug tensors. (ggml-org#25)

cmp-nct · John · web-flow · commit 3f373bdd272a · 2023-06-24T22:14:19.000+02:00
* Added ggml_tensor_printf() to debug tensors.
Not sure if all cases work, it was only tested a bit.

Example for the ggml_repeat2 dst tensor after it was computed:
+======================+======================+======================+======================+
| ggml_compute_forward_repeat2_f32:9497
| node_1233
+----------------------+----------------------+----------------------+----------------------+
| Dimensions           | Quantization         | Layer id             | Backend              |
| 3                    | f32                  | 31                   | CPU                  |
+----------------------+----------------------+----------------------+----------------------+
| Elements             | Src0                 | Src1                 | Operation            |
| 64 x 2 x 71          | 64 x 2 x 1           | 64 x 2 x 71          | REPEAT2              |
+----------------------+----------------------+----------------------+----------------------+
| Src0 name:           | node_1232                                                          |
| Src1 name:           | leaf_17                                                            |
+----------------------+----------------------+----------------------+----------------------+

+-------------------------------------------------------------------------------------------+
| Content of src0 "node_1232" (3 dim)
Layer 0
| -0.019758            0.772589             0.000000             |
| 0.772589             0.000000             0.000000             |
| 0.000000             0.000000             0.000000             |
+-------------------------------------------------------------------------------------------+

Layer 1
| 0.001423             -1.063233            0.000000             |
| -1.063233            0.000000             0.000000             |
| 0.000000             0.000000             0.000000             |
+-------------------------------------------------------------------------------------------+

Layer 2
| -0.042461            -0.936166            0.000000             |
| -0.936166            0.000000             0.000000             |
| 0.000000             0.000000             0.000000             |
+-------------------------------------------------------------------------------------------+

+-------------------------------------------------------------------------------------------+
| Content of src1 "leaf_17" (3 dim)
Layer 0
| 0.000000             0.000000             0.000000             |
| 0.000000             0.000000             0.000000             |
| 0.000000             0.000000             0.000000             |
+-------------------------------------------------------------------------------------------+

Layer 1
| 0.000000             0.000000             0.000000             |
| 0.000000             0.000000             0.000000             |
| 0.000000             0.000000             0.000000             |
+-------------------------------------------------------------------------------------------+

Layer 2
| 0.000000             0.000000             0.000000             |
| 0.000000             0.000000             0.000000             |
| 0.000000             0.000000             0.000000             |
+-------------------------------------------------------------------------------------------+

+-------------------------------------------------------------------------------------------+
| Content of dst "node_1233" (3 dim)
Layer 0
| -0.019758            -0.019758            -0.019758            |
| 0.772589             0.772589             0.772589             |
| -0.019758            -0.019758            -0.019758            |
+-------------------------------------------------------------------------------------------+

Layer 1
| 0.001423             0.001423             0.001423             |
| -1.063233            -1.063233            -1.063233            |
| 0.001423             0.001423             0.001423             |
+-------------------------------------------------------------------------------------------+

Layer 2
| -0.042461            -0.042461            -0.042461            |
| -0.936166            -0.936166            -0.936166            |
| -0.042461            -0.042461            -0.042461            |
+-------------------------------------------------------------------------------------------+

+======================+======================+======================+======================+

* typo stride&gt;n_elem - sample print is probably still bugged

* added strides and boolean info flags

---------

Co-authored-by: John &lt;nolife+git@gmail.com&gt;
diff --git a/ggml.c b/ggml.c
@@ -4195,36 +4195,6 @@ void ggml_scratch_load(struct ggml_context * ctx) {
 
 ////////////////////////////////////////////////////////////////////////////////
 
-size_t ggml_sizeof_tensor_data_impl(enum ggml_type type, int n_dims, const int64_t* ne) {
-    size_t size_needed = 0;
-    size_needed += GGML_TYPE_SIZE[type]*(ne[0]/GGML_BLCK_SIZE[type]);
-    for (int i = 1; i < n_dims; i++) {
-        size_needed *= ne[i];
-    }
-    // align to GGML_MEM_ALIGN
-    size_needed = ((size_needed + GGML_MEM_ALIGN - 1)/GGML_MEM_ALIGN)*GGML_MEM_ALIGN;
-    return size_needed;
-}
-
-size_t ggml_sizeof_tensor_1d(enum ggml_type type, int64_t ne0) {
-    return ggml_tensor_overhead() + ggml_sizeof_tensor_data_impl(type, 1, &ne0);
-}
-
-size_t ggml_sizeof_tensor_2d(enum ggml_type type, int64_t ne0, int64_t ne1) {
-    const int64_t ne[2] = {ne0, ne1};
-    return ggml_tensor_overhead() + ggml_sizeof_tensor_data_impl(type, 2, &ne);
-}
-
-size_t ggml_sizeof_tensor_3d(enum ggml_type type, int64_t ne0, int64_t ne1, int64_t ne2) {
-    const int64_t ne[3] = {ne0, ne1, ne2};
-    return ggml_tensor_overhead() + ggml_sizeof_tensor_data_impl(type, 3, &ne);
-}
-
-size_t ggml_sizeof_tensor_4d(enum ggml_type type, int64_t ne0, int64_t ne1, int64_t ne2, int64_t ne3) {
-    const int64_t ne[4] = {ne0, ne1, ne2, ne3};
-    return ggml_tensor_overhead() + ggml_sizeof_tensor_data_impl(type, 4, &ne);
-}
-
 struct ggml_tensor * ggml_new_tensor_impl(
         struct ggml_context * ctx,
         enum   ggml_type type,
@@ -9292,7 +9262,6 @@ static void ggml_compute_forward_repeat_back(
 }
 
 // ggml_compute_forward_repeat2
-
 static void ggml_compute_forward_repeat2_f32(
         const struct ggml_compute_params * params,
         const struct ggml_tensor * src0,
@@ -9354,6 +9323,7 @@ static void ggml_compute_forward_repeat2_f32(
             }
         }
     }
+    // ggml_tensor_printf(dst, __func__, __LINE__, true,true);
 }
 
 static void ggml_compute_forward_repeat2(
@@ -18297,6 +18267,173 @@ size_t ggml_quantize_chunk(enum ggml_type type, const float * src, void * dst, i
     return result;
 }
 
+
+////////////////////////////////////////////////////////////////////////////////
+
+void ggml_printTensorSample(char *prefix,const struct ggml_tensor * tensor) {
+    const char *sep = "+-------------------------------------------------------------------------------------------+\n";
+    printf("%s",  sep);
+    printf("| Content of %s \"%s\" (%d dim)",prefix,tensor->name,tensor->n_dims);
+    printf("\n");
+    const int max_elements = 4;
+    
+    if (tensor->n_dims == 1) {
+        printf("| ");
+        for(int i = 0; i < tensor->ne[0] && i < max_elements; i++){
+            printf("%-20f ", *(float *)((char *) tensor->data + i*tensor->nb[0])); 
+        }
+        printf("|");
+        printf("\n");
+        printf("%s",  sep);
+    }
+    else if (tensor->n_dims == 2) {
+        for(int i = 0; i < tensor->ne[0] && i < max_elements; i++){
+            printf("| ");
+            for(int j = 0; j < tensor->ne[1] && j < max_elements; j++){
+                printf("%-20f ", *(float *)((char *) tensor->data + i*tensor->nb[0] + j*tensor->nb[1]));
+            }
+            printf("|");
+            printf("\n");
+        }
+        printf("%s",  sep);
+    }
+    else if(tensor->n_dims == 3) {
+        for(int i = 0; i < tensor->ne[0] && i < 3; i++){
+            printf("Layer %d\n", i);
+            for(int j = 0; j < tensor->ne[1] && j < max_elements; j++){
+                printf("| ");
+                for(int k = 0; k < tensor->ne[2] && k < max_elements; k++){
+                    printf("%-20f ", *(float *)((char *) tensor->data + i*tensor->nb[0] + j*tensor->nb[1] + k*tensor->nb[2]));
+                }
+                printf("|\n");
+            }
+            printf("%s\n",  sep);
+        }
+    }
+    else if(tensor->n_dims == 4){
+        for(int i = 0; i < tensor->ne[0] && i < 3; i++){
+            printf("Batch %d\n", i);
+            for(int j = 0; j < tensor->ne[1] && j < 3; j++){
+                printf("Layer %d\n", j);
+                for(int k = 0; k < tensor->ne[2] && k < max_elements; k++){
+                    printf("| ");
+                    for(int l = 0; l < tensor->ne[3] && l < 3; l++){
+                        printf("%-20f ", *(float *)((char *) tensor->data + i*tensor->nb[0] + j*tensor->nb[1] + k*tensor->nb[2] + l*tensor->nb[3]));
+                    }
+                    printf("|\n");
+                }
+                printf("%s\n",  sep);
+            }
+        }
+    }
+}
+
+void ggml_tensor_printf(const struct ggml_tensor *tensor, char *prefix, int line,  bool extended, bool print_sample) {
+    char tmp_str[256] = {0};
+    const char *sep = "+----------------------+----------------------+----------------------+----------------------+";
+    const char *sep_border = "+======================+======================+======================+======================+";
+    printf("%s\n",  sep_border);
+    printf("| %s:%d\n", prefix,line);
+    printf("| %-32s [%s type]\n",  tensor->name, GGML_TYPE_NAME[tensor->type]);
+    printf("%s\n",  sep);
+    char strides[256] = {0};
+    /**
+        // nb[0] = sizeof(type)
+        // nb[1] = nb[0]   * ne[0] + padding
+        // nb[i] = nb[i-1] * ne[i-1]
+    */
+    {
+        int pos = 0;
+        for (int i = 0; i < tensor->n_dims; i++) {
+            pos += snprintf(strides + pos, sizeof(strides) - pos, "%" PRId64, tensor->nb[i]);
+            if (i != tensor->n_dims - 1) {
+                pos += snprintf(strides + pos, sizeof(strides) - pos, "x");
+            }
+        }
+    }
+
+
+    printf("| %-20s | %-20s | %-20s | %-20s |\n",  "Dimensions", "Strides", "Layer id", "Backend");
+    printf("| %-20d | %-20s | %-20d | %-20s |\n",  tensor->n_dims, strides, tensor->meta.layer_id >= 0 ? tensor->meta.layer_id : -1, tensor->backend == GGML_BACKEND_CPU ? "CPU" : ((tensor->backend == GGML_BACKEND_GPU) ? "GPU" : "GPU_SPLIT"));
+    printf("%s\n",  sep);
+    int pos = 0;
+    for (int i = 0; i < tensor->n_dims; i++) {
+        pos += snprintf(tmp_str + pos, sizeof(tmp_str) - pos, "%" PRId64, tensor->ne[i]);
+        if (i != tensor->n_dims - 1) {
+            pos += snprintf(tmp_str + pos, sizeof(tmp_str) - pos, " x ");
+        }
+    }
+    printf("| %-20s | %-20s | %-20s | %-20s |\n",  "Elements", "Src0", "Src1","Operation");
+    printf("| %-20s |",  tmp_str);
+        
+
+    if (tensor->src0) {
+        char tmp_str[256] = {0};
+        int pos = 0;
+        for (int i = 0; i < tensor->src0->n_dims; i++) {
+            pos += snprintf(tmp_str + pos, sizeof(tmp_str) - pos, "%" PRId64, tensor->src0->ne[i]);
+            if (i != tensor->src0->n_dims - 1) {
+                pos += snprintf(tmp_str + pos, sizeof(tmp_str) - pos, " x ");
+            }
+        }
+        printf(" %-20s |", tmp_str);
+        } else 
+        {
+            printf(" %-20s |", "N/A");
+    }
+    if (tensor->src1) {
+        int pos = 0;
+        for (int i = 0; i < tensor->src1->n_dims; i++) {
+            pos += snprintf(tmp_str + pos, sizeof(tmp_str) - pos, "%" PRId64, tensor->src1->ne[i]);
+            if (i != tensor->src1->n_dims - 1) {
+                pos += snprintf(tmp_str + pos, sizeof(tmp_str) - pos, " x ");
+            }
+        }
+        printf(" %-20s |", tmp_str);
+    } else {
+        printf(" %-20s |", "N/A");
+    }
+    printf(" %-20s |", tensor->op > 0?GGML_OP_NAME[tensor->op] : "N/A");
+    printf("\n");
+    printf("%s\n",  sep);
+
+   if (extended)
+   {
+        bool is_transposed = ggml_is_transposed(tensor);
+        bool is_permuted = ggml_is_permuted(tensor);
+        bool is_cont = ggml_is_contiguous(tensor);
+        printf("| %-17s%s | %-17s%s | %-17s%s | %-6s%11.2f MB |\n", "Transposed:", is_transposed ? "Yes" : "No ", "Permuted:", is_permuted ? "Yes" : "No ", "Contiguous:", is_cont ? "Yes" : "No ","Size:", ggml_nbytes(tensor)/(1024.0*1024.0));
+   }
+
+
+   if (extended) {
+        if (tensor->src0 && strlen(tensor->src0->name)) {
+            printf("| %-20s | ", "Src0 name:");
+            printf("%-66s |\n", tensor->src0->name);
+        }
+        if (tensor->src1 && strlen(tensor->src1->name)) {
+            printf("| %-20s | ", "Src1 name:");
+            printf("%-66s |\n", tensor->src1->name);
+        }
+        printf("%s\n\n",  sep);
+    }
+
+
+    if (print_sample) {
+        if (extended)
+        {
+            if (tensor->src0 && tensor->src0->ne[0]) {
+                ggml_printTensorSample("src0",tensor->src0);
+            }
+            if (tensor->src1 && tensor->src1->ne[0]) {
+                ggml_printTensorSample("src1",tensor->src1);
+            }
+        }
+        ggml_printTensorSample("dst",tensor);
+    }
+    printf("%s\n",  sep_border);
+}
+
 ////////////////////////////////////////////////////////////////////////////////
 
 int ggml_cpu_has_avx(void) {
diff --git a/ggml.h b/ggml.h
@@ -1138,6 +1138,9 @@ extern "C" {
 
     // dump the graph into a file using the dot format
     GGML_API void ggml_graph_dump_dot(const struct ggml_cgraph * gb, const struct ggml_cgraph * gf, const char * filename);
+    
+    // visualize the tensor - extended adds more information - when printing sample content extended will also print src0 and src1 content
+    void ggml_tensor_printf(const struct ggml_tensor *tensor, char *prefix, int line,  bool extended, bool print_sample);
 
     //
     // optimization