llama : print size and type of overridden tensors (#13364)

slaren · web-flow · commit f06102120699 · 2025-05-08T13:15:15.000+02:00
diff --git a/src/llama-model.cpp b/src/llama-model.cpp
@@ -1651,8 +1651,11 @@ bool llama_model::load_tensors(llama_model_loader & ml) {
                 for (const auto * overrides = ml.tensor_buft_overrides; overrides->pattern != nullptr; ++overrides) {
                     std::regex pattern(overrides->pattern);
                     if (std::regex_search(tensor_name, pattern)) {
-                        LLAMA_LOG_DEBUG("tensor %s buffer type overriden to %s\n", tensor_name.c_str(), ggml_backend_buft_name(overrides->buft));
                         buft = overrides->buft;
+                        LLAMA_LOG_DEBUG("tensor %s (%zu MiB %s) buffer type overridden to %s\n",
+                                tensor_name.c_str(),
+                                ggml_nbytes(t_meta) / 1024 / 1024, ggml_type_name(t_meta->type),
+                                ggml_backend_buft_name(buft));
                         break;
                     }
                 }

Original file line number	Diff line number	Diff line change
`@@ -1651,8 +1651,11 @@ bool llama_model::load_tensors(llama_model_loader & ml) {`
`1651`	`1651`	`for (const auto * overrides = ml.tensor_buft_overrides; overrides->pattern != nullptr; ++overrides) {`
`1652`	`1652`	`std::regex pattern(overrides->pattern);`
`1653`	`1653`	`if (std::regex_search(tensor_name, pattern)) {`
`1654`		`- LLAMA_LOG_DEBUG("tensor %s buffer type overriden to %s\n", tensor_name.c_str(), ggml_backend_buft_name(overrides->buft));`
`1655`	`1654`	`buft = overrides->buft;`
	`1655`	`+ LLAMA_LOG_DEBUG("tensor %s (%zu MiB %s) buffer type overridden to %s\n",`
	`1656`	`+ tensor_name.c_str(),`
	`1657`	`+ ggml_nbytes(t_meta) / 1024 / 1024, ggml_type_name(t_meta->type),`
	`1658`	`+ ggml_backend_buft_name(buft));`
`1656`	`1659`	`break;`
`1657`	`1660`	`}`
`1658`	`1661`	`}`