@@ -16131,6 +16131,8 @@ struct llama_data_file_context : llama_data_context {
16131
16131
*
16132
16132
*/
16133
16133
static void llama_state_get_data_internal(struct llama_context * ctx, llama_data_context * data_ctx) {
16134
+ llama_synchronize(ctx);
16135
+
16134
16136
// copy rng
16135
16137
{
16136
16138
std::ostringstream rng_ss;
@@ -16283,6 +16285,8 @@ size_t llama_state_get_data(struct llama_context * ctx, uint8_t * dst) {
16283
16285
16284
16286
// Sets the state reading from the specified source address
16285
16287
size_t llama_state_set_data(struct llama_context * ctx, const uint8_t * src) {
16288
+ llama_synchronize(ctx);
16289
+
16286
16290
const uint8_t * inp = src;
16287
16291
16288
16292
// set rng
@@ -16587,6 +16591,8 @@ size_t llama_state_seq_get_size(struct llama_context* ctx, llama_seq_id seq_id)
16587
16591
}
16588
16592
16589
16593
static size_t llama_state_seq_get_data_internal(struct llama_context * ctx, llama_data_context & data_ctx, llama_seq_id seq_id) {
16594
+ llama_synchronize(ctx);
16595
+
16590
16596
const auto & kv_self = ctx->kv_self;
16591
16597
GGML_ASSERT(!kv_self.recurrent); // not implemented
16592
16598
@@ -16704,6 +16710,8 @@ size_t llama_state_seq_get_data(struct llama_context* ctx, uint8_t* dst, llama_s
16704
16710
}
16705
16711
16706
16712
size_t llama_state_seq_set_data(struct llama_context * ctx, const uint8_t * src, llama_seq_id dest_seq_id) {
16713
+ llama_synchronize(ctx);
16714
+
16707
16715
auto & kv_self = ctx->kv_self;
16708
16716
GGML_ASSERT(!kv_self.recurrent); // not implemented
16709
16717
0 commit comments