C-Kernel-Engine/doxygen/ckernel__model__load_8c_source.html

 #include "ckernel_model.h"


 #include <errno.h>

 #include <stdio.h>

 #include <stdlib.h>

 #include <string.h>


 static int read_floats(FILE *f, float *dst, size_t count)

 {

     size_t n = fread(dst, sizeof(float), count, f);

     if (n != count) {

         if (ferror(f)) {

             fprintf(stderr, "ck_model_load_weights_flat: fread error: %s\n",

                     strerror(errno));

         } else {

             fprintf(stderr, "ck_model_load_weights_flat: unexpected EOF (wanted %zu floats, got %zu)\n",

                     count, n);

         }

         return -1;

     }

     return 0;

 }


 int ck_model_load_weights_flat(TransformerModel *m, const char *path)

 {

     if (!m || !m->memory_base || !path) {

         fprintf(stderr, "ck_model_load_weights_flat: invalid arguments\n");

         return -1;

     }


     FILE *f = fopen(path, "rb");

     if (!f) {

         fprintf(stderr, "ck_model_load_weights_flat: failed to open %s: %s\n",

                 path, strerror(errno));

         return -1;

     }

     char magic[8];

     if (fread(magic, 1, 8, f) == 8) {

         if (memcmp(magic, "BUMPWGT2", 8) == 0) {

             if (fseek(f, 128, SEEK_SET) != 0) {

                 fclose(f);

                 return -1;

             }

         } else if (memcmp(magic, "BUMPWGT3", 8) == 0) {

             if (fseek(f, 128, SEEK_SET) != 0) {

                 fclose(f);

                 return -1;

             }

             uint32_t dtype_len = 0;

             if (fread(&dtype_len, sizeof(uint32_t), 1, f) != 1) {

                 fclose(f);

                 return -1;

             }

             if (fseek(f, (long)dtype_len, SEEK_CUR) != 0) {

                 fclose(f);

                 return -1;

             }

         } else if (fseek(f, 0, SEEK_SET) != 0) {

             fclose(f);

             return -1;

         }

     } else if (fseek(f, 0, SEEK_SET) != 0) {

         fclose(f);

         return -1;

     }


     const int L   = m->cfg.num_layers;

     const int H   = m->cfg.hidden_size;

     const int Hff = m->cfg.intermediate_size;

     const int V   = m->cfg.vocab_size;

     const int T   = m->cfg.context_window;


     if (L <= 0 || H <= 0 || Hff <= 0 || V <= 0 || T <= 0) {

         fprintf(stderr, "ck_model_load_weights_flat: invalid model cfg (L=%d, H=%d, Hff=%d, V=%d, T=%d)\n",

                 L, H, Hff, V, T);

         fclose(f);

         return -1;

     }


     uint8_t *base = m->memory_base;


     /* 1) Token embeddings [V × H] */

     if (read_floats(f, (float *)(base + m->token_emb_offset),

                     (size_t)V * (size_t)H) != 0) {

         fclose(f);

         return -1;

     }


     /* 2) Positional embeddings [T × H] */

     if (read_floats(f, (float *)(base + m->pos_emb_offset),

                     (size_t)T * (size_t)H) != 0) {

         fclose(f);

         return -1;

     }


     /* 3) Per-layer weights */

     for (int layer = 0; layer < L; ++layer) {

         CKLayerLayout *Lyt = &m->layers[layer];


         /* LN1 gamma [H] */

         if (read_floats(f, (float *)(base + Lyt->ln1_weight_offset), (size_t)H) != 0) {

             fclose(f);

             return -1;

         }


         /* LN1 beta [H] */

         if (read_floats(f, (float *)(base + Lyt->ln1_bias_offset), (size_t)H) != 0) {

             fclose(f);

             return -1;

         }


         /* QKV weight [H × 3H] */

         if (read_floats(f, (float *)(base + Lyt->qkv_weight_offset),

                         (size_t)H * (size_t)(3 * H)) != 0) {

             fclose(f);

             return -1;

         }


         /* QKV bias [3H] */

         if (read_floats(f, (float *)(base + Lyt->qkv_bias_offset), (size_t)(3 * H)) != 0) {

             fclose(f);

             return -1;

         }


         /* Attention proj weight [H × H] */

         if (read_floats(f, (float *)(base + Lyt->attn_proj_weight_offset),

                         (size_t)H * (size_t)H) != 0) {

             fclose(f);

             return -1;

         }


         /* Attention proj bias [H] */

         if (read_floats(f, (float *)(base + Lyt->attn_proj_bias_offset), (size_t)H) != 0) {

             fclose(f);

             return -1;

         }


         /* FC1 weight [H × Hff] */

         if (read_floats(f, (float *)(base + Lyt->fc1_weight_offset),

                         (size_t)H * (size_t)Hff) != 0) {

             fclose(f);

             return -1;

         }


         /* FC1 bias [Hff] */

         if (read_floats(f, (float *)(base + Lyt->fc1_bias_offset), (size_t)Hff) != 0) {

             fclose(f);

             return -1;

         }


         /* FC2 weight [Hff × H] */

         if (read_floats(f, (float *)(base + Lyt->fc2_weight_offset),

                         (size_t)Hff * (size_t)H) != 0) {

             fclose(f);

             return -1;

         }


         /* FC2 bias [H] */

         if (read_floats(f, (float *)(base + Lyt->fc2_bias_offset), (size_t)H) != 0) {

             fclose(f);

             return -1;

         }

     }


     /* 4) Final LN gamma [H] */

     if (read_floats(f, (float *)(base + m->final_ln_weight_offset), (size_t)H) != 0) {

         fclose(f);

         return -1;

     }


     /* 5) Final LN beta [H] */

     if (read_floats(f, (float *)(base + m->final_ln_bias_offset), (size_t)H) != 0) {

         fclose(f);

         return -1;

     }


     /* 6) LM head weight [V × H] */

     if (read_floats(f, (float *)(base + m->lm_head_weight_offset),

                     (size_t)V * (size_t)H) != 0) {

         fclose(f);

         return -1;

     }


     fclose(f);

     return 0;

 }

ckernel_model.h

ck_model_load_weights_flat
int ck_model_load_weights_flat(TransformerModel *m, const char *path)
Definition: ckernel_model_load.c:24

read_floats
static int read_floats(FILE *f, float *dst, size_t count)
Definition: ckernel_model_load.c:8

CKLayerLayout
Definition: ckernel_model.h:20

CKLayerLayout::qkv_bias_offset
size_t qkv_bias_offset
Definition: ckernel_model.h:26

CKLayerLayout::fc2_weight_offset
size_t fc2_weight_offset
Definition: ckernel_model.h:34

CKLayerLayout::fc1_bias_offset
size_t fc1_bias_offset
Definition: ckernel_model.h:32

CKLayerLayout::fc1_weight_offset
size_t fc1_weight_offset
Definition: ckernel_model.h:31

CKLayerLayout::ln1_weight_offset
size_t ln1_weight_offset
Definition: ckernel_model.h:22

CKLayerLayout::qkv_weight_offset
size_t qkv_weight_offset
Definition: ckernel_model.h:25

CKLayerLayout::attn_proj_bias_offset
size_t attn_proj_bias_offset
Definition: ckernel_model.h:29

CKLayerLayout::ln1_bias_offset
size_t ln1_bias_offset
Definition: ckernel_model.h:23

CKLayerLayout::fc2_bias_offset
size_t fc2_bias_offset
Definition: ckernel_model.h:35

CKLayerLayout::attn_proj_weight_offset
size_t attn_proj_weight_offset
Definition: ckernel_model.h:28

CKModelConfig::num_layers
int num_layers
Definition: ck_model_api.h:38

CKModelConfig::context_window
int context_window
Definition: ckernel_ir.h:30

CKModelConfig::intermediate_size
int intermediate_size
Definition: ck_model_api.h:37

CKModelConfig::vocab_size
int vocab_size
Definition: ck_model_api.h:39

CKModelConfig::hidden_size
int hidden_size
Definition: ckernel_ir.h:25

TransformerModel
Definition: ckernel_model.h:38

TransformerModel::lm_head_weight_offset
size_t lm_head_weight_offset
Definition: ckernel_model.h:57

TransformerModel::final_ln_weight_offset
size_t final_ln_weight_offset
Definition: ckernel_model.h:53

TransformerModel::final_ln_bias_offset
size_t final_ln_bias_offset
Definition: ckernel_model.h:54

TransformerModel::token_emb_offset
size_t token_emb_offset
Definition: ckernel_model.h:48

TransformerModel::pos_emb_offset
size_t pos_emb_offset
Definition: ckernel_model.h:49

TransformerModel::memory_base
uint8_t * memory_base
Definition: ckernel_model.h:42

TransformerModel::layers
CKLayerLayout * layers
Definition: ckernel_model.h:61

TransformerModel::cfg
CKModelConfig cfg
Definition: ckernel_model.h:39