C-Kernel-Engine/doxygen/ckernel__model__layout_8c_source.html

 #include "ckernel_model.h"


 #include <stdlib.h>

 #include <string.h>


 #define CACHELINE_BYTES 64


 static size_t align_up_bytes(size_t n, size_t align)

 {

     if (align == 0) return n;

     return (n + align - 1) & ~(align - 1);

 }


 static size_t bump_bytes(size_t *off, size_t bytes, size_t align)

 {

     size_t start = align_up_bytes(*off, align);

     *off = start + bytes;

     return start;

 }


 void layout_transformer_from_ir(TransformerModel *m, const CKIRGraph *ir)

 {

     if (!m) {

         return;

     }


     if (ir) {

         /* If IR is provided, copy its config. Otherwise, trust m->cfg. */

         m->cfg = ir->config;

     }


     const int L   = m->cfg.num_layers;

     const int H   = m->cfg.hidden_size;

     const int Hff = m->cfg.intermediate_size;

     const int V   = m->cfg.vocab_size > 0 ? m->cfg.vocab_size : 1;

     const int T   = m->cfg.context_window > 0 ? m->cfg.context_window : 1;


     /* Allocate per-layer layout array. */

     if (m->layers) {

         /* caller responsible for freeing if re-layout is needed */

     } else if (L > 0) {

         m->layers = (CKLayerLayout *)calloc((size_t)L, sizeof(CKLayerLayout));

     }


     size_t elem_bytes = m->elem_bytes ? m->elem_bytes : sizeof(float);

     m->elem_bytes = elem_bytes;


     size_t offset = 0;


     /* Token embeddings: [V × H] */

     m->token_emb_offset = bump_bytes(&offset,

                                      (size_t)V * (size_t)H * elem_bytes,

                                      CACHELINE_BYTES);


     /* Positional embeddings: [T × H] */

     m->pos_emb_offset = bump_bytes(&offset,

                                    (size_t)T * (size_t)H * elem_bytes,

                                    CACHELINE_BYTES);


     /* Embedded input buffer: [T × H] */

     m->embedded_input_offset = bump_bytes(&offset,

                                           (size_t)T * (size_t)H * elem_bytes,

                                           CACHELINE_BYTES);


     m->layers_start_offset = offset;


     /* Per-layer weights. This is a simple, linear layout:

      *  - LN1 gamma/beta           [H]

      *  - QKV weight/bias          [H × 3H], [3H]

      *  - Attention proj weight/bias [H × H], [H]

      *  - FC1 weight/bias          [H × Hff], [Hff]

      *  - FC2 weight/bias          [Hff × H], [H]

      *

      * Activations are not yet explicitly laid out here; this pass focuses

      * on weights. A later planner can layer activations and gradients on top.

      */

     for (int layer = 0; layer < L; ++layer) {

         CKLayerLayout *Lyt = &m->layers[layer];


         /* LN1 weights/bias */

         Lyt->ln1_weight_offset = bump_bytes(&offset,

                                             (size_t)H * elem_bytes,

                                             CACHELINE_BYTES);


         Lyt->ln1_bias_offset = bump_bytes(&offset,

                                           (size_t)H * elem_bytes,

                                           CACHELINE_BYTES);


         /* QKV weight: [H × 3H] */

         Lyt->qkv_weight_offset = bump_bytes(&offset,

                                             (size_t)H * (size_t)(3 * H) * elem_bytes,

                                             CACHELINE_BYTES);


         /* QKV bias: [3H] */

         Lyt->qkv_bias_offset = bump_bytes(&offset,

                                           (size_t)(3 * H) * elem_bytes,

                                           CACHELINE_BYTES);


         /* Attention output projection: [H × H] + [H] */

         Lyt->attn_proj_weight_offset = bump_bytes(&offset,

                                                   (size_t)H * (size_t)H * elem_bytes,

                                                   CACHELINE_BYTES);


         Lyt->attn_proj_bias_offset = bump_bytes(&offset,

                                                 (size_t)H * elem_bytes,

                                                 CACHELINE_BYTES);


         /* FC1: [H × Hff] + [Hff] */

         Lyt->fc1_weight_offset = bump_bytes(&offset,

                                             (size_t)H * (size_t)Hff * elem_bytes,

                                             CACHELINE_BYTES);


         Lyt->fc1_bias_offset = bump_bytes(&offset,

                                           (size_t)Hff * elem_bytes,

                                           CACHELINE_BYTES);


         /* FC2: [Hff × H] + [H] */

         Lyt->fc2_weight_offset = bump_bytes(&offset,

                                             (size_t)Hff * (size_t)H * elem_bytes,

                                             CACHELINE_BYTES);


         Lyt->fc2_bias_offset = bump_bytes(&offset,

                                           (size_t)H * elem_bytes,

                                           CACHELINE_BYTES);

     }


     /* Final LayerNorm: gamma/beta [H], mean/rstd [T] if needed. */

     m->final_ln_weight_offset = bump_bytes(&offset,

                                            (size_t)H * elem_bytes,

                                            CACHELINE_BYTES);


     m->final_ln_bias_offset = bump_bytes(&offset,

                                          (size_t)H * elem_bytes,

                                          CACHELINE_BYTES);


     /* Final normalized output: [T × H] */

     m->final_output_offset = bump_bytes(&offset,

                                         (size_t)T * (size_t)H * elem_bytes,

                                         CACHELINE_BYTES);


     /* LM head weight: [V × H] (often tied to token_emb_offset in logic) */

     m->lm_head_weight_offset = bump_bytes(&offset,

                                           (size_t)V * (size_t)H * elem_bytes,

                                           CACHELINE_BYTES);


     /* Logits buffer: [T × V] */

     m->logits_offset = bump_bytes(&offset,

                                   (size_t)T * (size_t)V * elem_bytes,

                                   CACHELINE_BYTES);


     m->total_bytes = align_up_bytes(offset, CACHELINE_BYTES);

     m->total_floats = m->total_bytes / elem_bytes;

 }

ckernel_model.h

layout_transformer_from_ir
void layout_transformer_from_ir(TransformerModel *m, const CKIRGraph *ir)
Definition: ckernel_model_layout.c:21

align_up_bytes
static size_t align_up_bytes(size_t n, size_t align)
Definition: ckernel_model_layout.c:8

bump_bytes
static size_t bump_bytes(size_t *off, size_t bytes, size_t align)
Definition: ckernel_model_layout.c:14

CACHELINE_BYTES
#define CACHELINE_BYTES
Definition: ckernel_model_layout.c:6

CKIRGraph
Definition: ckernel_ir.h:72

CKIRGraph::config
CKModelConfig config
Definition: ckernel_ir.h:73

CKLayerLayout
Definition: ckernel_model.h:20

CKLayerLayout::qkv_bias_offset
size_t qkv_bias_offset
Definition: ckernel_model.h:26

CKLayerLayout::fc2_weight_offset
size_t fc2_weight_offset
Definition: ckernel_model.h:34

CKLayerLayout::fc1_bias_offset
size_t fc1_bias_offset
Definition: ckernel_model.h:32

CKLayerLayout::fc1_weight_offset
size_t fc1_weight_offset
Definition: ckernel_model.h:31

CKLayerLayout::ln1_weight_offset
size_t ln1_weight_offset
Definition: ckernel_model.h:22

CKLayerLayout::qkv_weight_offset
size_t qkv_weight_offset
Definition: ckernel_model.h:25

CKLayerLayout::attn_proj_bias_offset
size_t attn_proj_bias_offset
Definition: ckernel_model.h:29

CKLayerLayout::ln1_bias_offset
size_t ln1_bias_offset
Definition: ckernel_model.h:23

CKLayerLayout::fc2_bias_offset
size_t fc2_bias_offset
Definition: ckernel_model.h:35

CKLayerLayout::attn_proj_weight_offset
size_t attn_proj_weight_offset
Definition: ckernel_model.h:28

CKModelConfig::num_layers
int num_layers
Definition: ck_model_api.h:38

CKModelConfig::context_window
int context_window
Definition: ckernel_ir.h:30

CKModelConfig::intermediate_size
int intermediate_size
Definition: ck_model_api.h:37

CKModelConfig::vocab_size
int vocab_size
Definition: ck_model_api.h:39

CKModelConfig::hidden_size
int hidden_size
Definition: ckernel_ir.h:25

TransformerModel
Definition: ckernel_model.h:38

TransformerModel::lm_head_weight_offset
size_t lm_head_weight_offset
Definition: ckernel_model.h:57

TransformerModel::final_ln_weight_offset
size_t final_ln_weight_offset
Definition: ckernel_model.h:53

TransformerModel::elem_bytes
size_t elem_bytes
Definition: ckernel_model.h:45

TransformerModel::embedded_input_offset
size_t embedded_input_offset
Definition: ckernel_model.h:50

TransformerModel::final_ln_bias_offset
size_t final_ln_bias_offset
Definition: ckernel_model.h:54

TransformerModel::token_emb_offset
size_t token_emb_offset
Definition: ckernel_model.h:48

TransformerModel::pos_emb_offset
size_t pos_emb_offset
Definition: ckernel_model.h:49

TransformerModel::layers_start_offset
size_t layers_start_offset
Definition: ckernel_model.h:51

TransformerModel::total_bytes
size_t total_bytes
Definition: ckernel_model.h:43

TransformerModel::total_floats
size_t total_floats
Definition: ckernel_model.h:44

TransformerModel::final_output_offset
size_t final_output_offset
Definition: ckernel_model.h:55

TransformerModel::layers
CKLayerLayout * layers
Definition: ckernel_model.h:61

TransformerModel::logits_offset
size_t logits_offset
Definition: ckernel_model.h:58

TransformerModel::cfg
CKModelConfig cfg
Definition: ckernel_model.h:39

start
uint32_t start
Definition: utf8.c:214