backup

blueloveTH · blueloveTH · commit a1e07334602e · 2025-03-02T22:57:13.000+08:00
diff --git a/.vscode/launch.json b/.vscode/launch.json
@@ -0,0 +1,16 @@
+{
+    // Use IntelliSense to learn about possible attributes.
+    // Hover to view descriptions of existing attributes.
+    // For more information, visit: https://go.microsoft.com/fwlink/?linkid=830387
+    "version": "0.2.0",
+    "configurations": [
+        {
+            "type": "lldb",
+            "request": "launch",
+            "name": "Debug",
+            "program": "${workspaceFolder}/main",
+            "args": [],
+            "cwd": "${workspaceFolder}"
+        }
+    ]
+}
diff --git a/include/cten.h b/include/cten.h
@@ -3,6 +3,7 @@
 #include <assert.h>
 #include <stdbool.h>
 #include <stddef.h>
+#include <stdint.h>
 
 typedef int TensorShape[4];
 typedef struct GradNode GradNode;
@@ -71,7 +72,7 @@ Tensor Tensor_mean(Tensor self);
 Tensor Tensor_max(Tensor self);
 Tensor Tensor_min(Tensor self);
 
-int* Tensor_argmax(Tensor self, int dim);
+void Tensor_argmax(Tensor self, int* out);
 
 /* Neural Networks */
 Tensor nn_log(Tensor self);
@@ -90,7 +91,7 @@ Tensor nn_softmax(Tensor input);
 Tensor nn_crossentropy(Tensor y_true, Tensor y_pred);
 
 /* Memory Management */
-typedef int PoolId;
+typedef int64_t PoolId;
 
 void cten_begin_malloc(PoolId id);
 void cten_end_malloc();
diff --git a/src/basic.c b/src/basic.c
@@ -39,7 +39,7 @@ Tensor Tensor_new(TensorShape shape, bool requires_grad) {
     int numel = TensorShape_numel(shape);
     self.data = _cten_malloc(sizeof(FloatBuffer) + sizeof(float) * numel);
     self.data->numel = numel;
-    if(requires_grad && !cten_is_eval()) {
+    if(requires_grad) {
         self.node = _cten_malloc(sizeof(GradNode));
         memset(self.node, 0, sizeof(GradNode));
     } else {
@@ -63,19 +63,19 @@ Tensor Tensor_ones(TensorShape shape, bool requires_grad) {
 }
 
 float Tensor_get(Tensor self, int i, int j, int k, int l) {
-    assert(i >= 0 && i < self.shape[0]);
-    assert(j >= 0 && j < self.shape[1]);
-    assert(k >= 0 && k < self.shape[2]);
-    assert(l >= 0 && l < self.shape[3]);
+    assert((self.shape[0] == 0 && i == 0) || (i >= 0 && i < self.shape[0]));
+    assert((self.shape[1] == 0 && j == 0) || (j >= 0 && j < self.shape[1]));
+    assert((self.shape[2] == 0 && k == 0) || (k >= 0 && k < self.shape[2]));
+    assert((self.shape[3] == 0 && l == 0) || (l >= 0 && l < self.shape[3]));
     return self.data->flex[i * self.shape[1] * self.shape[2] * self.shape[3] +
                            j * self.shape[2] * self.shape[3] + k * self.shape[3] + l];
 }
 
 void Tensor_set(Tensor self, int i, int j, int k, int l, float value) {
-    assert(i >= 0 && i < self.shape[0]);
-    assert(j >= 0 && j < self.shape[1]);
-    assert(k >= 0 && k < self.shape[2]);
-    assert(l >= 0 && l < self.shape[3]);
+    assert((self.shape[0] == 0 && i == 0) || (i >= 0 && i < self.shape[0]));
+    assert((self.shape[1] == 0 && j == 0) || (j >= 0 && j < self.shape[1]));
+    assert((self.shape[2] == 0 && k == 0) || (k >= 0 && k < self.shape[2]));
+    assert((self.shape[3] == 0 && l == 0) || (l >= 0 && l < self.shape[3]));
     self.data->flex[i * self.shape[1] * self.shape[2] * self.shape[3] +
                     j * self.shape[2] * self.shape[3] + k * self.shape[3] + l] = value;
 }
@@ -146,14 +146,7 @@ void Tensor_print(Tensor self) {
 void _cten_zero_grad(Tensor* params, int n_params) {
     for(int i = 0; i < n_params; i++) {
         Tensor t = params[i];
-        if(t.node != NULL) {
-            if(t.node->grad.data != NULL) {
-                for(int j = 0; j < t.node->grad.data->numel; j++) {
-                    t.node->grad.data->flex[j] = 0;
-                }
-            } else {
-                t.node->grad = Tensor_zeros(t.shape, false);
-            }
-        }
+        if(t.node == NULL) continue;
+        t.node->grad = Tensor_zeros(t.shape, false);
     }
 }
diff --git a/src/operator.c b/src/operator.c
@@ -21,12 +21,12 @@ Tensor Tensor_add(Tensor self, Tensor other) {
     if(!cten_elemwise_broadcast(&self, &other)) {
         cten_assert_shape("Tensor_add() cannot broadcast", self.shape, other.shape);
     }
-    bool require_grad = self.node != NULL || other.node != NULL;
-    Tensor res = Tensor_new(self.shape, require_grad);
+    bool requires_grad = !cten_is_eval() && (self.node != NULL || other.node != NULL);
+    Tensor res = Tensor_new(self.shape, requires_grad);
     for(int i = 0; i < self.data->numel; i++) {
         res.data->flex[i] = self.data->flex[i] + other.data->flex[i];
     }
-    if(require_grad) {
+    if(requires_grad) {
         res.node->grad_fn = GradFn_add;
         res.node->inputs[0] = self;
         res.node->inputs[1] = other;
@@ -36,12 +36,12 @@ Tensor Tensor_add(Tensor self, Tensor other) {
 }
 
 Tensor Tensor_mul(Tensor self, Tensor other) {
-    bool require_grad = self.node != NULL || other.node != NULL;
-    Tensor res = Tensor_new(self.shape, require_grad);
+    bool requires_grad = !cten_is_eval() && (self.node != NULL || other.node != NULL);
+    Tensor res = Tensor_new(self.shape, requires_grad);
     for(int i = 0; i < self.data->numel; i++) {
         res.data->flex[i] = self.data->flex[i] * other.data->flex[i];
     }
-    if(require_grad) {
+    if(requires_grad) {
         res.node->grad_fn = GradFn_mul;
         res.node->inputs[0] = self;
         res.node->inputs[1] = other;
@@ -59,18 +59,22 @@ Tensor Tensor_mulf(Tensor self, float other) {
     return res;
 }
 
-int* Tensor_argmax(Tensor self, int dim) {
-    dim = TensorShape_asdim(self.shape, dim);
-    int* res = (int*)malloc(sizeof(int) * self.shape[dim]);
-    for(int i = 0; i < self.shape[dim]; i++) {
-        res[i] = 0;
-        for(int j = 0; j < self.shape[dim]; j++) {
-            float _0 = self.data->flex[res[i] * self.shape[dim] + i];
-            float _1 = self.data->flex[j * self.shape[dim] + i];
-            if(_0 < _1) res[i] = j;
+void Tensor_argmax(Tensor self, int* out) {
+    // reduce last dim
+    int last_dim = self.shape[TensorShape_dim(self.shape) - 1];
+    int n = TensorShape_numel(self.shape) / last_dim;
+    for(int i = 0; i < n; i++) {
+        float* p = self.data->flex + i * last_dim;
+        float max_val = p[0];
+        int max_idx = 0;
+        for(int j = 1; j < last_dim; j++) {
+            if(p[j] > max_val) {
+                max_val = p[j];
+                max_idx = j;
+            }
         }
+        out[i] = max_idx;
     }
-    return res;
 }
 
 static Tensor GradFn_mean(Tensor self, int i) {
diff --git a/src/optimizer/sgd.c b/src/optimizer/sgd.c
@@ -30,10 +30,10 @@ void optim_sgd_config(optim_sgd* self, float lr, float momentum) {
 void optim_sgd_zerograd(optim_sgd* self) { _cten_zero_grad(self->params, self->n_params); }
 
 void optim_sgd_step(optim_sgd* self) {
+    assert(self->momentum == 0);
     for(int i = 0; i < self->n_params; i++) {
         Tensor t = self->params[i];
-        assert(self->momentum == 0);
-        assert(t.node != NULL);
+        if(t.node == NULL) continue;
         assert(t.node->grad.data != NULL);
         // step
         for(int j = 0; j < t.data->numel; j++) {
diff --git a/src/utils.c b/src/utils.c
@@ -13,7 +13,7 @@ void cten_assert(bool cond, const char* fmt, ...) {
         vfprintf(stderr, fmt, args);
         fprintf(stderr, "\n");
         va_end(args);
-        exit(1);
+        abort();
     }
 }
 
diff --git a/src2/main.c b/src2/main.c
@@ -57,7 +57,9 @@ int main() {
     // train model
     int batch_size = 8;
     for(int epoch = 0; epoch < 3; epoch++) {
+        printf("==> epoch: %d\n", epoch);
         for(int i = 0; i < n_train_samples; i += batch_size) {
+            printf("    batch: %d/%d samples\n", i, n_train_samples);
             cten_begin_malloc(PoolId_Default);
             // prepare input and target
             Tensor input = Tensor_new((TensorShape){batch_size, n_features}, false);
@@ -102,9 +104,9 @@ int main() {
         Tensor y_pred = Model_forward(&model, input);
         Tensor loss = nn_crossentropy(y_true, y_pred);
         // calculate accuracy
-        int* pred_classes = Tensor_argmax(y_pred, -1);
+        int pred_classes[1];
+        Tensor_argmax(y_pred, pred_classes);
         if(pred_classes[0] == y[i]) correct++;
-        free(pred_classes);
         cten_end_malloc();
         // free temporary tensors
         cten_free(PoolId_Default);

Original file line number	Diff line number	Diff line change
`@@ -13,7 +13,7 @@ void cten_assert(bool cond, const char* fmt, ...) {`
`13`	`13`	`vfprintf(stderr, fmt, args);`
`14`	`14`	`fprintf(stderr, "\n");`
`15`	`15`	`va_end(args);`
`16`		`- exit(1);`
	`16`	`+ abort();`
`17`	`17`	`}`
`18`	`18`	`}`
`19`	`19`