tracel-ai
diff --git a/‎crates/burn-core/src/nn/linear.rs
Lines changed: 3 additions & 4 deletions b/‎crates/burn-core/src/nn/linear.rs
Lines changed: 3 additions & 4 deletions
diff --git a/‎crates/burn-core/src/nn/mod.rs
Lines changed: 0 additions & 2 deletions b/‎crates/burn-core/src/nn/mod.rs
Lines changed: 0 additions & 2 deletions
diff --git a/‎crates/burn-tensor/src/tensor/mod.rs
Lines changed: 0 additions & 3 deletions b/‎crates/burn-tensor/src/tensor/mod.rs
Lines changed: 0 additions & 3 deletions
diff --git a/‎crates/burn-tensor/src/tensor/nn/functional/mod.rs
Lines changed: 0 additions & 2 deletions b/‎crates/burn-tensor/src/tensor/nn/functional/mod.rs
Lines changed: 0 additions & 2 deletions
diff --git a/‎crates/burn-tensor/src/tensor/nn/mod.rs
Lines changed: 0 additions & 4 deletions b/‎crates/burn-tensor/src/tensor/nn/mod.rs
Lines changed: 0 additions & 4 deletions
diff --git a/‎crates/burn-tensor/src/tensor/ops/modules/base.rs
Lines changed: 35 additions & 1 deletion b/‎crates/burn-tensor/src/tensor/ops/modules/base.rs
Lines changed: 35 additions & 1 deletion
diff --git a/‎crates/burn-tensor/src/tensor/nn/functional/linear.rs renamed to ‎crates/burn-tensor/src/tensor/ops/modules/linear.rs b/‎crates/burn-tensor/src/tensor/nn/functional/linear.rs renamed to ‎crates/burn-tensor/src/tensor/ops/modules/linear.rs
diff --git a/‎crates/burn-tensor/src/tensor/ops/modules/mod.rs
Lines changed: 3 additions & 0 deletions b/‎crates/burn-tensor/src/tensor/ops/modules/mod.rs
Lines changed: 3 additions & 0 deletions
diff --git a/‎crates/burn-tensor/src/tests/mod.rs
Lines changed: 1 addition & 4 deletions b/‎crates/burn-tensor/src/tests/mod.rs
Lines changed: 1 addition & 4 deletions
diff --git a/‎crates/burn-tensor/src/tests/nn/functional/mod.rs
Lines changed: 0 additions & 1 deletion b/‎crates/burn-tensor/src/tests/nn/functional/mod.rs
Lines changed: 0 additions & 1 deletion
@@ -1,9 +1,9 @@
 use crate as burn;
+use burn_tensor::ops::linear::linear;
 
 use crate::config::Config;
 use crate::module::Param;
 use crate::module::{Content, DisplaySettings, Module, ModuleDisplay};
-use crate::nn::functional::linear;
 use crate::tensor::{Tensor, backend::Backend};
 
 use super::Initializer;
@@ -30,8 +30,6 @@ pub struct LinearConfig {
 /// Should be created with [LinearConfig]
 ///
 /// `O = IW + b`
-///
-/// See: [linear][nn::functional::linear]
 #[derive(Module, Debug)]
 #[module(custom_display)]
 pub struct Linear<B: Backend> {
@@ -83,7 +81,8 @@ impl<B: Backend> Linear<B> {
     pub fn forward<const D: usize>(&self, input: Tensor<B, D>) -> Tensor<B, D> {
         let weight = self.weight.val();
         let bias = self.bias.as_ref().map(|b| b.val());
-        linear(input, weight, bias)
+
+        B::linear(input, weight, bias)
     }
 }
 
 
@@ -1,5 +1,3 @@
-pub use burn_tensor::nn::*;
-
 /// Attention module
 pub mod attention;
 
 
@@ -32,9 +32,6 @@ pub mod loss;
 /// The burn module.
 pub mod module;
 
-/// The nn module.
-pub mod nn;
-
 /// Operations on tensors module.
 pub mod ops;
 
 
@@ -1,8 +1,9 @@
 use core::num::NonZeroUsize;
 
 use super::{conv, pool, unfold::unfold4d_using_conv2d};
+use crate::ops::linear::linear;
 use crate::{
-    Shape, TensorMetadata,
+    Shape, Tensor, TensorMetadata,
     backend::Backend,
     ops::{FloatTensor, IntTensor},
 };
@@ -764,6 +765,39 @@ pub trait ModuleOps<B: Backend> {
         output_size: [usize; 2],
         options: InterpolateOptions,
     ) -> FloatTensor<B>;
+
+    /// Applies a linear transformation to the input tensor using the given weight and bias.
+    ///
+    /// ```math
+    /// y = x @ weight + [bias]
+    /// ```
+    ///
+    /// # Arguments:
+    ///
+    /// - `input` is the input tensor, ``[..., d_input]``.
+    /// - `weight` is the weight tensor, ``[d_input, d_output]``.
+    /// - `b` is the bias tensor (optional), ``[d_output]``.
+    ///
+    /// # Returns:
+    ///
+    /// The transformed tensor, ``[..., d_output]``.
+    ///
+    /// # Compatibility
+    ///
+    /// This function differs from PyTorch's ``torch.nn.functional.linear`` in that it does not
+    /// transpose the weight matrix. In PyTorch, the weight matrix is transposed before
+    /// multiplication:
+    ///
+    /// ```math
+    /// y = x @ weight^T + [bias]
+    /// ```
+    fn linear<const D: usize>(
+        input: Tensor<B, D>,
+        weight: Tensor<B, 2>,
+        bias: Option<Tensor<B, 1>>,
+    ) -> Tensor<B, D> {
+        linear(input, weight, bias)
+    }
 }
 
 #[cfg(test)]
 
@@ -13,4 +13,7 @@ pub mod pool;
 
 mod base;
 
+/// Module with linear operations.
+pub mod linear;
+
 pub use base::*;
@@ -2,7 +2,6 @@ mod activation;
 mod clone_invariance;
 mod grid;
 mod module;
-mod nn;
 mod ops;
 mod primitive;
 mod quantization;
@@ -156,9 +155,6 @@ macro_rules! testgen_with_float_param {
         burn_tensor::testgen_silu!();
         burn_tensor::testgen_tanh_activation!();
 
-        // test nn.functional
-        burn_tensor::testgen_nn_fn_vector_norm!();
-
         // test grid
         burn_tensor::testgen_meshgrid!();
 
@@ -181,6 +177,7 @@ macro_rules! testgen_with_float_param {
         burn_tensor::testgen_module_nearest_interpolate!();
         burn_tensor::testgen_module_bilinear_interpolate!();
         burn_tensor::testgen_module_bicubic_interpolate!();
+        burn_tensor::testgen_module_linear!();
 
         // test ops
         burn_tensor::testgen_gather_scatter!();
Original file line number	Diff line number	Diff line change
`@@ -1,5 +1,3 @@`
`1`		`-pub use burn_tensor::nn::*;`
`2`		`-`
`3`	`1`	`/// Attention module`
`4`	`2`	`pub mod attention;`
`5`	`3`