eki-project
diff --git a/‎docs/finn/command_line.rst‎
Lines changed: 1 addition & 1 deletion b/‎docs/finn/command_line.rst‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎docs/finn/hw_build.rst‎
Lines changed: 1 addition & 1 deletion b/‎docs/finn/hw_build.rst‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎docs/finn/source_code/finn.transformation.fpgadataflow.rst‎
Lines changed: 1 addition & 1 deletion b/‎docs/finn/source_code/finn.transformation.fpgadataflow.rst‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎pyproject.toml‎
Lines changed: 2 additions & 2 deletions b/‎pyproject.toml‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎src/finn/builder/build_dataflow_steps.py‎
Lines changed: 1 addition & 3 deletions b/‎src/finn/builder/build_dataflow_steps.py‎
Lines changed: 1 addition & 3 deletions
diff --git a/‎src/finn/custom_op/fpgadataflow/addstreams.py‎
Lines changed: 32 additions & 20 deletions b/‎src/finn/custom_op/fpgadataflow/addstreams.py‎
Lines changed: 32 additions & 20 deletions
diff --git a/‎src/finn/custom_op/fpgadataflow/hls/addstreams_hls.py‎
Lines changed: 7 additions & 7 deletions b/‎src/finn/custom_op/fpgadataflow/hls/addstreams_hls.py‎
Lines changed: 7 additions & 7 deletions
diff --git a/‎src/finn/custom_op/fpgadataflow/rtl/matrixvectoractivation_rtl.py‎
Lines changed: 34 additions & 36 deletions b/‎src/finn/custom_op/fpgadataflow/rtl/matrixvectoractivation_rtl.py‎
Lines changed: 34 additions & 36 deletions
diff --git a/‎src/finn/transformation/fpgadataflow/convert_to_hw_layers.py‎
Lines changed: 2 additions & 8 deletions b/‎src/finn/transformation/fpgadataflow/convert_to_hw_layers.py‎
Lines changed: 2 additions & 8 deletions
@@ -81,7 +81,7 @@ as it goes through numerous steps:
   Running step: step_measure_rtlsim_performance [15/19]
   Running step: step_out_of_context_synthesis [16/19]
   Running step: step_synthesize_bitfile [17/19]
-  Running step: step_make_pynq_driver [18/19]
+  Running step: step_make_driver [18/19]
   Running step: step_deployment_package [19/19]
 
 
 
@@ -35,7 +35,7 @@ To rapidly test the generated design on PYNQ platforms, FINN is capable of
 generating a Python driver for the given design. This driver packs/unpacks the
 input/output tensors in the expected format, then uses PYNQ APIs to initiate
 data movement and transfer back the results to the host CPU. The generation of
-the driver is done by transformation pass :py:mod:`finn.transformation.fpgadataflow.make_pynq_driver.MakePYNQDriver`.
+the driver is done by transformation pass :py:mod:`finn.transformation.fpgadataflow.make_driver.MakePYNQDriver`.
 
 DMA and DWC Node Insertion
 ---------------------------
 
@@ -149,7 +149,7 @@ finn.transformation.fpgadataflow.insert\_tlastmarker
 finn.transformation.fpgadataflow.make\_pynq\_driver
 ----------------------------------------------------------
 
-.. automodule:: finn.transformation.fpgadataflow.make_pynq_driver
+.. automodule:: finn.transformation.fpgadataflow.make_driver
    :members:
    :undoc-members:
    :show-inheritance:
 
@@ -54,8 +54,8 @@ toposort = "1.7.0"
 vcdvcd = "1.0.5"
 wget = "3.2"
 pygments = "2.14.0"
-torch = "2.6.0"
-torchvision = "0.21.0"
+torch = "2.7.0"
+torchvision = "0.22.0"
 ipykernel = "6.21.2"
 jupyter = "1.0.0"
 markupsafe = "2.0.1"
 
@@ -837,15 +837,13 @@ def step_make_driver(model: ModelWrapper, cfg: DataflowBuildConfig):
         log.info("PYNQ Python driver written into " + driver_dir)
     elif DataflowOutputType.CPP_DRIVER in cfg.generate_outputs:
         # generate C++ Driver
-
         model = model.transform(
             MakeCPPDriver(
                 cfg._resolve_driver_platform(),
-                build_dir=cfg.output_dir,
                 version=cfg.cpp_driver_version,
-                driver_dir=driver_dir,
             )
         )
+        shutil.copytree(model.get_metadata_prop("cpp_driver_dir"), driver_dir, dirs_exist_ok=True)
         log.info("C++ driver written into " + driver_dir)
     else:
         log.warning(
 
@@ -26,6 +26,7 @@
 # OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
 # OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
 
+import math
 import numpy as np
 from qonnx.core.datatype import DataType
 
@@ -46,7 +47,7 @@ def get_nodeattr_types(self):
                 "NumChannels": ("i", True, ""),
                 "PE": ("i", True, ""),
                 # FINN DataTypes for inputs; output datatype inferred from input
-                "inputDataType": ("s", True, ""),
+                "inputDataTypes": ("strings", True, [""]),
                 # number of input vectors, examples:
                 # [1] is a single vector (like a FC layer with batch=1)
                 # [4] is four vectors (like a FC layer with batch=4)
@@ -78,38 +79,49 @@ def get_folded_output_shape(self, ind=0):
         return self.get_folded_input_shape()
 
     def infer_node_datatype(self, model):
-        node = self.onnx_node
-        idt = model.get_tensor_datatype(node.input[0])
-        if idt != self.get_input_datatype():
-            warn_str = "inputDataType changing for %s: %s -> %s " % (
-                node.name,
-                str(self.get_input_datatype()),
-                str(idt),
-            )
-            log.warning(warn_str)
-        self.set_nodeattr("inputDataType", idt.name)
+        # check all input datatypes
+        for i, inp in enumerate(self.onnx_node.input):
+            idt = model.get_tensor_datatype(inp)
+            if idt != self.get_input_datatype(i):
+                warn_str = "inputDataType changing for %s: %s -> %s " % (
+                    self.onnx_node.name,
+                    str(self.get_input_datatype(i)),
+                    str(idt),
+                )
+                log.warning(warn_str)
+                old_datatypes_attr = self.get_nodeattr("inputDataTypes")
+                old_datatypes_attr[i] = idt.name
+                self.set_nodeattr("inputDataTypes", old_datatypes_attr)
         # enforce output data type (calculated based on idt)
         odt = self.get_output_datatype()
         model.set_tensor_datatype(self.onnx_node.output[0], odt)
 
     def get_input_datatype(self, ind=0):
         """Returns FINN DataType of input."""
-        return DataType[self.get_nodeattr("inputDataType")]
+        return DataType[self.get_nodeattr("inputDataTypes")[ind]]
 
     def get_output_datatype(self, ind=0):
         """Returns FINN DataType of output."""
-        # we need to set output datatype to the next larger int or uint
-        # enhancement: consider specifying w/ explicit outputDataType attribute
-        # to allow overflow and use the same idt if user wants
-        idt = DataType[self.get_nodeattr("inputDataType")]
-        if idt.signed():
-            return DataType.get_smallest_possible(2 * idt.min())
+        min_input = 0
+        max_input = 0
+        for i in range(len(self.get_nodeattr("inputDataTypes"))):
+            idt = self.get_input_datatype(i)
+            if idt.min() < min_input:
+                min_input = idt.min()
+            if idt.max() > max_input:
+                max_input = idt.max()
+        if min_input >= 0:
+            out_bit_width = math.ceil(np.log2(max_input + 1))
+            odt = DataType[f"UINT{out_bit_width + 1}"]
         else:
-            return DataType.get_smallest_possible(2 * idt.max())
+            max_abs_input = max(-min_input, 1 + max_input)
+            out_bit_width = math.ceil(np.log2(max_abs_input) + 1)
+            odt = DataType[f"INT{out_bit_width + 1}"]
+        return odt
 
     def get_instream_width(self, ind=0):
         """Returns input stream width."""
-        ibits = self.get_input_datatype().bitwidth()
+        ibits = self.get_input_datatype(ind).bitwidth()
         pe = self.get_nodeattr("PE")
         in_width = pe * ibits
         return in_width
 
@@ -57,7 +57,7 @@ def verify_node(self):
             self.get_nodeattr("executable_path")
             self.get_nodeattr("NumChannels")
             self.get_nodeattr("PE")
-            self.get_nodeattr("inputDataType")
+            self.get_nodeattr("inputDataTypes")
             info_messages.append("All necessary attributes exist")
         except Exception:
             info_messages.append("""The required LabelSelect_Batch attributes do not exist.""")
@@ -76,10 +76,10 @@ def defines(self, var):
     def strm_decl(self):
         self.code_gen_dict["$STREAMDECLARATIONS$"] = []
         self.code_gen_dict["$STREAMDECLARATIONS$"].append(
-            'hls::stream<ap_uint<{}>> in0_V ("in0_V");'.format(self.get_instream_width())
+            'hls::stream<ap_uint<{}>> in0_V ("in0_V");'.format(self.get_instream_width(0))
         )
         self.code_gen_dict["$STREAMDECLARATIONS$"].append(
-            'hls::stream<ap_uint<{}>> in1_V ("in1_V");'.format(self.get_instream_width())
+            'hls::stream<ap_uint<{}>> in1_V ("in1_V");'.format(self.get_instream_width(1))
         )
         self.code_gen_dict["$STREAMDECLARATIONS$"].append(
             'hls::stream<ap_uint<{}>> out0_V ("out0_V");'.format(self.get_outstream_width())
@@ -91,8 +91,8 @@ def docompute(self):
             """{}<{}, {}, {}, {}, {}> (in0_V, in1_V, out0_V, 1);""".format(
                 hls_call,
                 self.get_nodeattr("PE"),
-                self.get_input_datatype().get_hls_datatype_str(),
-                self.get_input_datatype().get_hls_datatype_str(),
+                self.get_input_datatype(0).get_hls_datatype_str(),
+                self.get_input_datatype(1).get_hls_datatype_str(),
                 self.get_output_datatype().get_hls_datatype_str(),
                 self.get_number_output_values(),
             )
@@ -103,8 +103,8 @@ def blackboxfunction(self):
             """void {}(hls::stream<ap_uint<{}>> &in0_V, hls::stream<ap_uint<{}>> &in1_V,
                 hls::stream<ap_uint<{}>> &out0_V)""".format(
                 self.onnx_node.name,
-                self.get_nodeattr("PE") * self.get_input_datatype().bitwidth(),
-                self.get_nodeattr("PE") * self.get_input_datatype().bitwidth(),
+                self.get_nodeattr("PE") * self.get_input_datatype(0).bitwidth(),
+                self.get_nodeattr("PE") * self.get_input_datatype(1).bitwidth(),
                 self.get_nodeattr("PE") * self.get_output_datatype().bitwidth(),
             )
         ]
 
@@ -75,9 +75,9 @@ def execute_node(self, context, graph):
                         str(context[inputs].dtype) == "float32"
                     ), """Input datatype is
                     not float32 as expected."""
-                    expected_inp_shape = self.get_folded_input_shape()
+                    expected_inp_shape = self.get_folded_input_shape(in_ind)
                     reshaped_input = context[inputs].reshape(expected_inp_shape)
-                    export_idt = self.get_input_datatype(0)
+                    export_idt = self.get_input_datatype(in_ind)
                     # make copy before saving the array
                     reshaped_input = reshaped_input.copy()
                     np.save(
@@ -87,40 +87,38 @@ def execute_node(self, context, graph):
                 elif in_ind > 1:
                     raise Exception("Unexpected input found for MatrixVectorActivation_rtl")
                 in_ind += 1
-                sim = self.get_rtlsim()
-                nbits = self.get_instream_width(0)
-                inp = npy_to_rtlsim_input("{}/input_0.npy".format(code_gen_dir), export_idt, nbits)
-                super().reset_rtlsim(sim)
-                if mem_mode in ["external", "internal_decoupled"]:
-                    wnbits = self.get_instream_width(1)
-                    export_wdt = self.get_input_datatype(1)
-                    wei = npy_to_rtlsim_input(
-                        "{}/weights.npy".format(code_gen_dir), export_wdt, wnbits
-                    )
-                    num_w_reps = np.prod(self.get_nodeattr("numInputVectors"))
-                    io_dict = {
-                        "inputs": {"in0": inp, "in1": wei * num_w_reps},
-                        "outputs": {"out0": []},
-                    }
-                else:
-                    io_dict = {
-                        "inputs": {"in0": inp},
-                        "outputs": {"out0": []},
-                    }
-                self.rtlsim_multi_io(sim, io_dict)
-                super().close_rtlsim(sim)
-                output = io_dict["outputs"]["out0"]
-                odt = self.get_output_datatype()
-                target_bits = odt.bitwidth()
-                packed_bits = self.get_outstream_width()
-                out_npy_path = "{}/output.npy".format(code_gen_dir)
-                out_shape = self.get_folded_output_shape()
-                rtlsim_output_to_npy(output, out_npy_path, odt, out_shape, packed_bits, target_bits)
-                # load and reshape output
-                output = np.load(out_npy_path)
-                oshape = self.get_normal_output_shape()
-                output = np.asarray([output], dtype=np.float32).reshape(*oshape)
-                context[node.output[0]] = output
+            sim = self.get_rtlsim()
+            nbits = self.get_instream_width(0)
+            inp = npy_to_rtlsim_input("{}/input_0.npy".format(code_gen_dir), export_idt, nbits)
+            super().reset_rtlsim(sim)
+            if mem_mode in ["external", "internal_decoupled"]:
+                wnbits = self.get_instream_width(1)
+                export_wdt = self.get_input_datatype(1)
+                wei = npy_to_rtlsim_input("{}/weights.npy".format(code_gen_dir), export_wdt, wnbits)
+                num_w_reps = np.prod(self.get_nodeattr("numInputVectors"))
+                io_dict = {
+                    "inputs": {"in0": inp, "in1": wei * num_w_reps},
+                    "outputs": {"out0": []},
+                }
+            else:
+                io_dict = {
+                    "inputs": {"in0": inp},
+                    "outputs": {"out0": []},
+                }
+            self.rtlsim_multi_io(sim, io_dict)
+            super().close_rtlsim(sim)
+            output = io_dict["outputs"]["out0"]
+            odt = self.get_output_datatype()
+            target_bits = odt.bitwidth()
+            packed_bits = self.get_outstream_width()
+            out_npy_path = "{}/output.npy".format(code_gen_dir)
+            out_shape = self.get_folded_output_shape()
+            rtlsim_output_to_npy(output, out_npy_path, odt, out_shape, packed_bits, target_bits)
+            # load and reshape output
+            output = np.load(out_npy_path)
+            oshape = self.get_normal_output_shape()
+            output = np.asarray([output], dtype=np.float32).reshape(*oshape)
+            context[node.output[0]] = output
         else:
             raise Exception(
                 """Invalid value for attribute exec_mode! Is currently set to: {}
 
@@ -488,14 +488,8 @@ def apply(self, model):
                 idt0 = model.get_tensor_datatype(in0)
                 idt1 = model.get_tensor_datatype(in1)
 
-                # skip if different data types on inputs
-                if idt0 != idt1:
-                    continue
-
-                idt = idt0
-
                 # skip conversion for layers with float input
-                if not idt.is_integer():
+                if not idt0.is_integer() or not idt1.is_integer():
                     continue
 
                 # check layout and convert if necessary
@@ -535,7 +529,7 @@ def apply(self, model):
                     backend="fpgadataflow",
                     NumChannels=num_channels,
                     PE=pe,
-                    inputDataType=idt.name,
+                    inputDataTypes=[idt0.name, idt1.name],
                     numInputVectors=in0_shape[:-1],
                     name="AddStreams_" + node.name,
                 )