Skip to content

关于点prompt处理的问题 #34

@mxxxxxxy

Description

@mxxxxxxy

感谢您非常好的工作。关于点的prompt的处理我有一个问题。

predictor.py的133行

coords_torch, labels_torch = coords_torch[:, None, :], labels_torch[:, None]

这里似乎是把输入的N个点当成N个batch处理的,padding后point变成(N * 2 * 2) 而不是 (1 * (N+1) * 2)。原始SAM里是下面这样。

coords_torch, labels_torch = coords_torch[None, :, :], labels_torch[None, :]

我尝试给5个point prompt,Hi-SAM输出的是5个mask (指五个位置上的masks)。而原始SAM会把这5个prompt结合输出一个mask。我想知道这是否说明Hi-SAM的推理都是只针对1个点,即给定一个点输出这个位置的文本层次,这样的话输入的point labels是不是就没有什么意义了?以及如果我想像原始SAM一样给多个point prompt该如何实现。

谢谢!

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions