-
Notifications
You must be signed in to change notification settings - Fork 18
Open
Description
感谢您非常好的工作。关于点的prompt的处理我有一个问题。
coords_torch, labels_torch = coords_torch[:, None, :], labels_torch[:, None]
这里似乎是把输入的N个点当成N个batch处理的,padding后point变成(N * 2 * 2) 而不是 (1 * (N+1) * 2)。原始SAM里是下面这样。
coords_torch, labels_torch = coords_torch[None, :, :], labels_torch[None, :]
我尝试给5个point prompt,Hi-SAM输出的是5个mask (指五个位置上的masks)。而原始SAM会把这5个prompt结合输出一个mask。我想知道这是否说明Hi-SAM的推理都是只针对1个点,即给定一个点输出这个位置的文本层次,这样的话输入的point labels是不是就没有什么意义了?以及如果我想像原始SAM一样给多个point prompt该如何实现。
谢谢!
Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels