Can i stop execution? (w/ `decoupled mode`)

### Description

```shell
Docker: nvcr.io/nvidia/tritonserver:23.04-py3
Gpu: A100

How can i stop bi-direction streaming(decoupled mode)?
- I want to stop model inference(streaming response) when the user disconnects or according to certain conditions, but I don't know how to do that at the moment.


Reference
- https://github.com/triton-inference-server/server/issues/4344
- https://github.com/triton-inference-server/server/issues/5833#issuecomment-1561318646
```


### Reproduced Steps

```shell
-
```


Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Can i stop execution? (w/ `decoupled mode`) #162

Description

Reproduced Steps

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Can i stop execution? (w/ decoupled mode) #162

Description

Description

Reproduced Steps

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions

Can i stop execution? (w/ `decoupled mode`) #162