feat: add kling image to image

timerring · timerring · commit c7aa802b21af · 2025-05-11T20:45:18.000+08:00
diff --git a/docs/zh/models/kling/kling-image-to-image.md b/docs/zh/models/kling/kling-image-to-image.md
@@ -0,0 +1,78 @@
+---
+title: 可灵 Kling 图生图
+gitChangelog: false
+updatedAt: 2025-05-08
+---
+
+# 可灵 Kling 图生图
+
+这是一个图生图的示例，使用 kling 生成图像。
+
+> [!TIP]
+> 图像生成是计算密集型任务，特别是高质量、高分辨率图像可能需要数十秒甚至数分钟处理时间，为了让用户发送请求后可以立即收到响应（任务ID），而不必等待整个生成过程，因此用户可以同时提交多个生成任务，然后异步查询结果。
+> 同时这样的队列系统允许服务提供商根据可用GPU/TPU资源智能调度任务。
+
+通常来说，图像生成的常见流程是：
+
+1. `POST`: 调用 `生成图像api` 提交图像生成任务，返回获取 `task_id`。
+2. `GET`: 根据 `task_id` 调用 `查询图像api` 查看图像生成任务是否完成。
+
+本示例实现了每隔一秒轮询任务状态，直到任务完成，然后返回图像 url 列表。
+
+## 代码示例
+
+> 深色背景为可以修改的参数，非必选参数已经注释，可以按照自己的需求启用。
+
+
+<<< @/zh/snippets/kling-image-to-image.py{164-165,172-182}
+
+
+## 返回结果
+
+返回结果为图片的 url 列表，这里使用参数 `n=2` 生成两张图片，每个 url 有效期一般为 30 天，推荐尽快下载或者转存。
+
+```
+['https://cdn.klingai.com/bs2/upload-kling-api/6567899185/image/CjikY2gHPbcAAAAABUWVOA-0_raw_image_1.png', 'https://cdn.klingai.com/bs2/upload-kling-api/6567899185/image/CjikY2gHPbcAAAAABUWVOA-1_raw_image_1.png']
+```
+
+![](https://cdn.jsdelivr.net/gh/timerring/scratchpad2023/2024/2025-05-11-20-37-04.png)
+
+![](https://cdn.jsdelivr.net/gh/timerring/scratchpad2023/2024/2025-05-11-20-37-16.png)
+
+## 流程图
+
+```mermaid
+flowchart TD
+    A[开始] --> B[初始化 KlingImageToImage 实例]
+    B --> C[调用 generate_image 方法]
+    
+    subgraph "图像处理"
+        C --> D{检查图像来源}
+        D -->|URL| E[直接使用URL]
+        D -->|本地文件| F[转换为base64]
+    end
+    
+    subgraph "API请求与任务等待"
+        E --> G[调用 _kling_generate_image 方法]
+        F --> G
+        G --> H[构建API请求体]
+        H --> I[发送POST请求]
+        I --> J{检查响应}
+        J -->|成功| K[获得task_id]
+        J -->|失败| L[抛出异常]
+        
+        K --> M[开始轮询任务状态]
+        M --> N[调用 _query_kling_image_url 方法]
+        N --> O[发送GET请求]
+        O --> P{检查任务状态}
+        P -->|进行中| Q[等待1秒]
+        Q --> N
+        P -->|超时| R[返回None]
+        P -->|完成| S[获取所有图像URL]
+    end
+    
+    S --> T[返回图像URL列表]
+    R --> U[结束]
+    L --> U
+    T --> U
+```
diff --git a/docs/zh/snippets/kling-image-to-image.py b/docs/zh/snippets/kling-image-to-image.py
@@ -0,0 +1,185 @@
+import http.client
+import json
+import base64
+import time
+
+class KlingImageToImage:
+    def __init__(self, api_token, api_url):
+        """初始化 Kling 图生图转换器
+        
+        参数:
+            api_token: API 密钥
+            api_url: API 节点地址
+        """
+        self.api_url = api_url
+        self.api_token = api_token
+        # 初始化 HTTP 连接
+        self.conn = http.client.HTTPSConnection(self.api_url)
+        # 设置请求头
+        self.headers = {
+            'Authorization': f'Bearer {self.api_token}',
+            'Content-Type': 'application/json'
+        }
+    
+    @staticmethod
+    def get_image_base64(image_path):
+        """将图片转换为 base64 编码形式
+        
+        参数:
+            image_path: 图片路径
+        返回:
+            base64 编码后的图片字符串
+        """
+        with open(image_path, "rb") as image_file:
+            return base64.b64encode(image_file.read()).decode("utf-8")
+    
+    def _kling_generate_image(self, model_name, prompt, image, image_reference, 
+                             image_fidelity=0.5, human_fidelity=0.5, 
+                             output_format="png", n=1, aspect_ratio="16:9", callback_url=""):
+        """使用 kling 进行图生图
+        
+        参数:
+            model_name: str, 模型名称，可选择 kling-v1-5 或 kling-v1
+            prompt: str, 文本提示词
+            image: str, 参考图片，base64编码或URL
+            image_reference: str, 参考图片类型，可选值：subject（角色特征参考）, face（人物长相参考）
+            image_fidelity: float, 参考图片强度，取值范围：[0,1]，数值越大参考强度越大
+            human_fidelity: float, 面部参考强度，取值范围：[0,1]，数值越大参考强度越大
+            output_format: str, 输出格式：png 或 jpg
+            n: int, 生成数量 [1, 9]
+            aspect_ratio: str, 输出比例：16:9, 9:16, 1:1, 4:3, 3:4, 3:2, 2:3
+            callback_url: str, 回调地址，可以用于 webhook 等通知场景
+        返回:
+            task_id: 生成任务的 id
+        """
+        # 构建请求体，请求的核心参数
+        payload = {
+            "model_name": model_name,
+            "prompt": prompt,
+            "image": image,
+            "image_reference": image_reference,
+            "image_fidelity": image_fidelity,
+            "human_fidelity": human_fidelity,
+            "output_format": output_format,
+            "n": n,
+            "aspect_ratio": aspect_ratio,
+            "callback_url": callback_url
+        }
+            
+        # 发送 POST 请求，提交图像生成任务
+        self.conn.request("POST", "/kling/v1/images/generations", json.dumps(payload), self.headers)
+        # 获取响应
+        res = self.conn.getresponse()
+        # 读取响应内容并解析为 JSON
+        json_data = json.loads(res.read().decode("utf-8"))
+        # print(json_data)
+        if 'code' in json_data and json_data['code'] == 0:
+            # 成功则返回提交的任务 id
+            return json_data['data']['task_id']
+        else:
+            # 失败则返回错误信息
+            raise Exception(f"API调用失败：{json_data['message']}")
+    
+    def _query_kling_image_url(self, task_id):
+        """使用查询接口获取生成图像 url
+        
+        参数:
+            task_id: 生成任务的 id
+        返回:
+            image_url: 图像 url，任务未完成时返回 None
+        """
+        # 构建查询路径
+        query_path = f"/kling/v1/images/generations/{task_id}"
+
+        # 发送 GET 请求，查询图像生成任务状态
+        self.conn.request("GET", query_path, None, self.headers)
+        # 获取响应
+        res = self.conn.getresponse()
+        # 读取响应内容并解析为 JSON
+        json_data = json.loads(res.read().decode("utf-8"))
+        # 如果任务状态为成功，则返回图像 url
+        if json_data['data']['task_status'] == "succeed":
+            image_urls = [image['url'] for image in json_data['data']['task_result']['images']]
+            return image_urls
+        else: 
+            return None
+    
+    def generate_image(self, model_name, prompt, image, 
+                      image_reference="subject", image_fidelity=0.5, human_fidelity=0.5, 
+                      output_format="png", n=1, aspect_ratio="16:9", callback_url="", timeout=120):
+        """实现功能，直接根据预设的参数返回生成图像的 url
+        
+        参数:
+            model_name: str, 模型名称，可选择 kling-v1-5 或 kling-v1
+            prompt: str, 文本提示词
+            image: str, 参考图片的URL或本地文件路径
+            image_reference: str, 参考图片类型，可选值：subject（角色特征参考）, face（人物长相参考）
+            image_fidelity: float, 参考图片强度，取值范围：[0,1]，数值越大参考强度越大
+            human_fidelity: float, 面部参考强度，取值范围：[0,1]，数值越大参考强度越大
+            output_format: str, 输出格式：png 或 jpg
+            n: int, 生成数量 [1, 9]
+            aspect_ratio: str, 输出比例：16:9, 9:16, 1:1, 4:3, 3:4, 3:2, 2:3
+            callback_url: str, 回调地址，可以用于 webhook 等通知场景
+            timeout: int, 等待生成完成的超时时间（秒）
+        返回:
+            image_url: 图像 url
+        """
+        # 处理图像输入 - 自动判断是URL还是本地文件路径
+        if image.startswith(('http://', 'https://', 'ftp://')):
+            # 如果是URL，直接使用
+            image_data = image
+        else:
+            # 否则当作本地文件路径处理，转换为base64
+            try:
+                image_data = KlingImageToImage.get_image_base64(image)
+            except Exception as e:
+                raise ValueError(f"无法读取图像文件: {str(e)}")
+        
+        # 调用生成图像 api 提交图像生成任务，返回获取 task_id
+        task_id = self._kling_generate_image(
+            model_name, prompt, image_data, image_reference, 
+            image_fidelity, human_fidelity, output_format, n, aspect_ratio, callback_url
+        )
+        
+        start_time = time.time()
+        
+        # 轮询等待生成完成
+        while True:
+            # 根据 task_id 调用查询图像api 查看图像生成任务是否完成
+            image_url = self._query_kling_image_url(task_id) 
+            # 如果图像生成任务完成，则返回图像 url
+            if image_url is not None:
+                return image_url
+            # 如果轮询超时，则返回 None
+            if time.time() - start_time > timeout:
+                print(f"请求达到 {timeout} 秒超时")
+                return None
+            # 轮询间隔 1 秒
+            time.sleep(1)
+            print(f"等待图像生成，{int(time.time() - start_time)} 秒", flush=True)
+
+
+# 使用示例
+if __name__ == "__main__":
+    API_URL = "www.dmxapi.cn"  # API 节点地址
+    DMX_API_TOKEN = "sk-XXXXXXXXXXXXXX"  # API 密钥
+    
+    # 创建图生图转换器实例
+    kling_image_to_image = KlingImageToImage(api_token=DMX_API_TOKEN, api_url=API_URL)
+    
+    # 生成图像
+    image_urls = kling_image_to_image.generate_image(
+        model_name="kling-v1-5",  # [必选]模型名称 参数 kling-v1 或者 kling-v1-5 （注意 v2 没有图生图能力）
+        prompt="请生成这张照片的梵高风格迁移后的图像",  # [必选]文本提示词 
+        image="/Users/dmxapi/Desktop/dmxapi.png",  # [必选]参考图片路径 参数可以是 图片的URL https://image.jpg 或者 图片的本地路径 即可
+        image_reference="subject",  # [必选]参考图片类型，可选值：subject（角色特征参考）, face（人物长相参考）
+        # image_fidelity=0.5,  # 参考图片强度 参数范围 0-1 默认 0.5 
+        # human_fidelity=0.5,  # 面部参考强度 参数范围 0-1 默认 0.5 
+        # output_format="png",  # 输出格式 参数范围 png 或者 jpg
+        # n=1,  # 生成数量 参数范围 1-9 默认 1
+        # aspect_ratio="16:9",  # 输出比例 参数范围 16:9, 9:16, 1:1, 4:3, 3:4, 3:2, 2:3 默认 16:9
+        # callback_url="",  # 回调地址
+        # timeout=120 # 等待超时时间
+    )
+    
+    print(image_urls)