web-infra-dev
diff --git a/‎.github/workflows/ai-evaluation.yml
Lines changed: 54 additions & 0 deletions b/‎.github/workflows/ai-evaluation.yml
Lines changed: 54 additions & 0 deletions
diff --git a/‎biome.json
Lines changed: 2 additions & 1 deletion b/‎biome.json
Lines changed: 2 additions & 1 deletion
diff --git a/‎packages/evaluation/.gitignore
Lines changed: 4 additions & 0 deletions b/‎packages/evaluation/.gitignore
Lines changed: 4 additions & 0 deletions
diff --git a/‎packages/evaluation/data-generator/fixture.ts
Lines changed: 5 additions & 0 deletions b/‎packages/evaluation/data-generator/fixture.ts
Lines changed: 5 additions & 0 deletions
diff --git a/‎packages/evaluation/data-generator/generator-headed.spec.ts
Lines changed: 23 additions & 0 deletions b/‎packages/evaluation/data-generator/generator-headed.spec.ts
Lines changed: 23 additions & 0 deletions
diff --git a/‎packages/web-integration/tests/ai/web/playwright/generate-test-data.spec.ts renamed to ‎packages/evaluation/data-generator/generator-headless.spec.ts
Lines changed: 8 additions & 20 deletions b/‎packages/web-integration/tests/ai/web/playwright/generate-test-data.spec.ts renamed to ‎packages/evaluation/data-generator/generator-headless.spec.ts
Lines changed: 8 additions & 20 deletions
diff --git a/‎packages/web-integration/src/debug/index.ts renamed to ‎packages/evaluation/data-generator/utils.ts
Lines changed: 9 additions & 9 deletions b/‎packages/web-integration/src/debug/index.ts renamed to ‎packages/evaluation/data-generator/utils.ts
Lines changed: 9 additions & 9 deletions
diff --git a/‎packages/evaluation/package.json
Lines changed: 32 additions & 0 deletions b/‎packages/evaluation/package.json
Lines changed: 32 additions & 0 deletions
diff --git a/‎packages/midscene/tests/ai/evaluate/ai-data/assertion/online_order.json renamed to ‎packages/evaluation/page-cases/assertion/online_order.json
Lines changed: 2 additions & 2 deletions b/‎packages/midscene/tests/ai/evaluate/ai-data/assertion/online_order.json renamed to ‎packages/evaluation/page-cases/assertion/online_order.json
Lines changed: 2 additions & 2 deletions
diff --git a/‎packages/midscene/tests/ai/evaluate/ai-data/inspect/aweme_login.json renamed to ‎packages/evaluation/page-cases/inspect/aweme_login.json
Lines changed: 2 additions & 2 deletions b/‎packages/midscene/tests/ai/evaluate/ai-data/inspect/aweme_login.json renamed to ‎packages/evaluation/page-cases/inspect/aweme_login.json
Lines changed: 2 additions & 2 deletions
@@ -0,0 +1,54 @@
+name: AI unit test
+on:
+  push:
+    branches:
+      - main
+  workflow_dispatch:
+    inputs:
+      branch:
+        description: 'Branch to checkout'
+        required: false
+        default: 'main'
+        type: string
+
+jobs:
+  main:
+    runs-on: ubuntu-22.04
+    strategy:
+      matrix:
+        node-version: [18.19.0]
+
+    env:
+      OPENAI_API_KEY: ${{ secrets.OPENAI_API_KEY }}
+      OPENAI_BASE_URL: ${{ secrets.OPENAI_BASE_URL }}
+      MIDSCENE_MODEL_NAME: gpt-4o-2024-11-20
+      CI: 1
+
+    steps:
+    - uses: actions/checkout@v4
+      with:
+        fetch-depth: 0
+        ref: ${{ github.event.inputs.branch || 'main' }}
+
+    - name: Setup pnpm
+      uses: pnpm/action-setup@v2
+      with:
+        version: 9.3.0
+  
+    - name: Setup Node.js
+      uses: actions/setup-node@v4
+      with:
+        node-version: '18'
+        cache: 'pnpm'
+
+    - name: Install dependencies
+      run: pnpm install --frozen-lockfile
+
+    - name: Build project
+      run: pnpm run build
+    
+    - name: Run evaluation
+      run: |
+        cd packages/evaluation
+        pnpm run evaluate:inspect
+        pnpm run evaluate:assertion
@@ -21,7 +21,8 @@
       "**/playwright-report/**",
       "**/todo-report.spec.ts-snapshots/**",
       "**/visualizer/scripts/fixture/*",
-      "**/unpacked-extension/*"
+      "**/unpacked-extension/*",
+      "**/page-data/**"
     ]
   },
   "javascript": {
 
@@ -0,0 +1,4 @@
+
+# Midscene.js dump files
+midscene_run/report
+midscene_run/tmp
@@ -0,0 +1,5 @@
+import type { PlayWrightAiFixtureType } from '@midscene/web';
+import { PlaywrightAiFixture } from '@midscene/web/playwright';
+import { test as base } from '@playwright/test';
+
+export const test = base.extend<PlayWrightAiFixtureType>(PlaywrightAiFixture());
@@ -0,0 +1,23 @@
+import { PlaywrightWebPage } from '@midscene/web/playwright';
+import { test } from './fixture';
+import { generateExtractData, generateTestDataPath } from './utils';
+
+function sleep(time: number) {
+  return new Promise((resolve) => {
+    setTimeout(() => {
+      resolve(0);
+    }, time);
+  });
+}
+
+test('taobao', async ({ page, ai }) => {
+  const playwrightPage = new PlaywrightWebPage(page);
+  page.setViewportSize({ width: 1280, height: 800 });
+
+  await page.goto('https://www.taobao.com/');
+
+  // for --ui
+  await sleep(5000);
+
+  await generateExtractData(playwrightPage, generateTestDataPath('taobao'));
+});
@@ -1,6 +1,6 @@
-import { generateExtractData, generateTestDataPath } from '@/debug';
-import { PlaywrightWebPage } from '@/playwright';
+import { PlaywrightWebPage } from '@midscene/web/playwright';
 import { test } from './fixture';
+import { generateExtractData, generateTestDataPath } from './utils';
 
 function sleep(time: number) {
   return new Promise((resolve) => {
@@ -10,7 +10,7 @@ function sleep(time: number) {
   });
 }
 
-test('generate todo test data', async ({ page }) => {
+test('todo app', async ({ page }) => {
   const playwrightPage = new PlaywrightWebPage(page);
   await page.goto('https://todomvc.com/examples/react/dist/');
   // Add data
@@ -33,7 +33,7 @@ test('generate todo test data', async ({ page }) => {
   );
 });
 
-test('generate visualstudio test data', async ({ page }) => {
+test('visualstudio code', async ({ page }) => {
   const playwrightPage = new PlaywrightWebPage(page);
 
   await page.goto('https://code.visualstudio.com/');
@@ -45,7 +45,7 @@ test('generate visualstudio test data', async ({ page }) => {
   );
 });
 
-test('generate githubstatus test data', async ({ page }) => {
+test('github status page', async ({ page }) => {
   const playwrightPage = new PlaywrightWebPage(page);
 
   await page.setViewportSize({ width: 1920, height: 1080 });
@@ -95,7 +95,7 @@ test('antd widget - carousel', async ({ page }) => {
   );
 });
 
-test('generate online order test data', async ({ page, ai }) => {
+test('heytea online order', async ({ page, ai }) => {
   const playwrightPage = new PlaywrightWebPage(page);
 
   page.setViewportSize({ width: 400, height: 905 });
@@ -109,7 +109,7 @@ test('generate online order test data', async ({ page, ai }) => {
   );
 });
 
-test('generate online order list test data (zh-cn)', async ({ page, ai }) => {
+test('heytea online order list (zh-cn)', async ({ page, ai }) => {
   const playwrightPage = new PlaywrightWebPage(page);
 
   page.setViewportSize({ width: 400, height: 905 });
@@ -127,19 +127,7 @@ test('generate online order list test data (zh-cn)', async ({ page, ai }) => {
   );
 });
 
-test('generate taobao test data', async ({ page, ai }) => {
-  const playwrightPage = new PlaywrightWebPage(page);
-  page.setViewportSize({ width: 1280, height: 800 });
-
-  await page.goto('https://www.taobao.com/');
-
-  // for --ui
-  await sleep(5000);
-
-  await generateExtractData(playwrightPage, generateTestDataPath('taobao'));
-});
-
-test('generate douyin test data', async ({ page, ai }) => {
+test('douyin', async ({ page, ai }) => {
   const playwrightPage = new PlaywrightWebPage(page);
 
   page.setViewportSize({ width: 1280, height: 800 });
 
@@ -1,14 +1,17 @@
+import assert from 'node:assert';
 import { existsSync, mkdirSync, readFileSync, writeFileSync } from 'node:fs';
+import { NodeType } from '@midscene/shared/constants';
+
 import path from 'node:path';
-import type { WebPage } from '@/common/page';
 import { descriptionOfTree } from '@midscene/core/tree';
-import { NodeType } from '@midscene/shared/constants';
-import type { ElementInfo } from '@midscene/shared/extractor';
 import {
   processImageElementInfo,
   resizeImgBase64,
   saveBase64Image,
 } from '@midscene/shared/img';
+import type { WebPage } from '@midscene/web';
+
+import type { ElementInfo } from '@midscene/shared/extractor';
 
 export async function generateExtractData(
   page: WebPage,
@@ -109,13 +112,10 @@ export async function generateExtractData(
 }
 
 export function generateTestDataPath(testDataName: string) {
-  // `dist/lib/index.js` Is the default export path
-  const modulePath = require
-    .resolve('@midscene/core')
-    .replace('dist/lib/index.js', '');
+  assert(testDataName, 'testDataName is required');
   const midsceneTestDataPath = path.join(
-    modulePath,
-    `tests/ai/evaluate/test-data/${testDataName}`,
+    __dirname,
+    `../page-data/${testDataName}`,
   );
 
   return midsceneTestDataPath;
 
@@ -0,0 +1,32 @@
+{
+  "name": "evaluation",
+  "private": true,
+  "scripts": {
+    "update-page-data:headless": "playwright test ./data-generator/generator-headless.spec.ts",
+    "update-page-data:headed": "playwright test ./data-generator/generator-headed.spec.ts --headed",
+    "evaluate:inspect": "npx vitest --run tests/llm-inspect.test.ts",
+    "evaluate:inspect:update": "UPDATE_AI_DATA=true npm run evaluate:inspect",
+    "evaluate:assertion": "npx vitest --run tests/assertion.test.ts",
+    "evaluate:assertion:update": "UPDATE_AI_DATA=true npm run evaluate:assertion"
+  },
+  "dependencies": {
+    "@midscene/core": "workspace:*",
+    "@midscene/shared": "workspace:*",
+    "@midscene/web": "workspace:*"
+  },
+  "devDependencies": {
+    "dotenv": "16.4.5",
+    "playwright": "1.44.1",
+    "@playwright/test": "^1.44.1",
+    "typescript": "~5.0.4",
+    "vitest": "^1.6.0"
+  },
+  "engines": {
+    "node": ">=18.0.0"
+  },
+  "publishConfig": {
+    "access": "public",
+    "registry": "https://registry.npmjs.org"
+  },
+  "license": "MIT"
+}
@@ -1,5 +1,5 @@
 {
-  "testDataPath": "test-data/online_order",
+  "testDataPath": "online_order",
   "testCases": [
     {
       "prompt": "there are three tabs in the page, named 'Menu', 'Reviews', 'Merchant'",
@@ -26,4 +26,4 @@
       "expected": false
     }
   ]
-}
+}
@@ -1,5 +1,5 @@
 {
-  "testDataPath": "test-data/aweme-login",
+  "testDataPath": "aweme-login",
   "testCases": [
     {
       "prompt": "密码登录",
@@ -72,4 +72,4 @@
       ]
     }
   ]
-}
+}
Original file line number	Diff line number	Diff line change
`@@ -1,5 +1,5 @@`
`1`	`1`	`{`
`2`		`- "testDataPath": "test-data/online_order",`
	`2`	`+ "testDataPath": "online_order",`
`3`	`3`	`"testCases": [`
`4`	`4`	`{`
`5`	`5`	`"prompt": "there are three tabs in the page, named 'Menu', 'Reviews', 'Merchant'",`
`@@ -26,4 +26,4 @@`
`26`	`26`	`"expected": false`
`27`	`27`	`}`
`28`	`28`	`]`
`29`		`-}`
	`29`	`+}`
Original file line number	Diff line number	Diff line change
`@@ -1,5 +1,5 @@`
`1`	`1`	`{`
`2`		`- "testDataPath": "test-data/aweme-login",`
	`2`	`+ "testDataPath": "aweme-login",`
`3`	`3`	`"testCases": [`
`4`	`4`	`{`
`5`	`5`	`"prompt": "密码登录",`
`@@ -72,4 +72,4 @@`
`72`	`72`	`]`
`73`	`73`	`}`
`74`	`74`	`]`
`75`		`-}`
	`75`	`+}`