Support "write-test" task for Rust

bauersimon · bauersimon · commit 81bc339904d8 · 2025-04-28T14:45:01.000+02:00
Requires special handling for languages that have their tests within implementation files Part of #448
diff --git a/cmd/eval-dev-quality/cmd/evaluate.go b/cmd/eval-dev-quality/cmd/evaluate.go
@@ -27,6 +27,7 @@ import (
 	_ "github.com/symflower/eval-dev-quality/language/golang" // Register language.
 	_ "github.com/symflower/eval-dev-quality/language/java"   // Register language.
 	_ "github.com/symflower/eval-dev-quality/language/ruby"   // Register language.
+	_ "github.com/symflower/eval-dev-quality/language/rust"   // Register language.
 	"github.com/symflower/eval-dev-quality/log"
 	"github.com/symflower/eval-dev-quality/model"
 	"github.com/symflower/eval-dev-quality/model/llm"
diff --git a/evaluate/task/test-integration/task_test.go b/evaluate/task/test-integration/task_test.go
@@ -3,18 +3,25 @@ package testintegration
 import (
 	"path/filepath"
 	"testing"
+	"time"
 
 	"github.com/stretchr/testify/assert"
+	"github.com/stretchr/testify/mock"
 	"github.com/stretchr/testify/require"
 	"github.com/symflower/eval-dev-quality/evaluate/metrics"
 	evaluatetask "github.com/symflower/eval-dev-quality/evaluate/task"
 	tasktesting "github.com/symflower/eval-dev-quality/evaluate/task/testing"
 	"github.com/symflower/eval-dev-quality/language/golang"
+	"github.com/symflower/eval-dev-quality/language/rust"
 	"github.com/symflower/eval-dev-quality/log"
+	"github.com/symflower/eval-dev-quality/model/llm"
 	"github.com/symflower/eval-dev-quality/model/symflower"
+	"github.com/symflower/eval-dev-quality/provider"
+	providertesting "github.com/symflower/eval-dev-quality/provider/testing"
 	evaltask "github.com/symflower/eval-dev-quality/task"
 	"github.com/symflower/eval-dev-quality/tools"
 	toolstesting "github.com/symflower/eval-dev-quality/tools/testing"
+	"github.com/zimmski/osutil/bytesutil"
 )
 
 func TestWriteTestsRun(t *testing.T) {
@@ -93,4 +100,82 @@ func TestWriteTestsRun(t *testing.T) {
 			assert.Contains(t, data, "msg=\"evaluated model\" model=symflower/symbolic-execution")
 		},
 	})
+	{
+		mockProvider := providertesting.NewMockQuery(t)
+		mockProvider.On("Query", mock.Anything, mock.Anything, mock.Anything).Return(
+			&provider.QueryResult{
+				Message: bytesutil.StringTrimIndentations(`
+					` + "```rust`" + `
+					#[cfg(test)]
+					mod tests {
+						use super::*;
+
+						#[test]
+						fn test_plain() {
+							plain();
+						}
+					}
+					` + "```" + `
+				`),
+			},
+			nil,
+		).After(100 * time.Millisecond)
+		model := llm.NewModel(mockProvider, "model")
+		validate(t, &tasktesting.TestCaseTask{
+			Name: "Rust",
+
+			Model:          model,
+			Language:       &rust.Language{},
+			TestDataPath:   filepath.Join("..", "..", "..", "testdata"),
+			RepositoryPath: filepath.Join("rust", "plain"),
+
+			ExpectedRepositoryAssessment: map[string]map[evaltask.Identifier]metrics.Assessments{
+				filepath.Join("src", "lib.rs"): {
+					evaluatetask.IdentifierWriteTests: metrics.Assessments{
+						metrics.AssessmentKeyGenerateTestsForFileCharacterCount: 84,
+						metrics.AssessmentKeyResponseCharacterCount:             98,
+						metrics.AssessmentKeyCoverage:                           0, // TODO Get coverage.
+						metrics.AssessmentKeyFilesExecuted:                      1,
+						metrics.AssessmentKeyFilesExecutedMaximumReachable:      1,
+						metrics.AssessmentKeyResponseNoError:                    1,
+						metrics.AssessmentKeyResponseNoExcess:                   1,
+						metrics.AssessmentKeyResponseWithCode:                   1,
+					},
+					evaluatetask.IdentifierWriteTestsSymflowerFix: metrics.Assessments{
+						metrics.AssessmentKeyGenerateTestsForFileCharacterCount: 84,
+						metrics.AssessmentKeyResponseCharacterCount:             98,
+						metrics.AssessmentKeyCoverage:                           0, // TODO Get coverage.
+						metrics.AssessmentKeyFilesExecuted:                      1,
+						metrics.AssessmentKeyFilesExecutedMaximumReachable:      1,
+						metrics.AssessmentKeyResponseNoError:                    1,
+						metrics.AssessmentKeyResponseNoExcess:                   1,
+						metrics.AssessmentKeyResponseWithCode:                   1,
+					},
+					evaluatetask.IdentifierWriteTestsSymflowerTemplate: metrics.Assessments{
+						metrics.AssessmentKeyGenerateTestsForFileCharacterCount: 84,
+						metrics.AssessmentKeyResponseCharacterCount:             98,
+						metrics.AssessmentKeyCoverage:                           0, // TODO Get coverage.
+						metrics.AssessmentKeyFilesExecuted:                      1,
+						metrics.AssessmentKeyFilesExecutedMaximumReachable:      1,
+						metrics.AssessmentKeyResponseNoError:                    1,
+						metrics.AssessmentKeyResponseNoExcess:                   1,
+						metrics.AssessmentKeyResponseWithCode:                   1,
+					},
+					evaluatetask.IdentifierWriteTestsSymflowerTemplateSymflowerFix: metrics.Assessments{
+						metrics.AssessmentKeyGenerateTestsForFileCharacterCount: 84,
+						metrics.AssessmentKeyResponseCharacterCount:             98,
+						metrics.AssessmentKeyCoverage:                           0, // TODO Get coverage.
+						metrics.AssessmentKeyFilesExecuted:                      1,
+						metrics.AssessmentKeyFilesExecutedMaximumReachable:      1,
+						metrics.AssessmentKeyResponseNoError:                    1,
+						metrics.AssessmentKeyResponseNoExcess:                   1,
+						metrics.AssessmentKeyResponseWithCode:                   1,
+					},
+				},
+			},
+			ValidateLog: func(t *testing.T, data string) {
+				assert.Contains(t, data, "test result: ok. 1 passed; 0 failed; 0 ignored; 0 measured; 0 filtered out;")
+			},
+		})
+	}
 }
diff --git a/evaluate/task/write-test.go b/evaluate/task/write-test.go
@@ -175,10 +175,10 @@ func validateWriteTestsRepository(logger *log.Logger, repositoryPath string, lan
 	var sourceFiles []string
 	var testFiles []string
 	for _, file := range files {
-		if strings.HasSuffix(file, language.DefaultTestFileSuffix()) {
-			testFiles = append(testFiles, file)
-		} else if strings.HasSuffix(file, language.DefaultFileExtension()) {
+		if strings.HasSuffix(file, language.DefaultFileExtension()) { // For languages where source file == test file, assume we are collecting source files by default.
 			sourceFiles = append(sourceFiles, file)
+		} else if strings.HasSuffix(file, language.DefaultTestFileSuffix()) {
+			testFiles = append(testFiles, file)
 		}
 	}
 
diff --git a/language/rust/language.go b/language/rust/language.go
@@ -76,7 +76,7 @@ func (l *Language) ExecuteTests(logger *log.Logger, repositoryPath string) (test
 	commandOutput, err := util.CommandWithResult(context.Background(), logger, &util.Command{
 		Command: []string{ // TODO Move this to `symflower test` to get coverage information.
 			"cargo",
-			"test",
+			"cargo-llvm-cov",
 		},
 
 		Directory: repositoryPath,
diff --git a/model/llm/llm.go b/model/llm/llm.go
@@ -2,6 +2,7 @@ package llm
 
 import (
 	"context"
+	"errors"
 	"os"
 	"path/filepath"
 	"strings"
@@ -145,7 +146,7 @@ type llmWriteTestSourceFilePromptContext struct {
 
 // llmWriteTestForFilePromptTemplate is the template for generating an LLM test generation prompt.
 var llmWriteTestForFilePromptTemplate = template.Must(template.New("model-llm-write-test-for-file-prompt").Parse(bytesutil.StringTrimIndentations(`
-	Given the following {{ .Language.Name }} code file "{{ .FilePath }}" with package "{{ .ImportPath }}", provide a test file for this code{{ with .TestFramework }} with {{ . }} as a test framework{{ end }}.
+	Given the following {{ .Language.Name }} code file "{{ .FilePath }}" {{- with .ImportPath }} with package "{{ . }}" {{- end }}, provide {{- if .Language.HasTestsInSource }} tests {{ else }} a test file {{ end -}} for this code{{ with .TestFramework }} with {{ . }} as a test framework{{ end }}.
 	The tests should produce 100 percent code coverage and must compile.
 	The response must contain only the test code in a fenced code block and nothing else.
 
@@ -328,7 +329,7 @@ func (m *Model) WriteTests(ctx model.Context) (assessment metrics.Assessments, e
 
 	filePath := filepath.Join(ctx.RepositoryPath, ctx.Language.TestFilePath(ctx.RepositoryPath, ctx.FilePath))
 
-	return handleQueryResult(queryResult, filePath)
+	return handleQueryResult(queryResult, filePath, ctx.Language.HasTestsInSource())
 }
 
 func (m *Model) query(logger *log.Logger, request string) (queryResult *provider.QueryResult, err error) {
@@ -413,7 +414,7 @@ func (m *Model) RepairCode(ctx model.Context) (assessment metrics.Assessments, e
 		return nil, pkgerrors.WithStack(err)
 	}
 
-	return handleQueryResult(queryResult, filepath.Join(ctx.RepositoryPath, ctx.FilePath))
+	return handleQueryResult(queryResult, filepath.Join(ctx.RepositoryPath, ctx.FilePath), false)
 }
 
 var _ model.CapabilityTranspile = (*Model)(nil)
@@ -460,7 +461,7 @@ func (m *Model) Transpile(ctx model.Context) (assessment metrics.Assessments, er
 		return nil, pkgerrors.WithStack(err)
 	}
 
-	return handleQueryResult(queryResult, filepath.Join(ctx.RepositoryPath, ctx.FilePath))
+	return handleQueryResult(queryResult, filepath.Join(ctx.RepositoryPath, ctx.FilePath), false)
 }
 
 var _ model.CapabilityMigrate = (*Model)(nil)
@@ -500,10 +501,10 @@ func (m *Model) Migrate(ctx model.Context) (assessment metrics.Assessments, err
 		return nil, pkgerrors.WithStack(err)
 	}
 
-	return handleQueryResult(queryResult, filepath.Join(ctx.RepositoryPath, ctx.FilePath))
+	return handleQueryResult(queryResult, filepath.Join(ctx.RepositoryPath, ctx.FilePath), false)
 }
 
-func handleQueryResult(queryResult *provider.QueryResult, filePathAbsolute string) (assessment metrics.Assessments, err error) {
+func handleQueryResult(queryResult *provider.QueryResult, filePathAbsolute string, appendFile bool) (assessment metrics.Assessments, err error) {
 	assessment, sourceFileContent, err := prompt.ParseResponse(queryResult.Message)
 	if err != nil {
 		return nil, pkgerrors.WithStack(err)
@@ -526,7 +527,21 @@ func handleQueryResult(queryResult *provider.QueryResult, filePathAbsolute strin
 	if err := os.MkdirAll(filepath.Dir(filePathAbsolute), 0755); err != nil {
 		return nil, pkgerrors.WithStack(err)
 	}
-	if err := os.WriteFile(filePathAbsolute, []byte(sourceFileContent), 0644); err != nil {
+
+	flags := os.O_WRONLY | os.O_CREATE
+	if appendFile {
+		flags = flags | os.O_APPEND
+	}
+	file, err := os.OpenFile(filePathAbsolute, flags, 0644)
+	if err != nil {
+		return nil, pkgerrors.WithStack(err)
+	}
+	defer func() {
+		if closeErr := file.Close(); closeErr != nil {
+			err = errors.Join(err, pkgerrors.WithStack(closeErr))
+		}
+	}()
+	if _, err := file.WriteString(sourceFileContent); err != nil {
 		return nil, pkgerrors.WithStack(err)
 	}
 
diff --git a/model/llm/llm_test.go b/model/llm/llm_test.go
@@ -21,6 +21,7 @@ import (
 	"github.com/symflower/eval-dev-quality/language"
 	"github.com/symflower/eval-dev-quality/language/golang"
 	"github.com/symflower/eval-dev-quality/language/java"
+	"github.com/symflower/eval-dev-quality/language/rust"
 	"github.com/symflower/eval-dev-quality/log"
 	"github.com/symflower/eval-dev-quality/model"
 	"github.com/symflower/eval-dev-quality/provider"
@@ -654,6 +655,68 @@ func TestFormatPromptContext(t *testing.T) {
 				` + "```" + `
 			`),
 		})
+
+		validate(t, &testCase{
+			Name: "No Import path",
+
+			Context: &llmWriteTestSourceFilePromptContext{
+				llmSourceFilePromptContext: llmSourceFilePromptContext{
+					Language: &golang.Language{},
+
+					Code: bytesutil.StringTrimIndentations(`
+						package increment
+
+						func increment(i int) int
+							return i + 1
+						}
+					`),
+					FilePath:   filepath.Join("path", "to", "increment.go"),
+					ImportPath: "",
+				},
+			},
+
+			ExpectedMessage: bytesutil.StringTrimIndentations(`
+				Given the following Go code file "path/to/increment.go", provide a test file for this code.
+				The tests should produce 100 percent code coverage and must compile.
+				The response must contain only the test code in a fenced code block and nothing else.
+
+				` + "```" + `golang
+				package increment
+
+				func increment(i int) int
+					return i + 1
+				}
+				` + "```" + `
+			`),
+		})
+
+		validate(t, &testCase{
+			Name: "Tests in source file",
+
+			Context: &llmWriteTestSourceFilePromptContext{
+				llmSourceFilePromptContext: llmSourceFilePromptContext{
+					Language: &rust.Language{},
+
+					Code: bytesutil.StringTrimIndentations(`
+						fn main() {
+						}
+					`),
+					FilePath:   filepath.Join("path", "to", "main.rs"),
+					ImportPath: "",
+				},
+			},
+
+			ExpectedMessage: bytesutil.StringTrimIndentations(`
+				Given the following Rust code file "path/to/main.rs", provide tests for this code.
+				The tests should produce 100 percent code coverage and must compile.
+				The response must contain only the test code in a fenced code block and nothing else.
+
+				` + "```" + `rust
+				fn main() {
+				}
+				` + "```" + `
+			`),
+		})
 	})
 
 	validate(t, &testCase{

Original file line number	Diff line number	Diff line change
`@@ -175,10 +175,10 @@ func validateWriteTestsRepository(logger *log.Logger, repositoryPath string, lan`
`175`	`175`	`var sourceFiles []string`
`176`	`176`	`var testFiles []string`
`177`	`177`	`for _, file := range files {`
`178`		`- if strings.HasSuffix(file, language.DefaultTestFileSuffix()) {`
`179`		`- testFiles = append(testFiles, file)`
`180`		`- } else if strings.HasSuffix(file, language.DefaultFileExtension()) {`
	`178`	`+ if strings.HasSuffix(file, language.DefaultFileExtension()) { // For languages where source file == test file, assume we are collecting source files by default.`
`181`	`179`	`sourceFiles = append(sourceFiles, file)`
	`180`	`+ } else if strings.HasSuffix(file, language.DefaultTestFileSuffix()) {`
	`181`	`+ testFiles = append(testFiles, file)`
`182`	`182`	`}`
`183`	`183`	`}`
`184`	`184`