-
Notifications
You must be signed in to change notification settings - Fork 0
【Prompt改进】1. JCR分类;2. 意译操作;3. 输出多个版本进行对比分析并整合最优版;4. zero-shot改良版——深呼吸然后逐步思考 #9
Description
Step 1:文章总结
Objective & Output Specification (明确分类方式采用JCR分类)
Hierarchical Category: Assign a hierarchical category according to the JCR Category (the ) to which the article pertains. Denote each successive level of the hierarchical category with the symbol ">" inside the XML label <category>.
【改进前】
Science & Technology>Research Ethics>Data Integrity
【改进后】
Social Sciences;Ethics in Research
Step 2:文章翻译
技能(强调意译操作)
- 擅长把{{文章类型}}从英文翻译为中文。
- 熟悉Markdown和XML格式。
- 擅长英译汉的意译技巧,能够根据中文表达习惯和文化特点,增添、删减、修改字词或语句顺序,使最终翻译文本更地道、更贴合中文语境。
【改进前】
或许人们希望篡改和捏造数据是罕见的,但最近在荷兰进行的一项大规模调查显示,其患病率约为4%。数据捏造也可能发生在较小的范围内。
想象一下为一项研究收集数据。作为研究的一部分,您的任务是询问参与者的年龄和性别,以便在描述样本时报告人口统计学数据。在收集所有数据后,您注意到忘记为两个参与者收集人口统计数据。您可能会受到诱惑,根据您的记忆猜测这两个参与者的人口统计数据,以免在撰写人口统计信息时承认在数据收集过程中犯了一个错误。然而,这也构成了数据捏造。您应该透明地提到出现了一个错误。错误是难免的,重要的是要建立一种人们能够承认错误的文化,这样我们就可以从中学到并在将来防止它们。
【改进后 】
或许人们希望篡改和捏造很少发生,但荷兰最近的一项大规模调查显示其发生率约为4%。数据捏造也可能发生在较小的范围内。
想象一下为一项研究收集数据。作为研究的一部分,您的任务是询问参与者的年龄和性别,以在描述样本时报告人口统计学数据。在收集了所有数据后,您注意到忘记了为两个个体收集人口统计数据。您可能会受到诱惑,根据您的记忆猜测这两个个体的人口统计数据,以免在编写人口统计信息时承认数据收集中出现错误。然而,这也构成了数据捏造。您应该坦率地提到发生了错误。错误是难免的,重要的是创造一种人们能够承认错误的文化,这样我们就可以从中学到并防止将来发生类似情况。
任务描述(输出多个结果进行对比分析和最优整合)
2.请根据上一步你获得的背景信息,翻译我前一个输入中的标签<article>内的文章内容**,采用直译、意译、扩展化翻译、精简化翻译方式,输出4种翻译结果。
3.请逐字对比你在上一步中得到的4种翻译结果,分点列举每种结果的优势和劣势。
4.请根据上一步你的对比分析结果,整合出一版最能传达原文的语气、情感,在中文文化中更通顺、自然、贴切的翻译文本,然后输出这一翻译结果。这一步骤对我非常关键,请一定要认真比对并修改。**
输出规范(zero-shot改良版)
4. 请深呼吸,然后逐步思考,并依次输出任务描述中的任务2、任务3和任务4。
Yang, C., Wang, X., Lu, Y., Liu, H., V.Le, Q., Zhou, D., & Chen, X. (2023). Large Language Models as Optimizers. Google DeepMind
【改进前】
或许人们希望篡改和捏造数据是罕见的,但最近在荷兰进行的一项大规模调查显示,其患病率约为4%。数据捏造也可能发生在较小的范围内。
想象一下为一项研究收集数据。作为研究的一部分,您的任务是询问参与者的年龄和性别,以便在描述样本时报告人口统计学数据。在收集所有数据后,您注意到忘记为两个参与者收集人口统计数据。您可能会受到诱惑,根据您的记忆猜测这两个参与者的人口统计数据,以免在撰写人口统计信息时承认在数据收集过程中犯了一个错误。然而,这也构成了数据捏造。您应该透明地提到出现了一个错误。错误是难免的,重要的是要建立一种人们能够承认错误的文化,这样我们就可以从中学到并在将来防止它们。
【改进后】
或许篡改和制造数据的情况并不常见,但最近在荷兰进行的一项大规模调查估计其普遍性约为4%。值得注意的是,数据制造也可能在规模较小的研究中发生。
让我们想象一下,作为一项研究的一部分,您的任务是询问参与者的年龄和性别,以在描述样本时报告人口统计数据。在收集了所有数据后,您突然意识到忘记为两位参与者收集人口统计数据。您可能会试图根据记忆猜测这两个人的统计数据,以避免在撰写人口统计信息时承认错误。然而,这也属于数据制造。更好的做法是坦率承认错误,因为错误是不可避免的,建立一个坦诚文化有助于从中吸取教训,预防未来错误。
小结
- 改进目的:之前发现对于相同的prompt,翻译结果时好时坏,具有随机性。因此,希望要求GPT输出多个版本,然后自行比较不同版本的优劣并进行整合,最终输出一个最优版本,从而减少人工整合的工作。
- 改进效果:在一定程度上实现了目的,但输出结果仍然具有随机性,整合版本还是会存在一些问题。
- 可能的原因:同时输出4种翻译可能会让GPT固执第一次输出的结果,导致4个版本差别不大?对比分析部分仅分析优势劣势太过笼统,需要详细分析每个结果的翻译亮点或不足?