芬蘭大嫂終于成功抵達(dá)中國實(shí)現(xiàn)中國夢!剛下飛機(jī)就目瞪口呆狂拍照片!北京小吃爆笑初體驗(yàn)開心炸裂!
為了看酒桶的方腳趾!我和國外作者建立了lol全英雄模型網(wǎng)站(中文)!
單位年會(huì),領(lǐng)導(dǎo)讓你采購水果,并暗示你去他指定的一家去采購,但那家水果店水果經(jīng)常積壓不新鮮,你怎么辦?
希望任何看完這個(gè)系列教程的人都能掌握撰寫生產(chǎn)級(jí)提示詞的方法,再也不用尋找零碎的知識(shí)點(diǎn)!
理解提示詞:AI的指令語言
什么是提示詞?
在人工智能的語境中,提示詞(Prompt)是用戶提供給模型的、用以引導(dǎo)其生成特定響應(yīng)的輸入文本。它可以是簡單的問題、一串關(guān)鍵詞,也可以是包含復(fù)雜說明、上下文信息乃至代碼片段的詳細(xì)指令
從本質(zhì)上講,提示詞是我們與生成式AI模型進(jìn)行溝通和下達(dá)任務(wù)的“自然語言”。
一個(gè)設(shè)計(jì)精良的提示詞通常可以包含以下四種核心要素:
指令(Instruction):明確告知模型需要執(zhí)行的具體任務(wù)。例如,“總結(jié)以下文章”、“將這段文字分類為正面、中性或負(fù)面”、“生成一封營銷郵件”。
上下文(Context):提供背景信息或外部知識(shí),幫助模型更好地理解任務(wù)情境,從而生成更具相關(guān)性的回答。例如,在要求模型撰寫報(bào)告時(shí),提供目標(biāo)受眾的背景信息(“這份報(bào)告的讀者是沒有任何技術(shù)背景的投資人”)。
輸入數(shù)據(jù)(InputData):模型需要處理的具體內(nèi)容。例如,需要被總結(jié)的文章全文,或是需要被分類的用戶評論。
輸出指示(OutputIndicator):指定模型輸出內(nèi)容的類型、格式或風(fēng)格。例如,“請以JSON格式返回結(jié)果”、“回答應(yīng)使用項(xiàng)目符號(hào)列表”、“語氣應(yīng)保持專業(yè)和嚴(yán)謹(jǐn)”。
并非所有提示詞都必須包含全部四要素,其具體構(gòu)成取決于任務(wù)的復(fù)雜度和需求(5)。然而,理解這些構(gòu)成要素,是系統(tǒng)化設(shè)計(jì)高效提示詞的第一步。
為什么設(shè)計(jì)高質(zhì)量的提示詞至關(guān)重要?
提示詞的質(zhì)量直接決定了AI輸出內(nèi)容的質(zhì)量、相關(guān)性和準(zhǔn)確性。在實(shí)際應(yīng)用場景中,這一點(diǎn)尤為關(guān)鍵。
一個(gè)模糊或結(jié)構(gòu)不佳的提示詞可能導(dǎo)致模型產(chǎn)生不一致、偏離主題甚至事實(shí)錯(cuò)誤的輸出(即“幻覺”),這對于依賴AI提供穩(wěn)定服務(wù)的產(chǎn)品而言是不可接受的。
相反,一個(gè)精心設(shè)計(jì)的提示詞,就如同為AI助手提供了一份清晰的工作說明書,能夠有效地引導(dǎo)模型,使其產(chǎn)出符合預(yù)期的、高質(zhì)量且可靠的結(jié)果。
這不僅能提升用戶體驗(yàn),還能顯著降低因AI輸出錯(cuò)誤而產(chǎn)生的業(yè)務(wù)風(fēng)險(xiǎn)和后期人工修正成本。因此,掌握提示詞撰寫技巧,意味著掌握了精確控制和利用AI能力的鑰匙。
提示詞的兩種類型
在實(shí)踐中,我們可以將提示詞分為兩大類:日常對話提示詞和生產(chǎn)級(jí)提示詞。
理解二者的區(qū)別,是產(chǎn)品和業(yè)務(wù)人員從AI的普通使用者轉(zhuǎn)變?yōu)閷I(yè)AI應(yīng)用設(shè)計(jì)者的關(guān)鍵一步。
1)日常對話提示詞
這類提示詞是我們?nèi)粘EcChatGPT等聊天機(jī)器人互動(dòng)時(shí)使用的、非結(jié)構(gòu)化的、即興的自然語言查詢。例如,“給我推薦幾部科幻電影”或“解釋一下什么是黑洞”。這類提示詞的特點(diǎn)是簡單、直接,依賴于模型龐大的預(yù)訓(xùn)練知識(shí)庫進(jìn)行回答。它們非常適合探索性、非正式的知識(shí)獲取和娛樂場景。
2)生產(chǎn)級(jí)提示詞
生產(chǎn)級(jí)提示詞是為集成在軟件應(yīng)用或業(yè)務(wù)流程中而專門設(shè)計(jì)的,其首要目標(biāo)是確保輸出的可靠性、一致性和可擴(kuò)展性。
與日常對話提示詞的根本區(qū)別在于,生產(chǎn)級(jí)提示詞是一種經(jīng)過“工程化”設(shè)計(jì)的指令,它必須在各種輸入條件下都能穩(wěn)定地產(chǎn)生可預(yù)測的、符合格式要求的輸出。
一個(gè)核心的認(rèn)知轉(zhuǎn)變在于:
日常對話是一種“交談”,而生產(chǎn)級(jí)應(yīng)用是一種“指令”。
專業(yè)應(yīng)用無法承受AI“看心情”式的回答,它要求的是每一次服務(wù)都達(dá)到可預(yù)期的標(biāo)準(zhǔn)。
生產(chǎn)級(jí)提示詞通過提供明確的角色、嚴(yán)格的規(guī)則、清晰的上下文和固定的輸出格式,極大地減少了模型解讀的模糊性,從而將AI的“創(chuàng)造力”約束在可控的業(yè)務(wù)框架內(nèi),使其成為一個(gè)穩(wěn)定可靠的自動(dòng)化工具。
生產(chǎn)級(jí)提示詞包含從需求定義到解決方案的閉環(huán)。因此,對于產(chǎn)品經(jīng)理而言,學(xué)習(xí)設(shè)計(jì)生產(chǎn)級(jí)提示詞,本質(zhì)上是學(xué)習(xí)如何將業(yè)務(wù)需求精確地轉(zhuǎn)化為AI能夠穩(wěn)定執(zhí)行的規(guī)范。
什么是提示詞工程?
1)定義與過程
提示詞工程(PromptEngineering)是一門新興的學(xué)科,它專注于開發(fā)和優(yōu)化提示詞,幫助用戶更有效地利用語言模型完成各種復(fù)雜的任務(wù)。
撰寫生產(chǎn)級(jí)提示詞的過程,就是提示詞工程的實(shí)踐。這個(gè)過程并非一蹴而就,而是一個(gè)類似于軟件開發(fā)或機(jī)器學(xué)習(xí)的迭代循環(huán)。
通常包括需求分析、初始設(shè)計(jì)、測試評估和持續(xù)優(yōu)化等環(huán)節(jié)。提示詞工程師需要彌合最終用戶需求與大型語言模型能力之間的鴻溝,通過不斷的實(shí)驗(yàn)和調(diào)整,找到能夠激發(fā)模型最佳性能的輸入文本組合。
2)提示詞工程的價(jià)值
對于企業(yè)而言,提示詞工程提供了一種比模型微調(diào)(Fine-tuning)更高效、更靈活地利用AI能力的方式。
成本與效率:模型微調(diào)需要對模型本身的參數(shù)進(jìn)行重新訓(xùn)練,這個(gè)過程不僅需要海量的標(biāo)注數(shù)據(jù),而且計(jì)算成本高昂,周期漫長。而提示詞工程則是在不改變模型自身參數(shù)的前提下,通過優(yōu)化輸入指令來激發(fā)模型內(nèi)部已有的知識(shí)和能力。這使企業(yè)能夠以更低的成本、更快的速度進(jìn)行AI應(yīng)用的原型設(shè)計(jì)和功能迭代。
靈活性與可控性:提示詞可以被看作是應(yīng)用的“軟邏輯”,可以隨時(shí)進(jìn)行修改和部署,而無需重新訓(xùn)練整個(gè)模型。這種靈活性使得產(chǎn)品團(tuán)隊(duì)能夠快速響應(yīng)業(yè)務(wù)變化和用戶反饋,持續(xù)優(yōu)化AI功能。
掌握提示詞工程,意味著產(chǎn)品和業(yè)務(wù)團(tuán)隊(duì)獲得了直接塑造和控制AI行為的能力,能夠更快地將AI技術(shù)轉(zhuǎn)化為實(shí)實(shí)在在的商業(yè)價(jià)值。
如何設(shè)計(jì)生產(chǎn)級(jí)提示詞
設(shè)計(jì)生產(chǎn)級(jí)提示詞是一門兼具邏輯與創(chuàng)意的藝術(shù)。它要求我們像產(chǎn)品經(jīng)理規(guī)劃功能、像工程師設(shè)計(jì)架構(gòu)一樣,系統(tǒng)化地構(gòu)建與AI的溝通橋梁。本部分將深入探討提示詞的設(shè)計(jì)流程、常用框架和核心技巧,為產(chǎn)品和業(yè)務(wù)人員提供一套可復(fù)用的方法論。
提示詞設(shè)計(jì)流程:從需求到實(shí)現(xiàn)
一個(gè)成功的提示詞需要遵循嚴(yán)謹(jǐn)?shù)脑O(shè)計(jì)流程。我們可以將其類比為微型的產(chǎn)品開發(fā)周期,確保最終產(chǎn)出能夠精準(zhǔn)滿足業(yè)務(wù)需求。
第一步:需求分析(“Why”)
在動(dòng)筆之前,首先要清晰地定義業(yè)務(wù)目標(biāo)和用戶需求。問自己幾個(gè)關(guān)鍵問題:
我們要解決什么問題?(例如:降低客服響應(yīng)時(shí)間、提升營銷文案點(diǎn)擊率)
AI在這個(gè)流程中扮演什么角色?(例如:信息提取器、內(nèi)容生成器、決策分析)
一個(gè)“成功”的輸出是什么樣的?(定義成功輸出的標(biāo)準(zhǔn),例如:一份不超過300字、包含三個(gè)關(guān)鍵點(diǎn)的摘要;一個(gè)格式正確的JSON對象)
目標(biāo)用戶是誰?(例如:需要快速獲取信息的客服人員、尋求創(chuàng)意的市場專員)
這一步相當(dāng)于編寫產(chǎn)品需求文檔(PRD)或用戶故事,是整個(gè)設(shè)計(jì)過程的基石。
第二步:初始提示詞設(shè)計(jì)(“What”)
基于需求分析,草擬第一個(gè)版本的提示詞。此時(shí),應(yīng)有意識(shí)地包含之前提到的核心要素:
清晰的指令:明確任務(wù)。
必要的上下文:賦予AI角色或提供業(yè)務(wù)背景信息。
明確的輸出格式:告知AI你期望的結(jié)果是什么樣子。
第三步:測試與評估(“HowWell”)
使用一系列輸入數(shù)據(jù)來測試提示詞,這些數(shù)據(jù)應(yīng)覆蓋典型使用場景和潛在的邊緣情況。然后,根據(jù)第一步定義好的成功標(biāo)準(zhǔn)來評估AI的輸出。評估的維度將在后續(xù)筆記中具體介紹
第四步:迭代與優(yōu)化(”ImprovementLoop”)
根據(jù)測試結(jié)果,對提示詞進(jìn)行持續(xù)的優(yōu)化和精煉。這可能包括:調(diào)整措辭、增加或修改示例、強(qiáng)化約束條件、改變賦予的角色、甚至切換模型等。這是一個(gè)不斷循環(huán)的過程,直到提示詞在各種測試下都能穩(wěn)定地產(chǎn)生高質(zhì)量的輸出。
常用的提示詞撰寫框架
提示詞框架如同寫作的模板,它們提供了一種經(jīng)過驗(yàn)證的結(jié)構(gòu),幫助我們在設(shè)計(jì)提示詞時(shí)不遺漏關(guān)鍵信息,從而系統(tǒng)性地提升提示詞的質(zhì)量和穩(wěn)定性。
為了幫助產(chǎn)品和業(yè)務(wù)人員快速選擇合適的工具,下表對比了幾個(gè)主流的提示詞框架及其適用場景。
TAG框架:簡潔高效
TAG框架是最簡單直接的結(jié)構(gòu)之一,非常適合日常的快速任務(wù)定義。
T(Task-任務(wù)):你要AI做什么?(例如:“寫一篇關(guān)于人工智能的博客文章”)
A(Action-行動(dòng)):AI應(yīng)該如何執(zhí)行?(例如:“采用風(fēng)趣幽默且引人入勝的風(fēng)格”)
G(Goal-目標(biāo)):期望達(dá)成的最終目的是什么?(例如:“吸引對AI感興趣的初學(xué)者”)
APE框架:強(qiáng)調(diào)意圖
APE框架與TAG相似,但更側(cè)重于讓模型理解任務(wù)背后的“目的”,這有助于模型做出更智能的決策
A(Action-行動(dòng)):AI需要執(zhí)行的具體動(dòng)作。(例如:“分析這份客戶反饋報(bào)告”)
P(Purpose-目的):為什么要做這件事?(例如:“為了找出客戶流失的三個(gè)主要原因”)
E(Expectation-期望):期望的輸出格式或成果。(例如:“以項(xiàng)目符號(hào)列表的形式呈現(xiàn),并按重要性排序”)
COAST框架:應(yīng)對復(fù)雜戰(zhàn)略
當(dāng)面對需要綜合多個(gè)因素的復(fù)雜或戰(zhàn)略性任務(wù)時(shí),COAST框架提供了一個(gè)全面的思考結(jié)構(gòu)。
C(Context-背景):提供必要的背景信息。(例如:“我們公司第三季度的銷售額下降了15%”)
O(Objective-目標(biāo)):設(shè)定一個(gè)高層次的、可衡量的目標(biāo)。(例如:“第四季度的銷售額提升20%”)
A(Actions-行動(dòng)):模型需要考慮或執(zhí)行的步驟。(例如:“分析市場趨勢、提出三個(gè)營銷策略、評估每個(gè)策略的預(yù)算”)
S(Scenario-情景):描述具體的環(huán)境或情況。(例如:“我們正面臨兩個(gè)主要競爭對手的降價(jià)壓力”)
T(Task-任務(wù)):給AI下達(dá)的具體指令。(例如:“基于以上所有信息,為第四季度制定一份詳細(xì)的營銷計(jì)劃草案”)
LangGPT框架:構(gòu)建專屬AI智能體
LangGPT是一種高度結(jié)構(gòu)化的提示詞設(shè)計(jì)范式,它將提示詞設(shè)計(jì)類比為面向?qū)ο缶幊?,旨在?chuàng)建具有特定角色、規(guī)則和工作流程的、可復(fù)用的AI智能體。它通常使用Markdown格式,包含以下模塊
Role:定義AI的核心角色
Profile:描述角色的背景、專長和語言風(fēng)格
Rules:AI必須遵守的規(guī)則和約束
Workflow:AI與用戶交互或完成任務(wù)的步驟
Initialization:AI的開場白和引導(dǎo)語
例如,一個(gè)“唐代詩人”的LangGPT提示詞,會(huì)詳細(xì)定義其詩人身份、擅長的詩歌體裁(如七言律詩)、必須遵守的格律規(guī)則,以及如何與用戶互動(dòng)(要求用戶提供主題和形式)。這種框架非常適合構(gòu)建需要長期保持一致性和專業(yè)性的虛擬助手或?qū)<蚁到y(tǒng)。
核心提示詞技巧(重要)
掌握了框架之后,還需要一系列具體的技巧來進(jìn)一步打磨和優(yōu)化提示詞,以應(yīng)對不同的任務(wù)需求。
零樣本(Zero-shot)與少樣本(Few-shot)提示
零樣本提示:在不提供任何范例的情況下,直接要求模型完成任務(wù)。這完全依賴于模型在預(yù)訓(xùn)練階段學(xué)到的通用能力。
應(yīng)用:適用于任務(wù)簡單直接(如“翻譯‘你好’到英文”)、或快速驗(yàn)證一個(gè)AI功能概念的場景。
少樣本提示:在提示詞中提供一個(gè)或多個(gè)(通常不超過5個(gè))完整的任務(wù)范例(“shot”),向模型展示期望的輸入和輸出格式。這是一種強(qiáng)大的“情境學(xué)習(xí)”(In-contextLearning)技術(shù)。
應(yīng)用:當(dāng)需要強(qiáng)制模型遵循特定的輸出格式、語氣或風(fēng)格時(shí)極為有效。例如,在生成客服郵件時(shí),提供2-3個(gè)符合公司規(guī)范的郵件范例,能讓新生成的郵件質(zhì)量大幅提升。
提供范例是LLM這種模式匹配引擎最直接有效的引導(dǎo)方式之一。它將模糊的“指令”轉(zhuǎn)化為清晰的“模式”,極大地降低了模型“猜錯(cuò)”用戶意圖的概率,是產(chǎn)品經(jīng)理在不進(jìn)行代碼級(jí)開發(fā)的情況下提升AI性能的最有力工具。
分解(Decomposition)
分解,也稱為“提示鏈”(PromptChaining),是將一個(gè)復(fù)雜的大任務(wù)拆分成一系列更簡單、更小的子任務(wù),然后通過多個(gè)提示詞按順序完成。
任務(wù):分析一份冗長的年度財(cái)報(bào)。
提示詞1(提?。骸皬囊韵仑?cái)報(bào)文本中,提取所有關(guān)鍵財(cái)務(wù)數(shù)據(jù)(收入、利潤、現(xiàn)金流),并以JSON格式輸出?!?/p>
提示詞2(分析):“基于以下財(cái)務(wù)數(shù)據(jù),識(shí)別出三大主要財(cái)務(wù)風(fēng)險(xiǎn)?!?/p>
提示詞3(生成):“根據(jù)識(shí)別出的財(cái)務(wù)風(fēng)險(xiǎn),草擬一封給管理層的預(yù)警郵件。”
這種方法降低了單次任務(wù)的復(fù)雜度,讓模型能更專注、更準(zhǔn)確地完成每一步。
角色提示(RolePrompting)
即賦予AI一個(gè)特定的身份或?qū)<医巧纭澳闶且晃粨碛?0年經(jīng)驗(yàn)的營銷總監(jiān)”或“假設(shè)你是一名嚴(yán)謹(jǐn)?shù)姆深檰枴薄?/p>
作用原理:角色提示為模型提供了強(qiáng)大的上下文,能夠激活其知識(shí)庫中與該角色最相關(guān)的部分,從而使其輸出的語氣、風(fēng)格和專業(yè)知識(shí)更符合預(yù)期。
技巧:角色的定義越具體越好?!澳闶且幻麛?shù)據(jù)科學(xué)家”是好的開始,但“你是一名專注于B2BSaaS領(lǐng)域客戶流失預(yù)警模型的數(shù)據(jù)科學(xué)家”則能帶來更精準(zhǔn)的輸出。
思維鏈(ChainofThought,CoT)
這是一種引導(dǎo)模型在給出最終答案前,先展示其“思考過程”的技術(shù)。通過在提示詞中加入“讓我們一步一步地思考”或提供包含推理步驟的范例,可以顯著提升模型在邏輯推理、算術(shù)和復(fù)雜問題解決上的準(zhǔn)確性。
商業(yè)應(yīng)用:解決一個(gè)多步驟的計(jì)算問題,如“A套餐每月50元,含1000分鐘通話,超出部分每分鐘0.1美元。B套餐每月70元,不限通話。如果客戶上月通話1200分鐘,哪個(gè)套餐更劃算?”使用CoT,模型會(huì)先計(jì)算A套餐的總費(fèi)用,再與B套餐比較,最后給出結(jié)論,過程清晰且不易出錯(cuò)。
零樣本CoT:一個(gè)非常實(shí)用的技巧,只需在你的問題后加上一句“讓我們一步一步地思考”(Let’sthinkstep-by-step),就能在不提供范例的情況下,有效激發(fā)模型的推理能力。
需要注意的是:隨著推理模型的普及,這種提示技巧的必要性可能在下降
思維樹(TreeofThoughts,ToT)
ToT是CoT的進(jìn)階版。當(dāng)一個(gè)問題存在多個(gè)可能的解決路徑時(shí),ToT允許模型同時(shí)探索多個(gè)“思維分支”,對每個(gè)分支進(jìn)行評估,甚至在發(fā)現(xiàn)某個(gè)分支是死胡同時(shí)進(jìn)行“回溯”,轉(zhuǎn)而探索其他路徑。
應(yīng)用:進(jìn)行戰(zhàn)略規(guī)劃或頭腦風(fēng)暴。例如:“為我們的新產(chǎn)品制定上市策略。請從‘線上營銷’、‘線下活動(dòng)’和‘渠道合作’三個(gè)方向進(jìn)行探索,并分別評估每個(gè)方向的優(yōu)缺點(diǎn)和潛在風(fēng)險(xiǎn)?!蹦P蜁?huì)將這三個(gè)方向作為不同的分支進(jìn)行深入思考。
自我批評(Self-Criticism/Reflexion)
這是一種讓模型對其自身的輸出進(jìn)行評估和改進(jìn)的技術(shù)。在模型生成初步答案后,可以追加一個(gè)提示詞,如:“請檢查你剛才的回答。是否存在事實(shí)錯(cuò)誤?邏輯是否嚴(yán)謹(jǐn)?有哪些可以改進(jìn)的地方?”這利用了模型強(qiáng)大的文本分析能力來優(yōu)化其自身的生成能力。
負(fù)面約束
明確告知模型不要做什么。例如,“回答中不要包含任何技術(shù)術(shù)語”或“在生成的文案中,禁止使用‘革命性’、‘顛覆性’等夸大詞匯”。這個(gè)技巧在使用得當(dāng)?shù)那闆r下,能非常有效地對輸出內(nèi)容進(jìn)行“塑形”,確保其符合特定的溝通規(guī)范。
一些需要根據(jù)使用場景具體分析的技巧:
負(fù)面約束:具體效果不一定好,也不一定不好。過多或復(fù)雜的負(fù)面約束可能會(huì)讓模型感到困惑,導(dǎo)致性能下降。建議保持負(fù)面約束的簡潔和明確。
角色提示:在需要生成創(chuàng)造性內(nèi)容或模仿特定風(fēng)格的任務(wù)中(如寫營銷文案、扮演客服),角色提示效果較好。但在純粹要求事實(shí)準(zhǔn)確性的任務(wù)中(如從文本中提取數(shù)據(jù)),其作用相對有限,清晰的指令和輸出格式定義更為重要。
關(guān)鍵參數(shù):微調(diào)AI的風(fēng)格
除了優(yōu)化提示詞文本,調(diào)整模型的生成參數(shù)也是提示詞工程的重要一環(huán)。對于產(chǎn)品和業(yè)務(wù)人員來說,可以將這些參數(shù)理解為控制AI輸出風(fēng)格的旋鈕。
Temperature(溫度)
定義:Temperature控制著模型生成下一個(gè)詞時(shí)的隨機(jī)性程度。
一個(gè)較低的溫度值(如0.2)會(huì)使得模型更傾向于選擇概率最高的詞,從而產(chǎn)生更可預(yù)測、更保守的文本。一個(gè)較高的溫度值(如0.8或更高)則會(huì)“拉平”詞語間的概率差異,讓概率較低的詞也有機(jī)會(huì)被選中,從而產(chǎn)生更多樣、更具創(chuàng)造性甚至出人意料的文本。
在提示詞設(shè)計(jì)中的應(yīng)用:
創(chuàng)意任務(wù):當(dāng)你的目標(biāo)是進(jìn)行頭腦風(fēng)暴、撰寫營銷文案或創(chuàng)作故事時(shí),可以調(diào)高溫度(例如0.8-1.0),以激發(fā)模型的創(chuàng)造力。
事實(shí)性任務(wù):當(dāng)你的目標(biāo)是獲取準(zhǔn)確的事實(shí)、進(jìn)行文本摘要或生成代碼時(shí),應(yīng)調(diào)低溫度(例如0.2-0.5),以減少模型“自由發(fā)揮”導(dǎo)致的事實(shí)錯(cuò)誤。
Top-p(核采樣)
定義:Top-p,也稱核采樣(NucleusSampling),是一種動(dòng)態(tài)控制詞匯選擇范圍的方法。它設(shè)定一個(gè)概率閾值p(如0.9),模型會(huì)從輸出概率最高的詞開始,不斷累加它們的概率,直到總和達(dá)到p為止,然后模型只從這個(gè)“核心”(nucleus)詞匯集中進(jìn)行抽樣。
與Top-k固定數(shù)量不同,Top-p的詞匯集大小是動(dòng)態(tài)變化的,模型越確定,詞匯集越??;模型越不確定,詞匯集越大。
在提示詞設(shè)計(jì)中的應(yīng)用:
平衡生成:Top-p通常被認(rèn)為是比Temperature更優(yōu)的控制方法,因?yàn)樗饶鼙苊膺x擇那些概率極低的離譜詞匯,又能根據(jù)上下文的確定性動(dòng)態(tài)調(diào)整創(chuàng)造力。一個(gè)常用的值是0.9到0.95之間,這能在保證連貫性的前提下,提供良好的多樣性。
精細(xì)調(diào)優(yōu):對于需要高度連貫性的對話機(jī)器人或問答系統(tǒng),可以適當(dāng)降低Top-p(如0.8),以使其回答更聚焦。
Top-k
定義:Top-k是最簡單的采樣控制方法。它直接限制模型在生成下一個(gè)詞時(shí),只能從概率最高的k個(gè)詞中進(jìn)行選擇。例如,設(shè)置Top-k為10,模型無論面對什么情況,都只會(huì)在10個(gè)備選詞中挑選。
在提示詞設(shè)計(jì)中的應(yīng)用:
聚焦內(nèi)容生成:當(dāng)需要確保輸出內(nèi)容嚴(yán)格限制在某個(gè)主題范圍內(nèi)時(shí),可以使用較小的k值(如5-20)。
與Top-p的比較:想象一下點(diǎn)餐,Top-k就像一個(gè)固定套餐,永遠(yuǎn)只有k個(gè)菜品可選。而Top-p則像一個(gè)自助餐,它會(huì)提供占總受歡迎度90%的菜品,菜品數(shù)量會(huì)根據(jù)當(dāng)天大家的口味偏好而變化。因此,Top-p通常更智能、更靈活。
在實(shí)際應(yīng)用中,通常會(huì)調(diào)整Temperature和Top-p中的一個(gè),而不是同時(shí)調(diào)整兩者,以避免不可預(yù)測的效果。
對產(chǎn)品和業(yè)務(wù)人員而言,理解這些參數(shù)的含義,意味著你可以在不改動(dòng)提示詞文本的情況下,通過調(diào)整這些參數(shù)來改變AI應(yīng)用的輸出風(fēng)格,以適應(yīng)不同的業(yè)務(wù)場景。