Chain of Thought Prompting: ये सिंपल ट्रिक जो AI को 10x बेहतर reasoning देता है

मैं तुम्हें कुछ बताना चाहता हूँ जो मुझे पहली बार सीखने पर surprise दिया।

तुम AI को significantly smarter बना सकते हो reasoning में—बेहतर model use करके नहीं, ज्यादा पैसा खर्च करके नहीं, बस अपने prompt में पाँच शब्द add करके।

वे पाँच शब्द? “आइये इसे step by step सोचते हैं।”

इस technique को Chain of Thought Prompting कहते हैं, और यह सबसे मस्त चीजों में से एक है जो मैंने AI के साथ काम करने के बारे में सीखा है।

समस्या: AI तुरंत answers की तरफ दौड़ता है

Default में, AI question से सीधे answer पर jump करने की कोशिश करता है। इसे math problem दो, यह एक नंबर निकालता है। Analysis माँगो, तो conclusion देता है।

कभी-कभी यह ठीक है। लेकिन जो भी चीज़ real reasoning चाहती है—logic puzzles, multi-step math, complex analysis, debugging—यह shortcut errors की तरफ ले जाता है।

AI जानता है कि उसे अपना काम दिखाना चाहिए। वह बस… नहीं करता। जब तक तुम पूछो।

Chain of Thought क्या करता है

Chain of Thought (CoT) Prompting AI से अपनी reasoning process को answer देने से पहले दिखाने के लिए कहता है।

इसकी जगह:

Question → Answer

तुम्हें यह मिलता है:

Question → Step 1 → Step 2 → Step 3 → Answer

यह simple change बहुत बड़े effects लाता है।

जब AI को हर step को बोलना पड़े, तो वह अपनी ही गलतियाँ catch कर लेता है। वह ऐसे factors को consider करता है जिन्हें वरना skip कर देता। वह guessing करने की जगह answers की तरफ build करता है।

Google Brain के researchers ने 2022 में इस पर एक landmark paper publish किया। उन्होंने पाया कि CoT prompting ने arithmetic, commonsense reasoning और symbolic logic tasks पर performance को dramatically improve किया—बिना extra training के।

Same AI. Same knowledge. Much better results. सब कुछ सिर्फ इसलिए क्योंकि हमने उसे अपना sochne दिया।

सबसे simple version: Zero-Shot CoT

Chain of Thought use करने का सबसे आसान तरीका embarrassingly simple है।

बस अपने prompt में “आइये इसे step by step सोचते हैं” add कर दो।

CoT के बिना:

एक bat और एक ball को मिलाकर 1.10$ है। Bat, ball से 1$ ज्यादा है। Ball की कीमत क्या है?

AI अक्सर blurt करता है “$0.10”—जो गलत है।

CoT के साथ:

एक bat और एक ball को मिलाकर 1.10$ है। Bat, ball से 1$ ज्यादा है। Ball की कीमत क्या है? आइये इसे step by step सोचते हैं।

अब AI reason करेगा:

Ball की कीमत को “x” मानते हैं
Bat, 1$ ज्यादा है, तो bat है “x + $1”
दोनों मिलकर $1.10 हैं, तो: x + (x + 1) = 1.10
मतलब 2x + 1 = 1.10
तो 2x = 0.10
इसलिए x = $0.05

Ball की कीमत $0.05 है (और bat की कीमत $1.05 है)।

Same question. इस बार सही answer। सब कुछ क्योंकि हमने AI से अपना काम दिखाने के लिए कहा।

Few-Shot CoT: पहले examples दिखाओ

और भी बेहतर results के लिए, AI को अपना question पूछने से पहले एक example दिखाओ कि तुम्हें कैसी reasoning चाहती है।

इसे “few-shot” CoT कहते हैं—तुम एक या multiple worked examples देते हो, फिर अपना actual question पूछते हो।

Example prompt:

Q: Roger के पास 5 tennis balls हैं। वह 2 और cans tennis balls खरीदता है।
हर can में 3 tennis balls हैं। अब उसके पास कितनी tennis balls हैं?

A: आइये इसे step by step करते हैं।
- Roger के पास शुरुआत में 5 tennis balls हैं
- वह 2 cans खरीदता है, हर can में 3 balls हैं
- तो 2 × 3 = 6 नई balls
- Total: 5 + 6 = 11 tennis balls

Q: Cafeteria के पास 23 apples थीं। उन्होंने 20 lunch बनाने के लिए use कीं और
6 और खरीदीं। अब उनके पास कितनी apples हैं?

A:

AI अब नए question के लिए भी same step-by-step format follow करेगा।

Few-shot CoT को set up करने में ज्यादा effort लगता है, पर यह ज्यादा reliable है—खास करके complex या unusual problems के लिए जहाँ “step by step सोचते हैं” सही approach trigger न करे।

कब Chain of Thought सबसे अच्छा काम करता है

CoT सब चीज़ों के लिए magic wand नहीं है। यहाँ यह सच में shines:

Math और Logic

कोई भी चीज़ जिसके multiple steps हों। Word problems, calculations, logical deductions।

Try करो: “Compound interest को calculate करो $10,000 पर 5% के हिसाब से 3 साल में। हर साल को step by step सोच।”

Code Debugging

Code के गलत होने को समझने के लिए execution को trace करना पड़ता है।

Try करो: “मेरा code यह है [code paste करो]। गलत output दे रहा है। Step by step बताओ कि क्या होता है जब मैं यह function call करूँ।”

Analysis और Decision-Making

Complex decisions के multiple factors होते हैं। CoT उन्हें systematically weigh करने में मदद करता है।

Try करो: “मैं इन तीनों job offers में से choose कर रहा हूँ [details]। हर एक के pros और cons को step by step सोच, फिर सुझाव दे।”

Reading Comprehension

Long documents में implicit information होती है जिसे सावधानी से समझना पड़े।

Try करो: “इस contract के basis पर [text paste करो], decide करो कि अगर delivery late हो तो कौन responsible है। Relevant clauses को step by step check करो।”

कब CoT को skip करें

हर चीज़ step-by-step thinking से benefit नहीं करती:

Simple factual questions: “फ्रांस की capital कौन सी है?” को reasoning नहीं चाहिए।
Creative writing: Stories और content को logical steps से ज्यादा examples और tone guidance से help मिलता है।
Quick tasks: अगर तुम्हें बस एक list या simple rewrite चाहिए, तो CoT unnecessary length add करता है।
Smaller models: CoT capable models के साथ best काम करता है। छोटे AI models incoherent reasoning chains दे सकते हैं।

CoT को reasoning चाहने वाली problems के लिए use करो। बाकी सब के लिए skip कर दो।

पाँच Ready-to-Use CoT Prompts

सीधे copy कर लो:

1. Math Word Problem

[तुम्हारी problem यहाँ]

इसे step by step solve करो। हर calculation के लिए अपना काम दिखाओ
final answer देने से पहले।

2. Debugging Help

मेरा code यह है:
[code paste करो]

यह error है:
[error paste करो]

Code क्या करता है यह step by step बताओ, पहचानो कहाँ गलत है,
फिर fix explain करो।

3. Decision Analysis

मुझे इन दोनों में decide करना है: [option A] और [option B]

Context: [तुम्हारी situation]

इसे step by step analyze करो:
1. हर option के pros और cons list करो
2. मेरी specific situation को consider करो
3. Key tradeoffs पहचानो
4. Reasoning के साथ recommendation दो

4. Document Analysis

इस document के basis पर:
[document paste करो]

इस question का answer दो: [तुम्हारा question]

Relevant sections को step by step काम करो
अपना final answer देने से पहले। Specific passages quote करो जो
तुम्हारे conclusion को support करें।

5. Complex Explanation

[Complex topic] को उस किसी को explain करो जो [उनकी background] समझता है।

इसे step by step break करो:
1. जो वे पहले से जानते हैं उससे शुरु करो
2. नई concept की तरफ build करो
3. जहाँ helpful हो analogies use करो
4. समाप्त करो यह बताते हुए कि सब कुछ कैसे connect होता है

Advanced: Self-Consistency

High-stakes problems के लिए, एक और sophisticated technique है: self-consistency।

एक reasoning chain generate करने की जगह, तुम AI से problem को कई बार (कुछ randomness के साथ) solve करने के लिए कहते हो, फिर most common answer लेते हो।

यह ऐसे है जैसे पाँच experts को एक problem पर independently काम करने के लिए कहना। अगर चारों एक ही conclusion पर पहुँचें, तो वह शायद सही है।

यह manually करना harder है पर critical decisions के लिए जानने लायक है।

Takeaway

Chain of Thought Prompting उन rare techniques में से एक है जो simple भी है और powerful भी।

Reasoning tasks के लिए—math, logic, debugging, analysis—यह अक्सर गलत और सही answers में फर्क लाता है। और सब कुछ सिर्फ तुम्हारे prompt में कुछ extra words से होता है।

अगली बार जब तुम AI की reasoning से frustrated हो, तो ये magic words try करो:

“आइये इसे step by step सोचते हैं।”

तुम्हें surprise होगा कि क्या होता है।