Gemma instruction-tuned (IT) মডেলগুলিকে একটি নির্দিষ্ট ফরম্যাটার দিয়ে প্রশিক্ষিত করা হয় যা প্রশিক্ষণ এবং অনুমান উভয় সময়ে অতিরিক্ত তথ্য সহ সমস্ত নির্দেশ টিউনিং উদাহরণ টীকা করে। ফরম্যাটারটির দুটি উদ্দেশ্য রয়েছে:
- একটি কথোপকথনে ভূমিকা নির্দেশ করে, যেমন সিস্টেম , ব্যবহারকারী বা সহকারী ভূমিকা।
- কথোপকথনে মোড় বর্ণনা করা, বিশেষ করে বহু-পালা কথোপকথনে।
নীচে, আমরা জেমা দ্বারা ব্যবহৃত নিয়ন্ত্রণ টোকেন এবং তাদের ব্যবহারের ক্ষেত্রে উল্লেখ করি। নোট করুন যে কন্ট্রোল টোকেনগুলি আমাদের টোকেনাইজারের মধ্যে সংরক্ষিত এবং নির্দিষ্ট।
- ব্যবহারকারীর পালা নির্দেশ করতে টোকেন:
user - একটি মডেল টার্ন নির্দেশ করতে টোকেন:
model - সংলাপের মোড়ের শুরু নির্দেশ করার জন্য টোকেন:
<start_of_turn> - সংলাপের মোড়ের শেষ নির্দেশ করার জন্য টোকেন:
<end_of_turn>
এখানে একটি উদাহরণ সংলাপ:
<start_of_turn>user
knock knock<end_of_turn>
<start_of_turn>model
who is there<end_of_turn>
<start_of_turn>user
Gemma<end_of_turn>
<start_of_turn>model
Gemma who?<end_of_turn>
টোকেন "<end_of_turn>\n" হল টার্ন বিভাজক, এবং প্রম্পট উপসর্গ হল "<start_of_turn>model\n" । এর মানে হল যে আপনি যদি মডেলটিকে একটি প্রশ্ন সহ প্রম্পট করতে চান, "ক্র্যামারের নিয়ম কী?", তাহলে আপনাকে পরিবর্তে মডেলটিকে নিম্নরূপ খাওয়াতে হবে:
"<start_of_turn>user
What is Cramer's Rule?<end_of_turn>
<start_of_turn>model"
মনে রাখবেন যে আপনি যদি আপনার নিজের ডেটার সাথে পূর্বপ্রশিক্ষিত জেমা মডেলগুলিকে সূক্ষ্মভাবে তৈরি করতে চান তবে আপনি নিয়ন্ত্রণ টোকেনের জন্য এই জাতীয় যে কোনও স্কিমা ব্যবহার করতে পারেন, যত��্ষণ না এটি আপনার প্রশিক্ষণ এবং অনুমান ব্যবহারের ক্ষেত্রে সামঞ্জস্যপূর্ণ।
সিস্টেম নির্দেশাবলী
জেমার নির্দেশ-সুরিত মডেলগুলি শুধুমাত্র দুটি ভূমিকার সাথে কাজ করার জন্য ডিজাইন করা হয়েছে: user এবং model । অতএব, system ভূমিকা বা একটি সিস্টেম টার্ন সমর্থিত নয়।
একটি পৃথক সিস্টেম ভূমিকা ব্যবহার করার পরিবর্তে, প্রাথমিক ব্যবহারকারী প্রম্পটের মধ্যে সরাসরি সিস্টেম-স্তরের নির্দেশাবলী প্রদান করুন। মডেল নির্দেশাবলীর নিম্নলিখিত ক্ষমতাগুলি জেমাকে নির্দেশাবলী কার্যকরভাবে ব্যাখ্যা করতে দেয়। যেমন:
<start_of_turn>user
Only reply like a pirate.
What is the answer to life the universe and everything?<end_of_turn>
<start_of_turn>model
Arrr, 'tis 42,<end_of_turn>