zoomit

آموزش پرامپت نویسی برای تولید عکس با هوش مصنوعی

آموزش پرامپت نویسی برای تولید عکس با هوش مصنوعی

یکی از مهارت‌هایی که افراد باید در حال حاضر آن را فرا بگیرند، کار با هوش مصنوعی است. انواع ابزارهای هوش مصنوعی برای کاربردهای مختلف توسعه یافته‌اند. برای مثال هوش مصنوعی تولید عکس یا ویدئو و هوش مصنوعی طراحی لوگو از این دسته ابزارها هستند.

مانند هر برنامه‌ای مثل فوتوشاپ یا حتی تلگرام و اینستاگرام، ابزارهای مبتنی‌بر هوش مصنوعی نیز بخش‌های زیادی دارند که برای بهره‌مندی از نهایت ظرفیت آن‌ها در بهینه‌ترین حالت ممکن، نیاز به آموزش داریم. این موضوع به‌خصوص برای آموزش پرامپت نویسی برای تولید عکس با هوش مصنوعی صدق می‌کند.

پیش‌تر در مقاله‌ای به اهمیت پرامپت نویسی هوش مصنوعی پرداخته‌ایم و حالا قصد داریم به نکات کلیدی و آموزش پرامپت نویسی برای تولید عکس با هوش مصنوعی ChatGPT در حداکثر کیفیت بپردازیم.

تولید عکس با ChatGPT

تولید عکس با ChatGPT پیش‌تر با DALL-E انجام می‌شد که به‌صورت یکپارچه در چت‌جی‌پی‌تی در دسترس قرار داشت. اوپن‌ای‌آی با انتشار به‌روزرسانی GPT-4o و GPT-4o mini، بالأخره ابزار اختصاصی تولید عکس در ChatGPT را معرفی کرد که در ابتدا فقط برای مشترکین پولی این پلتفرم دردسترس بود و حالا کاربران نسخه‌ی رایگان نیز با محدودیت ۳ عکس در روز، امکان استفاده از آن را دارند.

آموزش تولید عکس با DALL-E

یکی از مهم‌ترین قابلیت‌های ابزار تولید عکس ChatGPT این است که برای تولید عکس‌های چندگانه می‌توان از آن استفاده کرد بدون اینکه نگران تغییر ظاهر سوژه باشید. چت‌جی‌پی‌تی از این قابلیت با عنوان Character Consistency یاد می‌کند.

قابلیت‌های ابزار تولید عکس ChatGPT:

  • افزودن متن در عکس خروجی
  • در نظر داشتن جزئیاتی در دل عکس
  • تولید عکس با پس‌زمینه‌ی شفاف (transparent) مناسب برای ساخت آیکون و واترمارک با هوش مصنوعی
  • ویرایش عکس تولیدشده با ابزار Select
  • تولید چندین عکس از یک سوژه به‌لطف وجود Character Consistency

نکات پرامپت نویسی تولید عکس با ChatGPT

پرامپت‌های هوش مصنوعی در حالت کلی باید شفاف و دارای ساختار باشند. برای پرامپت نویسی تولید عکس با هوش مصنوعی اولین قاعده‌ی اساسی این است که تمرکز و فوکوس روی سوژه‌ی اصلی در عکس قرار بگیرد و در ادامه‌ی آن جزئیات و زمینه‌ی پیرامون آن توصیف شود و سبک هنری مدنظر برای عکس نیز در آن اضافه شود.

برای تولید عکس با چت جی پی تی نیازی به استفاده از عناصر خاص نیست و خیلی ساده باید هر آنچه می‌خواهید، با کلمات توصیف کنید. این هوش مصنوعی با گفتار انسانی آموزش دیده است و نسبت به زمینه‌ی گفت‌وگو آگاهی پیدا می‌کند.

۱. پرامپت باید شفاف و دقیق باشد

هرچه توضیح و توصیف با جزئیات بیشتری باشد، نتیجه‌ی بهتری خواهید گرفت. برای مثال، اگر بگویید صحنه‌ای از غروب خورشید در ساحل را تولید کند که مردم نیز در ساحل حضور دارند، احتمالاً در تصویر خروجی مردم با ایرادهای کوچک و بزرگ فضا را پر کرده‌اند؛ بنابراین باید جزئیات دقیق‌تری از مردم توصیف کنید تا ایرادات به حداقل برسد.

برای توصیف از موارد زیر کمک بگیرید:

  • سوژه اصلی (مثال: منظره‌ی شهری سایبرپانک، a cyberpunk cityscape)
  • سبک (مثال: به سبک استودیو جیبلی، in the style of Studio Ghibli)
  • حس‌وحال و نورپردازی (مثال: بدخلق، شبی دلگیر و مه آلود با چراغ های نئونی، moody, foggy evening with neon lights)
  • زاویه دوربین و نما (مثال: دید پرنده، bird’s eye view یا پرتره کلوزآپ close-up portrait)

This is newslan website (newslan.ir) how would it look like if it were a cat? create a detailed image of it in Silicon Valley among other cats that are created according to Apple, Microsoft and Google.

پرامپت به زبان فارسی:

این وب‌سایت نیوزلن (newslan.ir) است. اگر این وب‌سایت به یک گربه تبدیل می‌شد، چگونه به نظر می‌رسید؟ یک تصویر دقیق از آن بساز که در سیلیکون ولی و در بین گربه‌های دیگری مطابق با طراحی‌های اپل، مایکروسافت و گوگل قرار دارد.

در پرامپت‌نویسی ChatGPT برای تولید عکس باید توجه کنید که هرچه جزئیات صریح‌تر و دقیق‌تر باشند، نتیجه‌ی بهتری کسب می‌کنید.

پرامپت‌های بیش‌ازحد پیچیده و طولانی گاهی هوش مصنوعی را گیج می‌کنند؛ بنابراین تعادل را رعایت کنید و دستورالعمل‌های دقیق و درعین‌حال واضحی بنویسید.

۲. سبک هنری یا نوع رسانه را مشخص کنید.

هوش مصنوعی می‌تواند محتواهای متنوعی را در سبک‌های مختلف تولید کند:

I want a more realistic picture.

من یک تصویر واقعی‌تر لازم دارم.

  • عکس (پرتره، ماکرو، عکس توسط پهپاد)
  • نقاشی (رنگ روغن، آبرنگ، دیجیتال)
  • کامیک، مانگا، رندر ۳ بُعدی، پیکسل
  • سبک (واقع‌گرایانه Realistic، فانتزی Fantasy، انیمه‌ای Anime Style)

کلیدواژه‌های این بخش شامل: digital painting یا low-poly 3D یا charcoal sketch می‌شود.

۳. از صفت‌ها و کلمات ترکیبی استفاده کنید.

برای بیان اجزای مختلف تصویر باید از کلیدواژه‌های مناسبی کمک بگیرید. برای دستیابی به کلیدواژه‌های متناسب، ۳ پرسش زیر را پاسخ دهید:

  • چه اتفاقی رخ می‌دهد یا سوژه در حال انجام چه کاری است؟
  • این اتفاق چگونه رخ می‌دهد؟ (روش و سبک)
  • کجا رخ می‌دهد؟ (موقعیت مکانی و محیط)

برای پاسخ به این پرسش‌ها کلیدواژه‌های زیر مثال‌های خوبی به‌شمار می‌روند:

  • حس‌وحال: نمایشی (dramatic)، رویایی (dreamy)، رمزآلود (mysterious) و پویا و پرجنب‌وجوش (vibrant)
  • موقعیت مکانی سوژه: زیر دریا (underwater)، پساآخرالزمانی (post-apocalyptic)، جنگل فانتزی (fantasy forest)
  • زمان: ساعات طلایی (golden hour)، گرگ‌ومیش (twilight)، نیمه‌شب (midnight)
  • ترکیب‌بندی یا کمپوزیسیون: مرکز تصویر (centered)، قانون یک‌سوم (rule of thirds)، متقارن (symmetrical)

use Persian Cat for newslan.

برای نیوزلن از گربه پرشین استفاده کن

ترکیب‌بندی یا کمپوزیسیون در هنر نقاشی و عکاسی به مهارتی در کادربندی و نوع قرارگیری سوژه در تصویر گفته می‌شود که در نهایت باعث می‌شود تمام عناصر موجود در تصویر به‌گونه‌ای در عکس قرار بگیرند که حس‌وحال خاصی را در بیننده ایجاد کنند. برای مثال، کلوزآپ یا وایدشات از دیگر کلیدواژه‌های آن محسوب می‌شوند.

۴. برای نتایج بهتر پرامپت‌های مختلف را امتحان کنید.

برای تغییر پرامپت می‌توانید چینش و ترتیب جزئیات توصیفی را تغییر دهید یا از واژه‌های مختلفی استفاده کنید. زاویه‌ی دید را تغییر دهید و ابهامات را رفع کنید. برای مثال، وقتی جهتی را توصیف می‌کنید، دقیقاً بگویید: «سمت چپ تصویر باشد یا سمت چپ سوژه‌ی درون تصویر».

۵. از تصاویر دیگر به‌عنوان مرجع کمک بگیرید.

برای فهماندن بهتر منظور خود می‌توانید تصویری را همراه با پرامپت خود برای هوش مصنوعی ارسال کنید.

۶. چندین نسخه از یک عکس را درخواست کنید.

با درخواست مثلاً ۳ نسخه از یک عکس، دست هوش مصنوعی را باز می‌گذارید تا برداشت‌های متفاوت خودش را به‌تصویر بکشد.

۷. کاربرد مدنظرتان از تولید عکس را ذکر کنید.

در صورت تمایل می‌توانید در پرامپت بگویید که از عکس در کجا و به چه منظور استفاده می‌کنید. برای مثال، می‌خواهید بنر وبلاگ یا ایده‌ی مفهومی برای طراحی UI/UX باشد یا برای گنجاندن در متن به آن نیاز دارید یا قرار است به‌عنوان پروفایل مورد استفاده قرار بگیرد.

برای گرفتن نتیجه‌ی بهتر تمام پرامپت‌های بالا را در یک پرامپت گردآوری می‌کنیم که پرامپت نهایی به شکل زیر در خواهد آمد:

Imagine the newslan website (newslan.ir) transformed into a Persian cat. Create a detailed and realistic image of this Persian cat representing newslan, situated in Silicon Valley. Surround this cat with other cats that are designed to reflect the styles of major tech companies like Apple, Microsoft, and Google. Each cat should have characteristics or visual elements that hint at the design philosophies and aesthetics of these companies, making it clear which cat corresponds to which tech giant. The overall scene should feel vibrant, tech-oriented, and realistic, set against the iconic backdrop of Silicon Valley.

تصور کنید وب‌سایت نیوزلن (newslan.ir) به یک گربه پرشین تبدیل شده است. یک تصویر دقیق و واقعی از این گربه پرشین که نماینده نیوزلن باشد، ایجاد کنید و آن را در سیلیکون ولی قرار دهید. این گربه را با دیگر گربه‌هایی احاطه کنید که طراحی آن‌ها به سبک شرکت‌های بزرگ تکنولوژی مانند اپل، مایکروسافت و گوگل باشد. هر گربه باید ویژگی‌ها یا عناصر بصری خاصی داشته باشد که فلسفه طراحی و زیبایی‌شناسی آن شرکت‌ها را نشان دهد تا مشخص شود کدام گربه به کدام غول تکنولوژی تعلق دارد. صحنه کلی باید پویا، مرتبط با تکنولوژی و واقعی باشد و در پس‌زمینه نمادین سیلیکون ولی قرار گیرد.

منبع : زومیت

مشاهده بیشتر
دانلود نرم افزار

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا